Тексты в корпусах представлены в кириллической записи, основанной на письменности даргинского литературного языка, и в транскрипции, принятой в исследованиях нахско-дагестанских языков. Глоссирование текстов выполнено на основе транскрипции.
Корпуса устных текстов – важная составляющая документации языка. Поскольку большинство малых языков и диалектов существует в устной форме, для них, как правило, нет никаких зафиксированных текстов. В то же время получить надежное представление о структуре языка без текстов практически невозможно. Решить эту проблему можно, собрав коллекции рассказов и диалогов носителей языка. Рассказы и диалоги сначала записываются на диктофон, впоследствии их надо расшифровать, перевести, проанализировать и перевести в формат корпуса с различными возможностями поиска.
Внашей коллекции пока четыре сравнительно небольших корпуса устных текстов.
Устный корпус муиринского языка
Устный корпус кадарского диалекта
По классификации Ю. Б. Корякова, муиринский язык (муйринский, уркарахский; самоназвание: муира [muira]) относится к северно-центрально-даргинской группе даргинских языков. На нем говорят в нескольких селениях Дахадаевского и Кайтагского районов Республики Дагестан.
Описаний грамматики муиринского языка пока нет. В «Диалектологическом словаре даргинского языка» С. М. Темирбулатовой есть некоторые материалы по лексике языка. Более полные данные по лексике говора с. Калкни представлены в нашей лексикографической базе даргинских языков. Ведется работа над грамматическим описанием муиринского языка.
Фонологическая система муиринского языка отличается от системы литературного даргинского только наличием геминированных согласных, которые передаются в кириллице при помощи удвоения соответствующих графем (кк, шш, хьхь и т. д.). На стыке двух фонем /r/ звучит ретрофлексный звук [ʈ], который мы не отражаем на письме, так как он не представляет собой самостоятельную фонему.
Устные тексты собраны в 2018—2021 гг. в селении Калкни Дахадаевского района Республики Дагестан (участниками экспедиций в разные годы были: Олег Валиулин, Софья Гайдученко, Маргарита Иванова, Иван Калякин, Виктория Позднякова, Диана Пчелинцева, Александр Ряпосов, Елена Сокур, Нина Романовна Сумбатова (руководитель), Софья Ярошевич). Сбор текстов и работа над ними продолжается, корпус будет пополняться.
Над переводом, аннотированием и глоссированием текстов работали: Н. Р. Сумбатова, М. А. Абдуллаева, И. В. Калякин, Д. Р. Пчелинцева. В сборе текстов участвовал Р. О. Муталов. Перевела в корпусный формат Е. О. Сокур.
По классификации Ю. Б. Корякова, кадарский идиом представляет собой диалект (наречие) северно-центрально-даргинского языка, однако грамматически кадарский заметно отличается от других севернодаргинских идиомов, включая акушинский, возможно, из-за влияния кумыкского языка. На кадарском идиоме говорят в нескольких селениях Буйнакского района Республики Дагестан.
Фонологическая система кадарского языка не отличается от системы литературного даргинского, поэтому использование даргинской кириллической письменности не вызывает существенных затруднений. Ретрофлексный звук [ʈ], который звучит на стыке двух фонем /r/, мы не отражаем на письме, так как он не представляет собой самостоятельную фонему.
Тексты корпуса собраны в 2020—2022 гг. Н. А. Вагизиевой. Над переводом, аннотированием и глоссированием текстов работала Н. А. Вагизиева при помощи Н. Р. Сумбатовой. В корпусный формат тексты перевела Е. О. Сокур.
По классификации Ю. Б. Корякова, тантынский считается одним из диалектов юго-западно-даргинского языка. Изначально он использовался только в селении Танты, но сейчас большинство тантынцев живут в различных городах и селениях Дагестана (в частности, в Махачкале и Избербаше), а также в Ставропольском крае.
В 2013 году в селении Танты числилось 830 человек. Общее число говорящих на диалекте предположительно 1500–2000 человек.
Тантынский диалект сравнительно хорошо изучен. Для него существует объемная монография Н. Р. Сумбатовой и Ю. А. Ландера, а также ряд статей, затрагивающих разные грамматические проблемы. Лексические данные по тантынскому идиому представлены в вышеупомянутой грамматике, в словаре Б. Комри и М. Ш. Халилова и в нашей лексикографической базе.
Фонологическая система тантынского диалекта включает большое число фонем, отсутствующих в даргинском литературном языке. Геминированные согласные передаются в кириллице при помощи удвоения соответствующих графем (кк, шш, хьхь и т. д.). Лабиализация согласных передается при помощи буквы в.
В тантынском имеется звонкий фрикативный фарингальный согласный, который характерен лишь для небольшого числа даргинских идиомов (кроме тантынского, он зафиксирован, например, в диалекте селения Худуц). Этот согласный в транскрипции передается знаком ʕ, в кириллической записи мы обозначили его двумя буквами г (гг).
Кроме того, в тантынском представлены три фарингализованные гласные — aˤ, uˤ, eˤ. Фарингализованный aˤ обозначается буквой я, как это принято в даргинской орфографии, фарингализация звуков uˤ и eˤ обозначается «палочкой» после соответствующей буквы (уI, еI или у1, е1).
Устные тексты корпуса в основном собраны в 2008—2013 гг. Ю. А. Ландером и Н. Р. Сумбатовой в селении Танты Акушинского района Дагестана. Часть этих текстов (с глоссами) опубликована в грамматике Н. Р. Сумбатовой и Ю. А. Ландера. Некоторые тексты были записаны позже.
Аннотирование и глоссирование текстов для корпуса выполнила М. А. Грибова, при помощи Н. Р. Сумбатовой и Г. Р. Сулайбанова. Преобразовала в корпусный формат Е. О. Сокур.
По классификации Ю. Б. Корякова, ицаринский представляет собой один из диалектов юго-западно-даргинского языка. Традиционно на нём говорили в селении Ицари Дахадаевского района Республики Дагестан.
В настоящее время селение практически опустело. Жители селения Ицари расселились по городам и селениям республики; заметная доля ицаринцев проживает в селении Иван-кутан Дербентского района, в поселке Дружба Каякентского района, в селениях Косякино, Первомайское, Михеевка, Бондареновское Кизлярского района.
Ицаринский диалект сравнительно хорошо изучен. Ему посвящена грамматика Н. Р. Сумбатовой и Р. О. Муталова, кандидатская диссертация Р. О. Муталова и ряд статей по грамматике. Лексика ицаринского диалекта представлена в лексикографической базе данных.
Фонологическая система ицаринского диалекта типична для южных даргинских языков. Она включает большое число фонем, отсутствующих в даргинском литературном языке. Геминированные согласные передаются в кириллице при помощи удвоения соответствующих графем (кк, шш, хьхь и т. д.). Лабиализация согласных передается при помощи буквы в. Кроме того, в ицаринском представлены три фарингализованные гласные — aˤ, uˤ, eˤ. Фарингализованный aˤ обозначается буквой я, как это принято в даргинской орфографии, фарингализация звуков uˤ и eˤ обозначается «палочкой» после соответствующей буквы (уI, еI или у1, е1).
Большая часть устных текстов, вошедших в корпус, собраны в разные годы лингвистом и носителем ицаринского диалекта Р. О. Муталовым. Часть текстов собрана группой исследователей в 2007 гг. (Н. Р. Сумбатова, Д. С. Ганенков, Н. В. Сердобольская, В. Г. Хуршудян).
Аннотирование и глоссирование текстов для корпуса выполнил И. В. Калякин. Помощь в переводе оказывали Р. О. Муталов и А. Муталова. В корпусный формат тексты перевела Е. О. Сокур.
В корпус вошла меньшая часть собранных текстов. Работа над ними продолжается.