Корпуса даргинских языков и диалектов

Тексты в корпусах представлены в кириллической записи, основанной на письменности даргинского литературного языка, и в транскрипции, принятой в исследованиях нахско-дагестанских языков. Глоссирование текстов выполнено на основе транскрипции.

Корпуса устных текстов – важная составляющая документации языка. Поскольку большинство малых языков и диалектов существует в устной форме, для них, как правило, нет никаких зафиксированных текстов. В то же время получить надежное представление о структуре языка без текстов практически невозможно. Решить эту проблему можно, собрав коллекции рассказов и диалогов носителей языка. Рассказы и диалоги сначала записываются на диктофон, впоследствии их надо расшифровать, перевести, проанализировать и перевести в формат корпуса с различными возможностями поиска.

Внашей коллекции пока четыре сравнительно небольших корпуса устных текстов.

Устный корпус муиринского языка

Устный корпус кадарского диалекта

Устный корпус тантынского диалекта

Устный корпус ицаринского диалекта

Устный корпус муиринского языка

По классификации Ю. Б. Корякова, муиринский язык (муйринский, уркарахский; самоназвание: муира [muira]) относится к северно-центрально-даргинской группе даргинских языков. На нем говорят в нескольких селениях Дахадаевского и Кайтагского районов Республики Дагестан.

Описаний грамматики муиринского языка пока нет. В «Диалектологическом словаре даргинского языка» С. М. Темирбулатовой есть некоторые материалы по лексике языка. Более полные данные по лексике говора с. Калкни представлены в нашей лексикографической базе даргинских языков. Ведется работа над грамматическим описанием муиринского языка.

Особенности фонологической системы

Фонологическая система муиринского языка отличается от системы литературного даргинского только наличием геминированных согласных, которые передаются в кириллице при помощи удвоения соответствующих графем (кк, шш, хьхь и т. д.). На стыке двух фонем /r/ звучит ретрофлексный звук [ʈ], который мы не отражаем на письме, так как он не представляет собой самостоятельную фонему.

О корпусе

Устные тексты собраны в 2018—2021 гг. в селении Калкни Дахадаевского района Республики Дагестан (участниками экспедиций в разные годы были: Олег Валиулин, Софья Гайдученко, Маргарита Иванова, Иван Калякин, Виктория Позднякова, Диана Пчелинцева, Александр Ряпосов, Елена Сокур, Нина Романовна Сумбатова (руководитель), Софья Ярошевич). Сбор текстов и работа над ними продолжается, корпус будет пополняться.

Над переводом, аннотированием и глоссированием текстов работали: Н. Р.  Сумбатова, М. А. Абдуллаева, И. В. Калякин, Д. Р. Пчелинцева. В сборе текстов участвовал Р. О. Муталов. Перевела в корпусный формат Е. О. Сокур.

Устный корпус кадарского диалекта

По классификации Ю. Б. Корякова, кадарский идиом представляет собой диалект (наречие) северно-центрально-даргинского языка, однако грамматически кадарский заметно отличается от других севернодаргинских идиомов, включая акушинский, возможно, из-за влияния кумыкского языка. На кадарском идиоме говорят в нескольких селениях Буйнакского района Республики Дагестан.

Особенности фонологической системы

Фонологическая система кадарского языка не отличается от системы литературного даргинского, поэтому использование даргинской кириллической письменности не вызывает существенных затруднений. Ретрофлексный звук [ʈ], который звучит на стыке двух фонем /r/, мы не отражаем на письме, так как он не представляет собой самостоятельную фонему.

О корпусе

Тексты корпуса собраны в 2020—2022 гг. Н. А. Вагизиевой. Над переводом, аннотированием и глоссированием текстов работала Н. А. Вагизиева при помощи Н. Р. Сумбатовой. В корпусный формат тексты перевела Е. О. Сокур.

Устный корпус тантынского диалекта

По классификации Ю. Б. Корякова, тантынский считается одним из диалектов юго-западно-даргинского языка. Изначально он использовался только в селении Танты, но сейчас большинство тантынцев живут в различных городах и селениях Дагестана (в частности, в Махачкале и Избербаше), а также в Ставропольском крае.

В 2013 году в селении Танты числилось 830 человек. Общее число говорящих на диалекте предположительно 1500–2000 человек.

Тантынский диалект сравнительно хорошо изучен. Для него существует объемная монография Н. Р. Сумбатовой и Ю. А. Ландера, а также ряд статей, затрагивающих разные грамматические проблемы. Лексические данные по тантынскому идиому представлены в вышеупомянутой грамматике, в словаре Б. Комри и М. Ш. Халилова и в нашей лексикографической базе.

Особенности фонологической системы

Фонологическая система тантынского диалекта включает большое число фонем, отсутствующих в даргинском литературном языке. Геминированные согласные передаются в кириллице при помощи удвоения соответствующих графем (кк, шш, хьхь и т. д.). Лабиализация согласных передается при помощи буквы в.

В тантынском имеется звонкий фрикативный фарингальный согласный, который характерен лишь для небольшого числа даргинских идиомов (кроме тантынского, он зафиксирован, например, в диалекте селения Худуц). Этот согласный в транскрипции передается знаком ʕ, в кириллической записи мы обозначили его двумя буквами г (гг).

Кроме того, в тантынском представлены три фарингализованные гласные — , , . Фарингализованный обозначается буквой я, как это принято в даргинской орфографии, фарингализация звуков и обозначается «палочкой» после соответствующей буквы (уI, еI или у1, е1).

О корпусе

Устные тексты корпуса в основном собраны в 2008—2013 гг. Ю. А. Ландером и Н. Р. Сумбатовой в селении Танты Акушинского района Дагестана. Часть этих текстов (с глоссами) опубликована в грамматике Н. Р. Сумбатовой и Ю. А. Ландера. Некоторые тексты были записаны позже.

Аннотирование и глоссирование текстов для корпуса выполнила М. А. Грибова, при помощи Н. Р. Сумбатовой и Г. Р. Сулайбанова. Преобразовала в корпусный формат Е. О. Сокур.

Устный корпус ицаринского диалекта

По классификации Ю. Б. Корякова, ицаринский представляет собой один из диалектов юго-западно-даргинского языка. Традиционно на нём говорили в селении Ицари Дахадаевского района Республики Дагестан.

В настоящее время селение практически опустело. Жители селения Ицари расселились по городам и селениям республики; заметная доля ицаринцев проживает в селении Иван-кутан Дербентского района, в поселке Дружба Каякентского района, в селениях Косякино, Первомайское, Михеевка, Бондареновское Кизлярского района.

Ицаринский диалект сравнительно хорошо изучен. Ему посвящена грамматика Н. Р. Сумбатовой и Р. О. Муталова, кандидатская диссертация Р. О. Муталова и ряд статей по грамматике. Лексика ицаринского диалекта представлена в лексикографической базе данных.

Представление данных в корпусе

Фонологическая система ицаринского диалекта типична для южных даргинских языков. Она включает большое число фонем, отсутствующих в даргинском литературном языке. Геминированные согласные передаются в кириллице при помощи удвоения соответствующих графем (кк, шш, хьхь и т. д.). Лабиализация согласных передается при помощи буквы в.  Кроме того, в ицаринском представлены три фарингализованные гласные — , , . Фарингализованный обозначается буквой я, как это принято в даргинской орфографии, фарингализация звуков и обозначается «палочкой» после соответствующей буквы (уI, еI или у1, е1).

О корпусе

Большая часть устных текстов, вошедших в корпус, собраны в разные годы лингвистом и носителем ицаринского диалекта Р. О. Муталовым. Часть текстов собрана группой исследователей в 2007 гг. (Н. Р. Сумбатова, Д. С. Ганенков, Н. В. Сердобольская, В. Г. Хуршудян).

Аннотирование и глоссирование текстов для корпуса выполнил И. В. Калякин. Помощь в переводе оказывали Р. О. Муталов и А. Муталова. В корпусный формат тексты перевела Е. О. Сокур.

В корпус вошла меньшая часть собранных текстов. Работа над ними продолжается.