Направления научных исследований
Текущие проекты
Типологический атлас языков Дагестана
Целью данного проекта было создание инструмента визуализации данных о характерных для Дагестана языковых структурах, руководствуясь существующими описаниями. Все готовые на данный момент датасеты и главы, посвященные конкретным темам, доступны и могут быть загружены на сайте проекта. Над сбором данных по новым темам каждый год в рамках мастерской и учебной практики работают студенты Школы лингвистики, а также сотрудники Лаборатории языковой конвергенции.
Согласно концепции атласа, на картах каждый язык визуализирован в виде множества точек, обозначающих аулы, в которых говорят на данном языке. Такой подход позволяет получить более точное представление о размере и распределении соответствующих языковых сообществ, что в свою очередь важно для формулировки гипотез о контактных явлениях. Данные, собранные в рамках проекта, могут быть использованы для библиографических исследований по различным лингвистическим темам, для изучения определенного идиома или распределения языковых признаков. Проект также упрощает доступ к данным о языковом разнообразии региона и позволяет широкому кругу пользователей получить к ним доступ.
Основные участники: К. Наккарато, Г. А. Мороз, К. В. Филатов, Е. Е. Шведова
Корпусное исследование вариативности билингвального и диалектного вариантов русского языка
Сотрудниками Лаборатории лингвистической конвергенции собрана большая коллекция разговорных корпусов, включающая билингвальные и диалектные варианты русского языка из разных регионов России. На основе данных таких корпусов мы исследуем нестандартные грамматические явления. Особое внимание уделяется речи билингвов. Некоторые из аспектов исследования включают опущение предлогов, нестандартное маркирование падежа в конструкциях с числительными и функции причастий и деепричастий. После ручной аннотации корпусных данных мы применяем статистические методы для проверки лингвистических и социолингвистических гипотез о причинах наблюдаемой вариативности.
Участники: Г. А. Мороз, К. Наккарато, А. В. Яковлева, С. С. Земичева, Н. А. Кошелюк, М. В. Ермолова, А. Ю. Гришнова, А. В. Панова
Создание лексической базы данных андийских языков
Для каждого андийского языка сейчас существуют словари. В ходе проекта планируется создание обобщающей базы данных, в которой все словарные данные по андийским языкам находились бы вместе, были затранскрибированы и разделены на отдельные значения. Создание единого индекса для значений всех андийских языков позволит провести ряд исследований в области сегментной и супрасегментной фонологии, а также исследовать колексификации (ср. с базами данныхhttps://clics.clld.org, concepticon.clld.org). Этот проект наследует концепции проектов Intercontinental Dictionary Series (Key, Comrie, (eds.) 2015., https://ids.clld.org/) и LexCauc (Forker, Belyaev 2020,https://lexcauc.github.io/), однако сосредотачивается на значительно большем охвате лексики. На материале собранных данных уже написано несколько курсовых.
Участники: Г. А. Мороз, А. В. Анцупова, В. Д. Зубкова
Создание устных корпусов нестандартных вариантов русского языка и других языков
В лаборатории создаются устные корпуса диалектов и региональных вариантов русского языка и других языков. Корпуса содержат аудиофайлы и их расшифровки, сделанные в стандартизованной орфографии. Поисковая система позволяет прослушивать фрагменты текстов, содержащие искомое слово или сочетание слов. Для многих корпусов доступны полные тексты. Все корпуса находятся в открытом доступе.
Документация абазинского языка
Проект продолжает работу научно-учебной группы «Аспекты грамматики абазинского языка» и фокусируется на документации абазинской грамматики и анализе абазинских текстов. В рамках проекта уже создан Абазинский устный корпус, а также разрабатываются разнообразные грамматические темы, преимущественно связанные с полисинтетизмом.
Участники: Ю. А. Ландер, К. О. Дунаева
Исследование диалектов рутульского языка
Рутульский язык относится к лезгинской группе нахско-дагестанской языковой семьи и распространён главным образом в сёлах Рутульского района на юге Республики Дагестан. Это один из малых и недостаточно описанных языков России. Как и многие другие языки нахско-дагестанской семьи, рутульский обладает разветвлённой диалектной системой; в основу литературного варианта, складывающегося с 1990-х годов, положен мухадский диалект. Сотрудники лаборатории занимаются изучением диалектов рутульского языка начиная с 2010-х годов. Эта деятельность представлена двумя основными направлениями. Во-первых, на протяжении нескольких лет происходит документация одноаульного кининского диалекта (с. Кина Рутульского района), согласно традиционной диалектной классификации занимающего «промежуточное» положение. В рамках этого направления записывается корпус устных текстов, собирается словарь, разрабатываются грамматические темы и подготавливается к печати коллективный сборник исследований по кининскому диалекту. Во-вторых, в 2022 году было предпринято масштабное обследование рутульских говоров, охватившее подавляющее большинство рутулоязычных населённых пунктов (12 селений, включая с. Хнов Ахтынского района, в котором представлен наиболее дивергентный диалект). В рамках этого направления проводится изучение диалектного варьирования (в области лексики, фонетики, морфологии и синтаксиса) на основе составленной участниками проекта анкеты. Разрабатывается онлайновый ресурс – Атлас рутульских диалектов, в котором диалектные различия будут визуализированы в виде лингвистических карт, а также представлены собранные данные.
Участники: А. П. Алексеева, А. Д. Иванова, Т. А. Майсак, М. Г. Меленченко, Г. А. Мороз, П. Л. Наследскова, И. Д. Садаков, К. В. Филатов
База глагольных колексификаций
Для анализа глагольных колексификаций разработана особая база данных (http://lexicology.pamiri.online/), в которой глагольные значения размечаются по нескольким семантическим параметрам: указываются таксономические и топологические характеристики обязательных и периферийных участников, расписывается структура обозначаемого глаголом события. Предполагается, что такая разметка материала нескольких словарей позволит выявить природу глагольных колексификаций и уточнить имеющиеся классификации типов семантических переходов. База заполняется на основе материала Базы андийских словарей. Для тех семантических областей, для которых уже проведены лексико-типологические исследования, вносятся материалы и ряда других языков, в т.ч. европейских.
Участники: Дарья Рыжова, Юрий Макаров, Лея Финкельберг (совместно с Дарьей Чистяковой, Полиной Леоновой, Валерией Марининой, Марией Суворовой)
Мультиязычный Прагматикон
Мультиязычный Прагматикон - база данных дискурсивных формул, т.е. некомпозициональных выражений, которые выступают в качестве ответных реплик в диалоге и отражают отношение говорящего к содержанию предыдущего высказывания (ср. Ещё бы! Скажешь тоже!). В базе формулы размечаются с точки зрения того, какие прагматические значения они выражают, на какие типы речевых актов реагируют, из каких конструкций получаются. В базу уже внесено порядка 2500 формул из 10 языков, в настоящее время идет работа над материалами английского, японского, персидского, немецкого. Разрабатывается методика сбора такого рода данных в полевых условиях.
Участники: Александра Мартыненкова, Полина Падалка, Дарья Рыжова; совместно с Полиной Бычковой (Университет Любляны)
Документация христианских северо-восточных новоарамейских идиомов
Документация христианских северо-восточных новоарамейских идиомов включает в себя несколько различных проектов, объединенных общей целью – описание языковой ситуации и языка современных ассирийцев. Современные ассирийцы — христиане различных церквей Ближнего Востока, происходящие из региона Северной Месопотамии и говорящие на северо-восточных новоарамейских языках (NENA). Во-первых, участники проекта занимаются полевым описанием грамматики, лексики и социолингвистики (продолжаются экспедиции в ассирийские села Армении, а также в село Урмия в России). Во-вторых, в рамках проекта был переведен в электронный вид и модифицирован для удобства поиска словарь [Khan 2016], который теперь доступен онлайн по ссылке. Наконец, в настоящее время ведется работа над созданием корпуса ассирийского русского, который пополнит коллекцию корпусов лаборатории русского языка как L2.
Участники: Т. Д. Балаханов, Е. А. Забелина, Ю. Б. Коряков, А. А. Русских, Е. Е. Шведова
Прошлые проекты
Обработка и анализ данных Атласа многоязычия Дагестана
Исследование нацелено на выявление различных социальных и географических особенностей многоязычия горного Дагестана с применением статистического анализа. Материалом проекта являются данные, собранные для Атласа многоязычия Дагестана. Таблицы в формате Excel содержат информацию о языковом репертуаре нескольких тысяч людей из 57 дагестанских аулов. База данных опубликована онлайн.
Исследованы особенности распределения многоязычия среди мужчин и женщин, динамика усвоения русского языка в 20-м веке, функционирование аварского языка как лингва франка. Проведено статистическое обоснование валидности данных, полученных в ходе сбора данных непрямым опросом (люди описывают языковой репертуар своих покойных или отсутствующих родственников).
Участники: Н.Р. Добрушина, М.А. Даниэль, Г.А. Мороз, И.В. Щуров
Публикации:
Dobrushina N., Kultepina O. The rise of a lingua franca: The case of Russian in Dagestan // International Journal of Bilingualism . 2020, /doi/10.1177/1367006920959717
Dobrushina N., Daniel M., Koryakov Y. Atlas of multilingualism in Daghestan: A case study in diachronic sociolinguistics // Languages of the Caucasus . 2020. Vol. 4. P. 1-37
Dobrushina N., Kozhukhar A. A., Moroz G. Gendered multilingualism in highland Daghestan: story of a loss // Journal of Multilingual and Multicultural Development . 2019. Vol. 40. No. 2. P. 115-132.
Добрушина Н. Р., Закирова А. Н. Аварский язык как лингва франка: исследование в каратинской зоне // Томский журнал лингвистических и антропологических исследований. 2019. Т. 1. № 23. С. 44-55. doi
Dobrushina N., Daniel M. Field linguistics in Daghestan: A very personal account, in: Word hunters Vol. 194. John Benjamins Publishing Company, 2018.doi P. 79-94
Daniel, Michael, Alexey Koshevoy, Ilya Schurov, Nina Dobrushina. Can recall data be trusted? Field methods. Accepted for publication pending appropriate revision.
Dobrushina N., Moroz G. The speakers of minority languages are more multilingual // International Journal of Bilingualism. 2021. Vol. 25. No. 4. P. 921-938.
Квантитативное исследование лексического взаимовлияния в нахско-дагестанских языках
Целью проекта является квантитативное исследования лексического влияния различных языков в Дагестане на микроуровне. Согласно данным проекта о многоязычии в Дагестане, условия и степень языкового контакта индивидуальны для каждого села. Основная цель проекта — обнаружить лексические корреляты этих различий. В рамках проекта был разработан список из 160 лексических единиц, а также метод быстрого сбора в поле. На данный момент список собран от носителей 14 различных языков в 30 дагестанских селах и в 5 селах в Гахском районе Азербайджана, принадлежащих к пяти различным географическим и лингвистическим ареалам. Данные, собранные в соседних сёлах, позволяют не только показать различия в степени соседского влияния на карте, но и выявить зоны влияния определенных языков. Например, несмотря на то, что лексическое влияния тюркских языков (азербайджанский, кумыкский, ногайский) зафиксировано по всему Дагестану, на юге, где азербайджанский долгое время использовался в качестве лингва-франка, это влияние выражено значительно ярче. С другой стороны, на севере Дагестана тюркское влияние в основном распространялось через аварский язык: знание тюркских языков в этом регионе было мало распространено, и почти все тюркские заимствования в местных малых языках отмечены также и в аварском языке. Таким образом, использование унифицированного списка лексических значений позволяет найти количественные корреляты качественных различий между регионами, таких как распространенность тех или иных лингва-франка, наличие и степень контакта с определенными языками, а также миграционные процессы. Материалы проекта доступны в онлайн базе данных.
Участники: М.А. Даниэль, И.Ю. Чечуро, С. Ферхеес, Н.Р. Добрушина
Публикации:
Daniel M., Chechuro I., Verhees S., Dobrushina N. Lingua Francas as Lexical Donors: Evidence from Daghestan // Language. 2021. Vol. 97. No. 3. P. 520-560
Daniel M., Verhees S., Chechuro I. Small-scale multilingualism through the prism of lexical borrowing // International Journal of Bilingualism. 2021. Vol. 25. No. 4. P. 1019-1039.
Акустические характеристики смычных согласных в нахско-дагестанских языках
Проект посвящен описанию вариативности, наблюдаемой при анализе акустических характеристик смычных согласных в восточнокавказских языках. По всей видимости, акустические характеристики звуков, которые занимают одинаковые слоты в фонетическом инвентаре различных дагестанских языков (например, абруптивные согласные в арчинском и лакском языках), могут не сильно, но последовательно различаться. Перед нами стоит цель доказать наличие таких различий и их значимость с помощью статистических инструментов. В более широком смысле, мы рассматриваем две гипотезы. Согласно первой, эти различия мотивируются структурными различиями в фонетической системе языка (например, наличия противопоставления сильных и слабых серий смычных). Согласно другой, по крайней мере отчасти различия могут объясняться ареально, подобно тому, как, в макро-перспективе, например юг и север Республики Дагестан различаются системой латеральных согласных. Насколько нам известно, анализ акустических различий или общих черт фонетики языков с ареальной точки зрения является инновационной исследовательской задачей. В рамках данного проекта подразумевается разметка записанных данных, акустический анализ, а также дальнейших сбор данных в рамках последующих экспедиций.
Участники: С. Гравундер, Г.А. Мороз, М.А. Даниэль, В.Р. Жигульская, А.В. Ширяев
Публикации:
Shiryaev, Alexander, Michael Daniel and George Moroz, submitted. Sonorant lateral in Rikvani Andi.
Grawunder, Sven, Michael Daniel, and George Moroz. (In prep.) Conflicting behavior of VOT in ejectives of two East Caucasian languages
Релятивизация в нахско-дагестанских языках: внутригенетические и ареальные перспективы
В нахско-дагестанских языках доминирует причастная стратегия оформления относительных предложений. При этом, хотя причастия могут выражать различные аспектуальные значения, они лишены какой-либо синтаксической ориентации. Синтаксические ограничения на мишень релятивизации отсутствуют: пробел в относительной клаузе может соответствовать как ядерному аргументу, так и одному из периферийных участников ситуации или даже участнику, которого нет в синтаксической рамке глагола; также распространена релятивизация факта, места, времени. Исходя из пилотных подсчетов мишеней релятивизации по нескольким дагестанским языкам, языки ведут себя с точки зрения предпочтений по частотности релятивизации тех или иных аргументов неодинаково. Априори, однако, непонятно, с чем могут быть связаны такие различия: с методикой подсчета, со спецификой конкретных корпусов или же с грамматическими особенностями конкретного языка. В рамках проекта исследование мишеней релятивизации будет проводится на более обширном корпусном материале с применением унифицированной разметки относительных предложений. Будут привлечены к рассмотрению как несколько языков нахско-дагестанской семьи (агульский, арчинский, ингушский, удинский и др.), так и другие языки Кавказа, далекие от них типологически и генетически (адыгейский). Сделанные обобщения позволят проверить утверждения об иерархии аргументов при релятивизации, высказывавшиеся в синтаксической литературе.
Участники: М.А. Даниэль, Ю.А. Ландер, Т.А. Майсак, Дж. Николс
Типология многоязычия в малых языковых сообществах
Целью проекта является исследование многоязычия в малых языковых группах, характерных для традиционных языковых сообществ с небольшим количеством говорящих. Возросший интерес к такому многоязычию вызван осознанием необходимости реконструктировать социальные условия, которые способствовали языковому разнообразию в доколониальном мире. Мы сравниваем языковые ситуации, для которых характерно многоязычие этого типа, закладывая основания для будущей типологии. Мы исследуем источники многоязычия в малых языковых сообществах, обращая особое внимание на роль экзогамии и эндогамии, и выявляем языковые идеологии, характерные для сообществ с малыми языками. Многоязычие в доколониальном мире обладает большим разнообразием, но находится под угрозой исчезновения, в первую очередь из-за распространения больших языков.
Участники: Nina Dobrushina, Brigitte Pakendorf, Olesya Khanina
Публикации:
Pakendorf B., Dobrushina N., Khanina O. A typology of small-scale multilingualism // International Journal of Bilingualism. 2021. Vol. 25. No. 4
Dobrushina N., Moroz G. The speakers of minority languages are more multilingual // International Journal of Bilingualism. 2021. Vol. 25. No. 4. P. 921-938.
Vydrina, A. 2021. Fouta-Djallon linguistic ecology: Between polyglossia and small-scale multilingualism. International Journal of Bilingualism. Vol. 25. No. 4
Нестандартный порядок слов в русском языке: на материале устных корпусов русской речи билингвов и монолингвов
Целью проекта было исследование нестандартного порядка слов в русской речи носителей языков Дагестана. Мы рассмотрели порядок слов в именной группе с генитивным зависимым. В литературном русском языке нейтральный порядок слов “вершина + генитив” (N+Gen, сестра отца ), а в дагестанском русском часто встречается противоположный порядок слов (Gen+N, отца сестра ). Можно предположить, что нестандартный порядок слов в таких конструкциях возникает под влиянием нахско-дагестанских и тюркских языков, контактирующих с русским языком в Дагестане: для всех этих языков характерен порядок слов Gen+N. С другой стороны, можно предположить, что порядок слов Gen+N, обнаруженный в дагестанском русском, отражает не связанную с языковым контактом тенденцию, характерную для более широкого круга разговорных вариантов устного русского языка. Чтобы проверить эти две гипотезы, мы проводим количественный анализ именных групп с генитивным зависимым на материале Корпуса русской речи Дагестана. Данные дагестанского русского мы сравнили: а) с данными двух других контактных разновидностей русской речи: башкирского русского (Корпус русской речи Башкирии) и чувашского русского (Корпус русской речи Чувашии); б) с данными диалектной русской речи (Корпус бассейна реки Устья,Корпус говора села Роговатка, Корпус говора села Спиридонова Буда, Корпус говора села Малинино,Корпус опочецких говоров); и в) с данными литературного русского языка (Устный корпус национального корпуса русского языка, Корпус русской речи Звенигорода).
Участники: К. Наккарато, Н.М. Стойнова, А.Б. Панова
Публикации:
Наккарато К., Панова А. Б., Плешак П. С., Стойнова Н. М., Хомченкова И. А. Посессивные конструкции с препозицией генитива в русском языке // В кн.: Анализ разговорной русской речи (АР3-2019): Труды восьмого междисциплинарного семинара. СПб. : Политехника-Принт, 2019. С. 78-83.
Наккарато К., Панова А. Б., Стойнова Н. М. Нестандартный порядок слов в дагестанском русском: именные группы с генитивом // Труды института русского языка им. В.В. Виноградова. 2020. № 4. С. 146-167.
Naccarato C., Panova A., Stoynova N. Word-order variation in a contact setting: A corpus-based investigation of Russian spoken in Daghestan // Language Variation and Change. 2021. Vol. 33. P. 1-25.
Опущение предлогов в русском языке Дагестана
Цель проекта - найти факторы, обуславливающие опущение предлогов в русской речи жителей дагестанских сел. Предыдущие исследования, основанные на данных из трех сел, выделяют это явление как яркую черту данного варианта русского языка и связывают его с влиянием морфологической системы нахско-дагестанских языков. На основе статистического анализа корпусных данных мы показываем, что вероятность опущения предлогов зависит от типа предлога, фонетического контекста и от уровня владения русским языком. Мы предполагаем, что частое опущение предлогов в речи жителей горного Дагестана является результатом взаимодействия двух факторов: общей типологической тенденции к немаркированию определенных пространственных и временных локализаций и неполного усвоения предложной системы русского языка.
Участники: А. Б. Панова, Т. А. Филиппова
Публикации:
Panova A., Philippova T. When a cross-linguistic tendency marries incomplete acquisition: preposition drop in Russian spoken in Daghestan. International Journal of Bilingualism. 2021. Vol. 25. No. 3. P. 640-667.
Адыгские изоглоссы
Традиционно выделяемые лингвистами в составе абхазо-адыгской семьи адыгейский и кабардино-черкесский языки часто считаются их носителями единым адыгским языком, который, однако, имеет много вариантов. Цель проекта заключается в исследовании различных изоглосс, обозначающих границы адыгских вариантов, как на основе существующих научных трудов, так и путем полевых исследований. В идеале, по окончании проекта мы хотим иметь базу данных изоглосс, позволяющую сравнить разнообразные адыгские идиомы. На нынешнем этапе проект фокусируется на восточноадыгских (адыгейских) идиомах как в Адыгее и Краснодарском крае, так и в диаспоре (осенью 2017 года была проведена экспедиция к израильским черкесам).
Участники: Ю.А. Ландер, Г.А. Мороз, П. Фелан, А.И. Федоренко
Типология именных словоизменительный категорий
Одной из самых полезных с типологической и географической точки зрения переменных в базе данных Autotyp является словоизменение глагола. Цель нашего проекта состоит в создании такой же базы для существительного. В 2017-2019 годах база была создана и проведено пилотное исследование Евразии. В этом году мы добавляем в нашу выборку языки из других частей мира и рассчитываем корреляцию между сложностью систем словоизменения глаголов и существительных. В 2021 г. планируется публикация в журнале.
Участники: Е.О. Сокур, Дж. Николс
База данных "каузативной альтернации" в языках мира
Создание базы данных каузативной альтернации - часть более широкого проекта Дж. Николс и других исследователей, посвящённого исследованиям переходности в языках мира. База данных содержит пары глаголов, один из которых является семантически некаузативным, а другой - каузативным. В базе данных учитывается, как элементы этих пар связаны друг с другом (образован ли один из этих глаголов от другого, от одного ли корня они образованы, являются ли они морфологически простыми или сложными).
Участники: П. Наследскова, Дж. Николс
Типология приименных конструкций неотторжимой принадлежности
Противопоставления, основанные на оппозиции отторжимой и неотторжимой принадлежности, зафиксированы в именных группах множества языков мира, однако обнаруживают значительное варьирование как в том, что касается формы, так и в том, что касается функционирования. В рамках проекта собираются и анализируются данные по разнообразным конструкциям и предполагается создание типологии, описывающей это разнообразие. Наша задача создать базу данных и сравнить эти конструкции по различным параметрам: например, семантика неотторжимых и отторжимых классов, порядок слов, вершинное или зависимостное маркирование.
Участники: Е.О. Сокур, Ю.А. Ландер
Корпусное исследование вариативности говора Устьянского района
Ustja River Basin Corpus (корпус бассейна реки Устья) представляет собой собрание аннотированных в стандартной орфографии записей интервью с жителями деревни Михалёвская (Пушкино) и некоторых близлежащих деревень на юге Архангельской области. Главная задача исследования, основанного на данных корпуса — моделирование языковой вариативности и динамики утраты диалекта в небольшом сообществе деревенских жителей с помощью изучения отдельных языковых переменных: скорости их утраты, корреляций между ними, степени инновативности/консервативности отдельных говорящих, поведения переменных в речи аутлаеров (носителей, статистически значимо отличных от своей возрастной группы), влияния экстралингвистических факторов и т.д. Такой анализ подразумевает перцептивную разметку огромного объема данных. После первой публикации (см. ниже) в планах проекта находится исследование гендерной вариативности степени диалектности носителей в одной и той же возрастной группе.
Участники: Р. фон Вальденфельс, Н.Р. Добрушина, М.А. Даниэль
Публикации:
Daniel M., von Waldenfels R., Ter-Avanesova A., Kazakova P., Schurov I., Gerasimenko E., Игнатенко Д. И., Махлина Е. Н., Tsfasman M., Verhees S., Vinyar A., Zhigulskaya V., Ovsjannikova M., Say S., Dobrushina N. Dialect loss in the Russian North: modeling change across variables // Language Variation and Change . 2019. Vol. 31. No. 3. P. 353-376. doi
Диалектная дифференциация эвенского языка
Эвенский язык относится к северной ветви тунгусо-маньчжурской языковой семьи. На нем говорит несколько небольших сообществ, расселившихся по территории Северо-Восточной Сибири. Такая рассредоточенность поселений привела к существенному диалектному дроблению с большим многообразием на лексическом, фонологическом, морфологическом и синтаксическом уровнях. Это многообразие можно считать результатом влияния множества факторов: различный уровень сохранности унаследованной вариативности, независимые инновации, контакты с типологически отличными языками. В настоящем исследовании мы сосредоточили свое внимание на двух самых далеких друг от друга эвенских диалектах: самый западный диалект эвенского с высокой степенью сохранности, ламунхинский, на котором говорят в селе Себян-Кюёль в Якутии; и один из самых восточных диалектов – быстринский диалект, на котором говорят в центральной Камчатке. Для обоих диалектов уже созданы отглоссированные устные корпуса: объем ламунхинского корпуса составляет около 52 000 слов, а быстринского корпуса – около 34 000 слов. Для ответа на вопрос о том, как произошло дробление этих диалектов, важно определить, в чем они различаются.
Говоря о диалектных различиях, в первую очередь обычно имеют в виду категорические различия - наличие явления в одном диалекте при отсутствии его в другом. Очевидно, с другой стороны, что по крайней мере архаичные черты диалектов не обязательно утрачиваются полностью, так что диалекты могут различаться частотностью того или иного явления. Частотность может показывать и междиалектные различия, вытекающие из приобретения унаследованными показателями новых функций. На первый взгляд, при наличии корпусов такие различия могут быть относительно легко выявлены. Однако при работе с малыми корпусами проблема заключается в том, чтобы отличить междиалектные отличия от индивидуальных предпочтений отдельных носителей. Начиная с первой публикации по проекту мы работаем со статистическими методами, которые позволяют при выделении различий в частотности учитывать фактор разнородности корпуса. После выделения статистически значимых различий в частотности мы планируем перейти к собственно лингвистической интерпретации этих различий с точки зрения функциональной дивергенции показателей, контактных влияний и типологии грамматикализационных процессов.
Участники: Б. Пакендорф, М.А. Даниэль, И.В. Щуров, Е.В. Бирюкова
Публикации:
Andriyanets V., Daniel M., Pakendorf B. Discovering dialectal differences based on oral corpora, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая — 2 июня 2018 г.) / Под общ. ред.: В. Селегей, И. М. Кобозева, Т. Е. Янко, И. Богуславский, Л. Л. Иомдин,М. А. Кронгауз,А. Ч. Пиперски. Вып. 17(24). М. : Издательский центр «Российский государственный гуманитарный университет», 2018. P. 28-38.
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.