Корпуса устной речи при поддержке лаборатории
Международная лаборатория языковой конвергенции рада сообщить о появлении нескольких новых корпусов устной речи и пополнении старых. На этой странице вы найдете ссылки на все корпуса, которые доступны в настоящий момент.
Все корпуса являются устными, то есть предоставляют доступ к звуку. Тексты расшифрованы не в транскрипции, а в нормализованной орфографии, по которой ведется поиск. Если для говора характерно произношение "опеть" (вместо "опять"), то в поисковой строке нужно набрать слово "опять". Выданные примеры дадут вам доступ к звучащей речи, где вы сами выясните, как именно было произнесено слово.
Многие корпуса дают возможность прослушать текст полностью.
Корпуса были созданы сотрудниками лаборатории в тесном сотрудничестве с исследователями из других научных организаций: Университетов Берна и Йены (Корпус бассейна реки Устья, Корпус русской речи Дагестана), Института русского языка имени В.В. Виноградова (Корпус села Роговатка), Института лингвистических исследований (Устный корпус башкирского языка), Школы филологии НИУ ВШЭ (Корпус села Спиридонова Буда), НИУ ВШЭ (Санкт-Петербург) (Корпус русской речи Чувашии).
Корпуса имеют разные объемы: от 70 564 словоформ в корпусе Спиридоновой Буды до 864 057 словоформ в Устьянском корпусе (без учета речи исследователя).
В ближайшие месяцы на этой странице появятся ссылки на еще несколько корпусов устной речи.
Лаборатория языковой конвергенции готова оказывать технологическую помощь в создании аналогичных корпусов.