Разработка и реализация алгоритмов анализа метроритмических и строфических характеристик русских поэтических текстов
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 8 Апрель 2020
Организация: НГУ
Авторы: Кузнецова Ирина Владимировна
В докладе описаны алгоритмы и реализация программного модуля, отвечающего за анализ структурного уровня стихотворения: метра, стопности и рифмы. Алгоритм определения метра и стопности учитывает проблему неоднозначности расстановки ударений в омографах, а также проблемы пропуска схемных ударений (пиррихиев) и наложения сверхсхемных ударений (спондеев), которые решаются методом “по аналогии”. Также описан алгоритм выявления переноса ударения с одной части речи на другую (проклитик), для реализации которого была составлена база данных проклитик на основе словаря А. И. Зализняка. Алгоритм поиска рифм реализован из соображений возможности образования рифмы: строки рифмуются, если у последних слов в строке одинаковая позиция ударного слога и фонетически совпадают окончания. Результатом его работы является определение типа рифмовки в строфах того или иного стихотворения. Результаты исследования реализованы на языке Python, также реализован API для данного программного модуля. Алгоритмы протестированы на корпусе стихотворений А.С. Пушкина (период творчества 1818-1825).