Разработка и реализация алгоритмов компьютерного анализа метроритмических характеристик русских поэтических текстов
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 10 Апрель 2019
Организация: НГУ
Авторы: Кузнецова Ирина Владимировна
В литературоведении существует необходимость автоматизации анализа различных уровней структуры стиха, а также автоматизированного составления на основе такого анализа метрических справочников к корпусам стихов, словарей рифм и конкордансов.
В докладе описаны алгоритмы и реализация программного модуля, отвечающего за анализ структурного уровня стихотворения: метра, стопности и рифмы.
Алгоритм определения метра и стопности учитывает проблему неоднозначности расстановки ударений в омографах, возможные пропуски схемных ударений (пиррихии), наложение сверхсхемных ударений (спондеи), которые решаются методом “по аналогии”.
Также описан алгоритм выявления переноса ударения с одной части речи на другую (проклитик). Для выполнения задачи составлена база данных проклитик на основе словаря академика А.А. Зализняка.
Алгоритм поиска рифм реализован из соображений возможности образования рифмы: строки рифмуются, если у последних слов в строке одинаковая позиция ударного слога и фонетически совпадают окончания. Результатом работы алгоритма определения рифмы является установление строфики стихотворения. Алгоритм реализован на языке Python и протестирован на корпусе стихотворений А.С. Пушкина (период творчества 1818-1825).