Использование алгоритмов машинного обучения для выявления семантических полей поэтических текстов на русском языке

Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00

Дата выступления: 1 Декабрь 2020

Организация: ФИЦ ИВТ

Авторы: Столбов Никита Станиславович

Исследование взаимозависимости различных уровней структуры поэтических текстов является весьма актуальной проблемой русской филологии. Одна из основных трудностей при решении этой проблемы - необходимость анализа корпусов поэтических текстов большого объема. Данная задача является достаточно трудоемкой, поэтому возникает необходимость автоматизации анализа различных уровней текста с помощью применения методов машинного обучения. Одним из верхних уровней является семантический уровень, определяемый, в частности, словосочетаниями.

В докладе представлены результаты работы по реализации алгоритма извлечения словосочетаний из поэтических текстов на русском языке, основанного на марковских случайных полях, и составления конкордансов на основании извлеченных словосочетаний. Приведен обзор методов машинного обучения, применимых в задаче выявления семантических полей русских поэтических текстов.

 

Ссылка на подключение: https://vcs-3.ict.sc/b/grz-ayy-7ne