Выделение словосочетаний из текста на естественном языке
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 24 Октябрь 2018
Организация: ИВТ СО РАН
Авторы: Содбоев Матвей Константинович
В работе представлены технологии автоматического извлечения словосочетаний из текстов, среди которых выделен наиболее перспективный — “Tomita Parser”. В дальнейшем он будет интегрироваться с системой комплексного анализа русских поэтических текстов. Процесс анализа состоит из трех основных модулей: структурный, семантический и прагматический. Извлечение словосочетаний относится к семантическому анализу.
Предлагаемый метод использует контекстно свободные грамматики для описания правил, на основе которых извлекаются словосочетания. Сами правила составляются на формальном языке.
Также приведены примеры работы алгоритма и его недостатки.