Оценка тональности по отношению к объекту в публицистических текстах

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 26 Сентябрь 2018

Организация: ИВТ СО РАН

Авторы: Пастушков Илья Сергеевич

Важной задачей анализа текстов является анализ тональности текста: позитивный, негативный или нейтральный. Данная задача успешно решена для случаев, когда объект заранее известен, например в отзывах организации, либо имеется прямая ссылка на объект в тексте. Стоит отметить, что в настоящее время существуют решения больше ориентированные на короткие тексты. 

В данной работе решается проблема выделения объекта методом синтаксического чанкинга, с последующей обработкой с помощью функций ранжирования основанных на TF-IDF и BM25 и последующая классификация фрагментов текста с присутствием объекта. Метод текстового чанкинга (text chunking) считается разновидностью частичного синтаксического анализа. Указанный метод заключается в разбиении текста на синтаксически связанные фрагменты текста, представляющие собой синтаксические группы. При дальнейшей обработке на выходе мы получаем связи между этими группами, чем во-первых, решаем задачу нахождения синонимов объекта, а во-вторых, связи с неименными группами, которые в числе прочих признаков подаются на вход классификатору.