Оценка тональности по отношению к объекту в публицистических текстах
Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00
Дата выступления: 2 Октябрь 2018
Организация: ИВТ СО РАН
Авторы: Пастушков Илья Сергеевич
Важной задачей анализа текстов является анализ тональности текста: позитивный, негативный или нейтральный. Данная задача успешно решена для случаев, когда объект заранее известен, например, в отзывах организации, либо имеется прямая ссылка на объект в тексте. Стоит отметить, что в настоящее время существуют решения, больше ориентированные на короткие тексты.
В данной работе решается проблема выделения объекта методом синтаксического чанкинга, с последующей обработкой с помощью функций ранжирования основанных на TF-IDF и BM25 и последующая классификация фрагментов текста с присутствием объекта. Метод текстового чанкинга (text chunking) считается разновидностью частичного синтаксического анализа. Указанный метод заключается в разбиении текста на синтаксически связанные фрагменты текста, представляющие собой синтаксические группы. При дальнейшей обработке на выходе мы получаем связи между этими группами, чем, во-первых, решаем задачу нахождения синонимов объекта, а во-вторых, связи с неименными группами, которые в числе прочих признаков подаются на вход классификатору.