Методы машинного обучения в анализе интернет-комментариев, содержащих оценку высших учебных заведений
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 2 Май 2023
Организация: НГУ (Новосибирск)
Авторы: Перетолчин Глеб Дмитриевич
В рамках работы рассмотрены методы представления комментариев в сети, алгоритмы их предобработки и модели машинного обучения, используемые для классификации текстов. Основной задачей является классификация комментариев по тональности, источник анализируемого материала — интернет-ресурс https://tabiturient.ru/ .
Разработана методика анализа интернет-комментариев, содержащих оценку высших учебных заведений. Оценка точности методики позволяет сделать вывод: наивный байесовский классификатор дает достаточно хорошие результаты, однако лучшие результаты получены с использованием LSTM-модели.