Разработка словаря и инструмента анализа тональности текстов на узбекском языке с помощью именованных сущностей

Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00

Дата выступления: 3 Декабрь 2024

Организация: НГУ

Авторы: Саидов Бобур Рашидович

Быстрый рост цифрового общения на узбекском языке вызвал необходимость разработки инструментов для анализа тональности текста. В данной статье представлен новый подход к анализу тональности в текстах на узбекском языке, объединяющий распознавание именованных сущностей (NER) с созданным на заказ словарем. Методология включает создание лексикона, адаптированного к узбекским лингвистическим особенностям, и реализацию вычислительного инструмента для классификации тональности.

Наш подход использует контекстуальные нюансы именованных сущностей для повышения точности определения тональности. Предварительные эксперименты демонстрируют эффективность предложенной системы, обеспечивая значительное повышение точности по сравнению с базовыми моделями. Данное исследование закладывает основу для передовых приложений обработки естественного языка (NLP) на узбекском языке, устраняя критический пробел в существующих вычислительных ресурсах для языков с низким уровнем ресурсов.

 

Семинар будет проведен в смешанном формате. Очное заседание пройдет в конференц-зале ФИЦ ИВТ (к.513), дистанционно к семинару можно будет подключиться по ссылке https://vcs-6.ict.nsc.ru/rooms/grz-ayy-7ne/join

Для студентов и аспирантов, находящихся в Новосибирске и не имеющих причин для дистанционного подключения, очное присутствие обязательно.

 

Запись выступления: https://vcs-6.ict.nsc.ru/playback/presentation/2.3/caeaa151fe7743faa3d160ccb904deddc5b7d1cb-1733197338943