Разработка алгоритмов генерации словоформ узбекского языка
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 17 Март 2021
Организация: НГУ
Авторы: Менглиев Давлатёр Бахтиярович
В настоящее время наблюдается активное развитие узбекского сектора интернета. В нем, как и в других национальных секторах, самой распространенной формой представления текстовой информации являются слабоструктурированные документы, работа с которыми предполагает наличие надежных алгоритмов анализа текста, в том числе его лексических характеристик. В докладе представлен один из алгоритмов стемминга, изученный для решения поставленной задачи, его недостатки и возможные пути решения для минимизации ошибок в работе.