Алгоритмы генерации словоформ узбекского языка
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 1 Апрель 2020
Организация: НГУ
Авторы: Менглиев Давлатёр Бахтиярович
В настоящее время наблюдается активное развитие узбекского сектора интернета. В нем, как и в других национальных секторах, самой распространенной формой представления текстовой информации являются слабоструктурированные документы, работа с которыми предполагает наличие надежных алгоритмов анализа текста, в том числе его лексических характеристик. В докладе будет представлен один из алгоритмов усечения окончаний (алгоритм Портера), который был изучен автором для решения поставленной задачи. Вместе с тем, в докладе будут также озвучены недостатки этого алгоритма и возможные пути решения для минимизации ошибок в работе.