Определение читабельности предложений на основе синтаксических деревьев
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 24 Май 2022
Организация: Новосибирский государственный университет (Новосибирск)
Авторы: Смаль Иван Андреевич
Проблема оценки читабельности - сложности понимания текстов - актуальна в наше время, поскольку результаты могут применяться во множестве областей: здравоохранение, образование, маркетинг и др.
Решением данной проблемы занимаются с начала 20-го века, и несмотря на то, что в наше время инструменты для анализа текста, а также построения различных классификаторов и регрессоров, достаточно развиты, самыми популярными решениями остаются классические формулы, разработанные в конце 90-х годов.
В докладе представлены результаты построения моделей для оценки читабельности предложений на основе машинного обучения, а также анализ значимости различных свойств синтаксических деревьев в построенных моделях.