Анализ применимости синтаксических характеристик при оценке сложности текстов методами машинного обучения
Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00
Дата выступления: 28 Февраль 2023
Организация: НГУ
Авторы: Смаль Иван Андреевич
В последние годы сфера обработки естественного языка очень быстро развивается. Однако, когда речь идет про оценку сложности текстов, до сих пор самыми распространенными являются формулы, разработанные еще в 20-м веке.
В докладе представлены результаты анализа того, насколько точно можно предсказывать сложность текста методами градиентного бустинга и случайного леса при использовании исключительно синтаксических характеристик текста. Работа проводилась на двух корпусах текстов – корпусе учебников, и корпусе художественной литературы.
Семинар будет проведен в смешанном формате. Очное заседание пройдет в конференц-зале ФИЦ ИВТ (к.513), дистанционно к семинару можно будет подключиться по ссылке https://vcs-6.ict.nsc.ru/b/grz-ayy-7ne
Для студентов и аспирантов, находящихся в Новосибирске и не имеющих причин для дистанционного подключения, очное присутствие обязательно.
Запись семинара: https://vcs-6.ict.nsc.ru/playback/presentation/2.3/caeaa151fe7743faa3d160ccb904deddc5b7d1cb-1677556242955