Алгоритм пакетной выгрузки данных и метаданных системы комплексного анализа поэтических текстов
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 1 Апрель 2020
Организация: НГУ
Авторы: Шашок Наталья Александровна
Актуальным направлением развития гуманитарных исследований являются задачи, связанные с автоматизацией анализа поэтических текстов, в частности, с обработкой больших корпусов стихотворений. Возникает как проблема выбора достоверных внешних источников, так и проблема адаптации взятых из них материалов, связанная с отсутствием программных интерфейсов (API) для пакетной выгрузки материалов с ресурса. В докладе обсуждается проектирование и реализации алгоритма пакетной выгрузки метаданных с сайта Фундаментальной электронной библиотеки “Русская литература и фольклор” для их дальнейшего использования в рамках системы комплексного анализа поэтических текстов.