Извлечение и разметка данных в научных статьях через платформу Label Studio
Семинар: Информационные технологии
Начало заседания: 14:35
Дата выступления: 15 Октябрь 2024
Организация: Евразийский национальный университет им.Л.Н.Гумилева (Астана, Казахстан)
Авторы: Раушан Бауржановна Ташибаева
В условиях постоянного увеличения объёма исследовательской информации возникает потребность в автоматизации процесса извлечения и разметки терминов в научных статьях с целью облегчения поиска, анализа и интерпретации данных. Для повышения точности разметки научных статей была использована платформа Label Studio. Благодаря своей способности обрабатывать различные типы данных, интегрироваться с конвейерами машинного обучения и искусственного интеллекта и предоставлять разметку с помощью машинного обучения Label Studio является ценным инструментом как для технических специалистов, так и для обычных пользователей. С помощью платформы Label Studio планируется подготовить набор данных для задач компьютерного зрения: распознавать именованные сущности для обучения алгоритмов.
Запись семинара доступна по ссылке: http://vcs-6.ict.nsc.ru/playback/presentation/2.3/228a9fae282dbbff81e8d43363ee59a3a8abb705-1728976949505.
.
.