Извлечение и разметка данных в научных статьях через платформу Label Studio

Семинар: Информационные технологии
Начало заседания: 14:35

Дата выступления: 15 Октябрь 2024

Организация: Евразийский национальный университет им.Л.Н.Гумилева (Астана, Казахстан)

Авторы: Раушан Бауржановна Ташибаева

В условиях постоянного увеличения объёма исследовательской информации возникает потребность в автоматизации процесса извлечения и разметки терминов в научных статьях с целью облегчения поиска, анализа и интерпретации данных. Для повышения точности разметки научных статей была использована платформа Label Studio. Благодаря своей способности обрабатывать различные типы данных, интегрироваться с конвейерами машинного обучения и искусственного интеллекта и предоставлять разметку с помощью машинного обучения Label Studio является ценным инструментом как для технических специалистов, так и для обычных пользователей. С помощью платформы Label Studio планируется подготовить набор данных для задач компьютерного зрения: распознавать именованные сущности для обучения алгоритмов.

 

Запись семинара доступна по ссылке:  http://vcs-6.ict.nsc.ru/playback/presentation/2.3/228a9fae282dbbff81e8d43363ee59a3a8abb705-1728976949505.

 

.

 

.