Автоматический авторитетный контроль для библиографических баз данных

Семинар: Информационные технологии
Начало заседания: 14:35

Дата выступления: 30 Апрель 2013

Организация: ИВТ СО РАН, Томский филиал (Томск)

Авторы: Князева А.А.

В работе рассматривается задача идентификации объектов реального мира, упоминаемых в структурированных документах. Сформулирован подход, который позволяет учитывать различные признаки, по которым производится идентификация, и присваивать им различные веса в зависимости от их значимости. Рассматривается применение предлагаемой модели к задаче идентификации персон, выступающих в роли авторов публикаций, на основе данных электронного каталога библиотеки. Таким образом решается задача автоматического авторитетного контроля, суть которой состоит в установлении связи между документом, описывающим публикацию и документом, описывающим ее автора в автоматическом режиме, без привлечения человека. Приводится описание экспериментов, проведенных с использованием реальных библиографических баз данных. Установлено, что использование дополнительной информации, содержащейся в уже установленных связях между документами, позволяет существенно снизить процент ошибок связывания и количество документов, которым отказано в связывании из-за недостатка информации в них.