ZooSPACE – Реализация географического поиска информации в информационной системе
Семинар: Информационные технологии
Начало заседания: 14:35
Дата выступления: 9 Март 2021
Организация: ФИЦ ИВТ (Новосибирск)
Авторы: Леонова Юлия Викторовна
Извлечение географических названий из произвольных текстовых документов имеет важное значение в задачах обработки больших массивов документов и привязки их контента к определенному географическому региону. Также необходимо учитывать изменение свойств географических объектов с течением времени. В самом простом виде модель извлечения географических названий из текста выглядит как последовательность действий с текстом, при этом на каждом этапе решается своя задача. Среди этих задач, несомненно, присутствуют: парсинг текста, анализатор элементов текста, обработка синонимов и сокращений, приведение элементов текста к нормальной форме с возможных словоформ и правил грамматики, сравнение элементов текста с элементами словарей географических названий, добавление в текст специальных меток для однозначной идентификации географических названий.
В предлагаемой работе описана технология, реализующая перечисленные выше задачи на базе свободно распространяемой СУБД PostgreSQL. В качестве авторитетной базы данных географических названий применены база данных GeoNames Gazetteer, базы данных Open Street Map (OSM), классификаторы ОКАТО и КЛАДР. Использование тезауруса ретроспективного геокодирования позволяет решить задачу учета временных изменений географических объектов при выполнении географического поиска.
___________________________________________________________________________________________
Семинар будет проходить в режиме ОНЛАЙН. Подключиться можно через браузер компьютера или телефона по ссылке:
https://zoom.us/j/95680932328