Информация о статье
2013 г., Том 18, № 6, с.62-74
Загоруйко Н.Г., Барахнин В.Б., Борисова И.А., Ткачев Д.А.
Кластеризация текстовых документов из электронной базы публикаций алгоритмом FRiS-Tax
Описывается опыт применения алгоритма FRiS-Tax, основанного на использовании функции конкурентного сходства, в задачах кластеризации текстовых документов. Показано, что для данного класса задач FRiS-алгоритм даёт заметно лучшие результаты по сравнению с классическими алгоритмами кластеризации. Получены апостериорно выбираемые правила для определения весовых коэффициентов при шкалах в формуле вычисления меры сходства на основании предполагаемой достоверности данных. Представлен вариант параллельного выполнения некоторых этапов кластеризации документов с использование FRiS-алгоритма. Приведены количественные оценки времени выполнения процесса, наглядно демонстрирующие преимущества параллельной реализации на разных этапах обработки: при предварительном анализе документов, включающем вычисление мер сходства, а также частично при выполнении непосредственно процесса кластеризации.
[полный текст] Ключевые слова: кластеризация текстовых документов, параллельный алгоритм кластеризации, FRiS-алгоритм
Библиографическая ссылка: Загоруйко Н.Г., Барахнин В.Б., Борисова И.А., Ткачев Д.А. Кластеризация текстовых документов из электронной базы публикаций алгоритмом FRiS-Tax // Вычислительные технологии. 2013. Т. 18. № 6. С. 62-74
|
|
|