Локальный номер: | 16 |
Номер гос. регистрации: | 01201261902 |
Дата гос. регистрации: | 2012-05-24 |
Тип проекта: | Российский фонд фундаментальных исследований Инициативные проекты |
Шифр проекта: | 12-07-00125-а |
Название: | Теоретико-информационные методы анализа текстовой информации и их применение к задачам прогнозирования и защиты информации |
Руководитель: | Рябко Б.Я. |
Коды ГРНТИ: | 28.23.24; 81.93.29; 81.96.00; |
Коды УДК: | 004.89; 004.93; |
Аннотация: | Методы анализа текстовой информации находят самое широкое применение в лингвистике, компьютерных науках, при решении таких задач, как "автоматическое определение смысла" (data mining, text mining), автоматическое обучение, биоинформатика и др. Несмотря на многочисленные достижения, полученные исследователями как у нас в стране, так и за рубежом, многие важные задачи в области анализа текстовых данных еще далеки от своего окончательного решения. Одна из таких задач - построение доверительных множеств при фильтрации текстов и методически связанная с ней проблема прогнозирования, или предсказания, символьных последовательностей. Другой класс задач, важных для практики и теории - определение "степени близости" различных текстов (или степени их однородности) и тесно связанная с ними задача классификации, являющаяся ключевой при построении филогенетических деревьев в биоинформатике. Обнаружена тесная связь одного из важнейших направлений теории защиты информации - стегоанализа с задачей анализа символьных последовательностей. В частности, получены первые результаты в области построения доказуемо невскрываемых стегосистем и выяснения условий их существования. В последних работах руководителя проекта предложен новый подход к решению названных проблем. Этот подход базируется на идеях и методах теории информации (универсальное кодирование, Колмогоровская сложность), а также теории сложности алгоритмов и новых подходах статистического анализа. В рамках предлагаемого проекта планируется разработка эффективных методов решения вышеуказанных задач с использованием последних достижений и новейших подходов, разрабатываемых участниками проекта. |