Применение идей колмогоровской сложности для изучения биологических текстов

Семинар: Информационные технологии
Начало заседания: 14:35

Дата выступления: 2 Октябрь 2012

Организация: СибГУТИ, ИСЭЖ СО РАН

Авторы: Рябко Б.Я., Резникова Ж.И.

Идеи колмогоровской сложности применялись для изучения многих естественных процессов, которые могут быть описаны с помощью последовательностей символов конечного алфавита (текстов). Примерами могут служить генетические последовательности, литературные и музыкальные тексты, коммуникативные взаимодействия животных. Хотя колмогоровская сложность алгоритмически невычислима, в определенном смысле ее можно оценить с помощью сжатия данных. В докладе будет представлен метод анализа последовательностей, основанный на идеях колмогоровской сложности и математической статистики и даны примеры приложения этого метода к биологическим (этологическим) текстам. Принципиальное отличие предложенного метода от других подходов к анализу последовательностей с применением колмогоровской сложности состоит в том, что этот метод находится в рамках математической статистики, точнее, проверки гипотез. Поэтому предложенный метод является перспективным как часть стандартного набора биологических методов для анализа различных естественных “текстов”, от последовательностей ДНК до анализа последовательностей поведенческих актов у животных (поведенческие “паттерны”, или этологические “тексты”). Применение этого метода решает многие важные для биологов проблемы, в частности, позволяет различать “встроенные” (врожденные) и основанные на индивидуальном опыте поведенческие последовательности только путем математического анализа этограмм, без специальных лабораторных изоляционных экспериментов. Это особенно важно для этологических и эволюционных исследований.