Применение генетического алгоритма для повышения качества работы поисковых систем

Раздел находится в стадии актуализации

Проблема поиска информации в неструктурированном массиве данных актуальна, так как в неструктурированной информация содержится уникальный потенциал для извлечения новых знаний. Сложность обработки неструктурированных данных определяется их разнообразием, сильной контекстной зависимостью и динамичностью. Объемы хранимых и передаваемых данных увеличиваются с каждым годом. Количество параметров, характеризующих данные, также неизменно растет. Существующие алгоритмы информационно-поисковых систем не предоставляют гибкого функционала для поиска по различным коллекциям документов или веб-страниц. Сложность тематического поиска в заданном сегменте документов связана с необходимостью предварительной настройки параметров математических моделей поисковых систем. Цель настоящей работы - определение значений параметров, которые позволяют повысить релевантность результата поискового запроса. Рассмотрены использование генетического алгоритма и его работа, операции мутации и кроссинговера, определены вероятностные значения для каждой из операций. Хромосомы в данном исследовании - числовые значения коэффициентов, представленные в двоичном виде. По результатам работы генетического алгоритма получены значения корректирующих коэффициентов для трех семейств поисковых систем: Apache Lucene, Xapian, Sphinx. На контрольных выборках проведена оценка метрик качества работы каждой из поисковых систем: точность, полнота, aккуратность, F-мера и ошибки. В результате применения генетического алгоритма наблюдается увеличение значений метрик от 7 до 15 % и уменьшение ошибки поиска от 15 до 50 %, что подтверждает уместность его использования для повышения корректности работы поисковых систем.
Беляев Игорь Валериевич
Национальный исследовательский университет «МИЭТ», г. Москва, Россия
Федоров Алексей Роальдович
Национальный исследовательский университет «МИЭТ», г. Москва, Россия
Гагарина Лариса Геннадьевна
Национальный исследовательский университет «МИЭТ», г. Москва, Россия

124498, г. Москва, г. Зеленоград, площадь Шокина, дом 1, МИЭТ, ауд. 7231

+7 (499) 734-62-05
magazine@miee.ru