Информационно-поисковая система. Современные алгоритмы работы с информацией

Содержание

Слайд 2

Назначение информационно-поисковой системы (ИПС)

ИПС предназначена для организации полнотекстового (с учетом морфологии языка) и

Назначение информационно-поисковой системы (ИПС) ИПС предназначена для организации полнотекстового (с учетом морфологии
семантического (по смыслу) поиска документов в архивных фондах.
Функциональные возможности, предоставляемые Системой доступны для населения, органов государственной власти, органов местного самоуправления и юридических лиц.

Общение с системой на естественном языке

Поиск и предоставление информации из различных источников, с учетом ролевой модели прав доступа

Общение с системой на естественном языке

Открытые интерфейсы
и протоколы взаимодей- ствия с внешними инфор- мационными системами

Сокращение временных и трудовых затрат

Эффективные алгоритмы индексирования материалов

Снижение времени на анализ запросов
пользователей и поиска информации

Расширение спектра электронных услуг

2. 3.

Обеспечение самостоятельного доступа к документам

1.

Слайд 3

Среда взаимодействия поисково-аналитической системы

Анализ формы слов, их значений, связей и контекста.

Ранжирование результатов

Среда взаимодействия поисково-аналитической системы Анализ формы слов, их значений, связей и контекста.
поиска на основе смысла слов, предложений и контекста.

ПОИСКОВЫЕ ИНДЕКСЫ/ АЛГОРИТМЫ
ABBYY Intelligent Search
Проведение синтаксического разбора поискового запроса для поиска необходимых документов.

ИСТОЧНИКИ ДАННЫХ
ЕАИС РТ

Файловые хранилища

Электронные архивы

СЭД

АНАЛИТИКА

ВЗАИМОДЕЙСТВИЕ С ПОЛЬЗОВАТЕЛЕМ
Информационно-поисковая система

Аналитические системы/СППР

ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА

ПОЛЬЗОВАТЕЛИ

Слайд 4

Характеристика объекта автоматизации

В основу структуры Системы заложен модульный принцип организации, обеспечивающий возможность

Характеристика объекта автоматизации В основу структуры Системы заложен модульный принцип организации, обеспечивающий
встраивания дополнительных подсистем (модулей) и взаимодействия с другими информационными системами.

Инструменты отображения анализа данных
Поддержка принятия решения Построение ретроспективы

ПОИСКОВЫЕ ИНДЕКСЫ/ АЛГОРИТМЫ
Информационное взаимодействие с внешними системами – поставщи- ками данных для Системы
Извлечение текста из документов/ создание поисковых индексов
Анализ запроса Поиск информации

ВЗАИМОДЕЙСТВИЕ С ПОЛЬЗОВАТЕЛЕМ
Формирование поисковых запросов
Отображение результатов поиска
Фильтрация, сортировка результатов поиска
Просмотр найденных документов

АНАЛИТИКА

Слайд 5

Интерфейс пользователя

Управление сортировкой результатов

Фрагмент найденного документа

Данные о месте хранения информации (источнике)

Область формирования поискового

Интерфейс пользователя Управление сортировкой результатов Фрагмент найденного документа Данные о месте хранения
запроса

1

2

3

4

Область дополнительной фильтрации результатов

Область
экспресс-аналитики

5

6

Слайд 6

Результаты полнотекстового поиска

Найдено:

3

Результаты полнотекстового поиска Найдено: 3

Слайд 7

Результаты семантического поиска

Найдено:

89

При семантическом поиске количество найденных документов увеличилось в 30 (!)

Результаты семантического поиска Найдено: 89 При семантическом поиске количество найденных документов увеличилось в 30 (!) раз.
раз.

Слайд 8

Сравнение реализованных алгоритмов поиска

ПОЛНОТЕКСТОВЫЙ ПОИСК

СЕМАНТИЧЕСКИЙ ПОИСК

Поиск конкретного документа по существенной его части
В

Сравнение реализованных алгоритмов поиска ПОЛНОТЕКСТОВЫЙ ПОИСК СЕМАНТИЧЕСКИЙ ПОИСК Поиск конкретного документа по
результатах поиска с учетом морфологии учитываются перечисленные ниже критерии в порядке убывания важности:
форма слов в запросе;
порядок следования слов в запросе; близость слов из запроса в документе;
слова, которые встречаются во многих документах,
по которым проводится поиск, учитываются с меньшим приоритетом по сравнению со специфичными терминами;
частота слов из запроса в найденном документе;
частота слов из запроса в документах данного поискового индекса

Поиск документов близких по смыслу к тексту запроса
В результатах семантического поиска учитываются следующие критерии:
только те слова в документе, которые имеют такой же смысл, как и слова поискового запроса;
все критерии ранжирования, которые применяются при полнотекстовом поиске (с учетом морфологии);
связь между словами в запросе и в документе; синонимы слов в запросе;
гиперонимы (обобщения) слов в запросе; приоритет синонимов над гиперонимами