Содержание
- 2. Каталоги библиотек, информационные отделы История ИП (1) 1990-е гг. Библиотекари, специалисты по информации Рядовые пользователи ?
- 3. История ИП (2) Поиск через веб-ссылки (hyperspace) Нет чёткой модели Веба Интерес к ИПС хранилище знаний
- 4. Информационный поиск (Information retrieval) — это процесс поиска в большой коллекции (хранящейся, как правило, в памяти
- 5. User task – IR system (1) М.б. трудно выразить словами… Капустин В. А. Основы поиска информации
- 6. User task – IR system (2)
- 7. Классификация ИПС по масштабу действия Веб-поиск Сбор документов Противодействие SEO Персональный поиск (personal IR) Все форматы
- 8. Baeza-Yates R., Ribeiro-Neto B. Modern Information Retrieval // 1. Introduction. — Addison-Wesley, 1999. — ISBN 0-201-39829-X
- 9. Релевантность (1), оценка ИПС Релевантность - степень соответствия документа запросу (инф-й потребности) Оценка ИПС – эмпирическая:
- 10. Релевантность (2) Удовлетворение пользователя: 0. Скорость ответа Размер индекса Интерфейс (удобство, наглядность, скорость отклика) Маннинг К.,
- 11. Релевантность (3), тестовая коллекция Коллекция документов Набор тестовых инф-х потребностей (запросов), min 50 Набор оценок релевантности
- 12. Стандартные тестовые коллекции Коллекция Cranfield, 1950-60 1398 аннотаций статей 225 запросов Оценки рел-ти (запрос-документ) Text Retrieval
- 13. Набор коллекций РОМИП 2010 г.
- 14. ? ? Релевантность (4) Релевантность Информационная потребность Запрос
- 15. Релевантность (5) Информационная потребность Запрос Правда ли, что красное вино более эффективно снижает риск сердечных приступов,
- 16. Релевантность (6) Информационная потребность Запрос Правда ли, что красное вино более эффективно снижает риск сердечных приступов,
- 17. User task – IR system User information need -> Query Keywords + regular expressions (%, *,
- 18. гонка спешка, торопливость автогонки, мотогонки компьютерная игра, автосимулятор комп. состояние гонки гонка // Русский Викисловарь, 2012,
- 19. User task – IR system Трудность: нечёткий запрос «гонка» Автоспорт Париж-Дакар Навигация GPS Browsing? Сёрфинг? –
- 20. Pull Information (Data) Retrieval and Browsing: Pull & Push ИПС Гипертекстовые системы. Примеры? Push ?
- 21. новостной агент; Internet change detection and notification (Google alert - подписка) спам Pull Information (Data) Retrieval
- 22. Представление документа Весь текст (самое полное предст-е) список всех слов Если упрощение, уменьш. Stopwords, Stemming (Нормализация
- 23. Нормализация текста (1): предобработка Синтез речи Машинный перевод Сохранение в базе данных Сравнение текстов (сортировка, индекс)
- 24. Нормализация текста (2): Этапы Нормализация юникода tolower() || toupper() Digits → words Удаление ударений, диакритики Удаление
- 25. Шумовые слова – слишком общие слова (stop words) Общие предлоги, союзы, междометия, цифры, частицы (зависят от
- 26. Нормализация слов (стемминг) нахождение основы слова для заданного исходного слова (не обязательно «корень»). «Портер»: A. Лемматизация
- 27. Представление документа Весь текст (самое полное предст-е) Список всех слов Список нормализованных слов Индекс (слово ->
- 28. Представление документа Baeza-Yates R., Ribeiro-Neto B. Modern Information Retrieval // 1. Introduction. — Addison-Wesley, 1999. —
- 29. Архитектура ИПС (упрощ., обобщ.) Baeza-Yates R., Ribeiro-Neto B. Modern Information Retrieval // 1. Introduction. — Addison-Wesley,
- 30. Литература Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. — Вильямс, 2011. — ISBN
- 32. Скачать презентацию