Содержание
- 2. Поиск на своём сайте Искать SQLем по своей базе Вы наверное не слышали об альтернативах Использовать
- 3. Ингредиенты поиска
- 4. Поисковый документ Анализ документа: токенизаиця , cтеминг, морфология, cтоп слова Термы id:184647753295609857 author:pledbook tag:grails tag:elasticserach text:look
- 5. Поисковый индекс Типичная RDBMS Инвертированный индекс Индекс по отдельному полю или композитному полю Одно значение на
- 6. Поисковый индекс Типичный поисковый движок Инвертированный индекс Все поля в одном индексе Произвольное количество значений поля
- 7. Поисковый запрос vs SQL SQL cложный запросы / joins детерминированный запрос возвращает данные Поисковый запрос “плоский”
- 8. Open Source Lucene – библиотека / фреймворк - Java Solr – всё в одном, прицел на
- 9. Что нужно хотеть от поиска? Фейсетная навигация авто-таксономия кластеризация Автокоррекция Подсказки (автодополнение) Пространственный поиск в т.ч.
- 10. Фейсеты Динамический набор категорий Число найденых документов по запросу и фильтру Активный фильтры
- 11. Кластеризация Кластеры создаются на основе текста документов
- 12. Автокоррекция n-gram индекс Отдельный индекс для коррекции Нечёткий поиск Работает по основному индексу
- 13. Подсказки Похоже на автокоррекцию. Запрос “дописывается” на основе словаря в индексе и дополняется ключевыми словами на
- 14. Что индексировать? Каталог продуктов Джинсы Levis #559, индиго Джинсы Levis #559, индиго, размер 32x32 Что считать
- 15. Когда индексировать? Поисковые индексы нужно перестраивать Периодическая переиндексация всех документов Динамические атрибуты (пример наличие на складе)
- 16. Индексные сегменты в Lucene Логарифмическое слияние сегментов Самые молодые сегменты можно не спешить писать на диск
- 17. Масштабирование Производительность упирается в CPU сложные запросы могут быть очень CPU-ёмкими решение – несколько реплик индекса
- 18. Масштабирование Объём индекса Индекс должен помещаться в память Решение – партицирование индекса Каждая партиция выполняет скоринг
- 19. Резюме: Lucene Фреймоворк/библиотека Java API (нет сетевого интерфейса) Фундамент построения поисковой системы
- 20. Резюме: Solr Feature reach поиск из коробки Эффективная поддержка фейсетов Кросс платформенные клиент (HTTP) Интеграция со
- 21. Резюме: Sphix Простой и быстрый Интеграция с MySQL Интеграция со многими CMS Базовый поисковый функционал Нет
- 22. Резюме: elasticsearch Управление распределённым индексом Простой HTTP API Иcпользует Lucene Фейсеты Проще в настройке чем Solr
- 23. Резюме: Index tank Index tank появился как поисковый SaaS. После покупки компании, код продукта был опубликован
- 25. Скачать презентацию