Содержание
- 2. Обзор доклада Что такое классификация запросов? Типы источников данных Классификация на примере цитатных запросов Классификация на
- 3. Что такое классификация? Объединяем в классы запросы, которые имеют определённые признаки. Признаками может быть что угодно:
- 4. Источники данных Сами запросы «Мы все учились понемногу чему-нибудь и как-нибудь» - интуитивно подозреваем, что это
- 5. Цитатные запросы: обзор Определяем, что такое для нас цитата Создаём модель: - придумываем гипотезы-признаки - используем
- 6. Цитаты: придумываем гипотезы Созерцаем: каравай-каравай кого хочешь выбирай Не уходи из сна моего. Сейчас ты так
- 7. Цитаты: придумываем гипотезы Длина запроса Наличие знаков препинания - абсолютное количество - наличие конкретных знаков препинания
- 8. Цитаты: обучаем Можно посмотреть на информативность каждого признака Повторяющиеся слова Местоимения Троеточие Капитализация запроса
- 9. Цитаты: обучаем
- 10. Цитаты: итоговые признаки Есть ли в запросе личные местоимения Число слов запроса (2, 3, 4, 5,
- 11. Цитаты: оцениваем результаты
- 12. Навигационные запросы: обзор Проблемы Традиционные источники информации Навигационные запросы для suggest Создаём модель: признак click entropy
- 13. Навигационные запросы: проблемы Навигационные запросы могут иметь видимые признаки: - url-like запросы: www.rambler.ru - специфическая лексика
- 14. Навигационные запросы: традиционные подходы Источник информации – клики. Например, сlick distribution Тексты ссылок: anchorlink distribution Признаки
- 15. Навигационные запросы:suggest Важна точность!
- 16. Навигационные запросы: модель Query url-like yes no special search click entropy yes no looking for pereformulations
- 17. Навигационные запросы: click entropy Кликовые признаки сильно зависят от качества поисковика. Если нужный результат поиска не
- 18. Навигационные запросы: click entropy + lexical and url_features click entropy даёт примерно 70% точности – мало!
- 19. Навигационные запросы: расширяем переформулировками По пользовательским сессиям объединяем запросы в кластеры, которые Содержат query в качестве
- 20. Навигационные запросы: переформулировки + фильтрация Входные данные: число таких переформулировок общие слова (минус география) среднее число
- 21. Навигационные запросы:результаты
- 22. Итого В задачах классификации выбор данных и модели зависят от задачи Очень интересные возможности предоставляют «пользовательские»
- 24. Скачать презентацию