Алгоритм построенияоценок весов интентов для многозначных запросов

Слайд 2

Предметная область

Многозначный запрос – запрос, по которому возможны несколько пользовательских интентов (намерений

Предметная область Многозначный запрос – запрос, по которому возможны несколько пользовательских интентов
пользователя).
Примеры: ягуар, наполеон, титаник…
IA-метрики (intent-aware) – метрики качества поиска, учитывающие различные интенты по многозначным запросам.

Слайд 3

Сейчас: Расчёт весов для IA-метрик производится вручную. Асессоры получают небольшой набор случайных

Сейчас: Расчёт весов для IA-метрик производится вручную. Асессоры получают небольшой набор случайных
сессий, должны определить по сессии интент. Доля сессий с данным интентом = вес.
Минусы: ограниченные возможности асессоров, => малое количество сессий по запросу, редкие обновления.
Задача: Придумать и реализовать алгоритм, вычисляющий по заданному на вход запросу набор пользовательских интентов и оценки их весов.

Постановка задачи

Слайд 4

Алгоритм

Формирование множества связанных запросов
Кластеризация
Построение графа запросов и документов
Случайное блуждание по графу
Кластеризация по

Алгоритм Формирование множества связанных запросов Кластеризация Построение графа запросов и документов Случайное
векторам предельных вероятностей документов
Распределение сессий по кластерам и расчёт весов

Слайд 5

Построение графа

Вершины – запросы (Q) и документы (D)
Рёбра:
Q1 -> Q2 (вес =

Построение графа Вершины – запросы (Q) и документы (D) Рёбра: Q1 ->
вероятность переформулировки)
Q -> D (вес = вероятность клика)
Петли D -> D (вес = 1)
Полученный граф – марковская цепь
Документы – конечные состояния

Слайд 6

Результаты

Разработан алгоритм
65% наборов интентов найдено полностью
94% без одного интента
Ошибки в точности в

Результаты Разработан алгоритм 65% наборов интентов найдено полностью 94% без одного интента
среднем <= 0.17
Создан веб-инструмент для запуска и анализа результатов
Утилита для расчёта данных по переформулировкам на кластере MapReduce
Имя файла: Алгоритм-построенияоценок-весов-интентов-для-многозначных-запросов.pptx
Количество просмотров: 89
Количество скачиваний: 0