Метод скользящего контроля для оценки качества рекомендательных интернет-сервисов

Содержание

Слайд 2

Содержание

Постановка задачи
Мотивация
Примеры моделей рекомендательных систем
User-based RS
Item-based RS
Выбор меры (метрики) сходства
Методика сравнения
Данные MovieLens

Содержание Постановка задачи Мотивация Примеры моделей рекомендательных систем User-based RS Item-based RS
и Yahoo
Результаты
Выводы и дальнейшая работа

Слайд 3

Постановка задачи

Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию
Оценка (проверка)

Постановка задачи Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию Оценка (проверка) качества рекомендаций
качества рекомендаций

Слайд 4

Мотивация

Существует огромное количество РС
Требуются эффективные алгоритмы
Время выполнения
Качество рекомендаций
Количество ошибок и полнота рекомендаций

Мотивация Существует огромное количество РС Требуются эффективные алгоритмы Время выполнения Качество рекомендаций

Слайд 5

User-based RS

целевой пользователь
- предметы, которые он оценивал
- сходство

User-based RS целевой пользователь - предметы, которые он оценивал - сходство с
с пользователем
- top-n ближайших к
нему соседей, n определяет
- пользователи из ,
которые оценили предмет i
- оценка предмета i пользователем u
предсказанная системой оценка для целевого пользователя:

Слайд 6

Item-based RS

целевой пользователь
- предметы, которые он оценивал
- сходство

Item-based RS целевой пользователь - предметы, которые он оценивал - сходство товара
товара i с товаром j
- top-n ближайших к нему
товаров, top-n определяет
- для
- оценка предмета i пользователем u
предсказанная системой оценка для целевого
пользователя:

Слайд 7

Пример

User-based RS

Пример User-based RS

Слайд 8

Выбор меры (метрики) сходства

Сходство, основанное на расстоянии:
Евклида
Хемминга
Корреляция как сходство:
коэффициент Пирсона
Косинусная мера
Коэффициент

Выбор меры (метрики) сходства Сходство, основанное на расстоянии: Евклида Хемминга Корреляция как
Жаккара

Слайд 9

Корреляция Пирсона


Недостатки
не определена на векторах с постоянными значениями: (4,4,4,...,4)
теряются рекомендации

Корреляция Пирсона Недостатки не определена на векторах с постоянными значениями: (4,4,4,...,4) теряются рекомендации a=(0,5,5,4) b=(0,4,5,0)
a=(0,5,5,4)
b=(0,4,5,0)

Слайд 10

Методика сравнения

Метрики качества: точность и полнота рекомендаций
Скользящий контроль (кросс-валидация)

Методика сравнения Метрики качества: точность и полнота рекомендаций Скользящий контроль (кросс-валидация)

Слайд 11

Точность и полнота

Полнота – число релевантных рекомендаций к числу всех выбранных пользователем

Точность и полнота Полнота – число релевантных рекомендаций к числу всех выбранных
товаров
Точность – число релевантных к числу всех рекомендаций

Слайд 12

Скользящий контроль

Разбиение на тестовую и обучающую выборки:
Сокрытие признаков для тестирования рекомендаций:
Вычисление точности

Скользящий контроль Разбиение на тестовую и обучающую выборки: Сокрытие признаков для тестирования
и полноты для
на признаках :

Слайд 13

Точность и полнота: раскрытие неопределенностей

else

Точность и полнота: раскрытие неопределенностей else

Слайд 14

Алгоритм

Параметры:
test% - размер тестового множества
hidden% - размер скрытого множества признаков
p – число

Алгоритм Параметры: test% - размер тестового множества hidden% - размер скрытого множества
повторений разбиения на тестовое и обучающее множество
q – число повторений разбиения на оцененное и неоцененное множества признаков
Выход: средние значения точности и полноты по множеству Utest и Ihidden

Слайд 15

Данные MovieLens и Yahoo

MovieLens 100K dataset:
943 пользователя
1,682 фильма
Каждый оценил как минимум 20

Данные MovieLens и Yahoo MovieLens 100K dataset: 943 пользователя 1,682 фильма Каждый
фильмов, всего 100,000 оценок
Yahoo binary dataset:
2,000 фирм
3,000 рекламных словосочетаний
92,345 ненулевых ячеек

Слайд 16

Результаты

Результаты

Слайд 17

Результаты

Результаты

Слайд 18

Результаты

Результаты

Слайд 19

Результаты

Результаты

Слайд 20

Результаты

Результаты

Слайд 21

Результаты

Результаты

Слайд 22

Результаты

Результаты

Слайд 23

Выводы и дальнейшая работа

Предложенная методика позволяет оценить качество работы рекомендательной системы вне

Выводы и дальнейшая работа Предложенная методика позволяет оценить качество работы рекомендательной системы
зависимости от выбора метода
По-видимому, впервые в экспериментах исследуется точность и полнота в зависимости от количества скрытых признаков
Для сравнения методов необходимо проведение аналогичных экспериментов для более совершенных моделей РС, например, основанных на бикластеризации
Имя файла: Метод-скользящего-контроля-для-оценки-качества-рекомендательных-интернет-сервисов.pptx
Количество просмотров: 29
Количество скачиваний: 0