Метод скользящего контроля для оценки качества рекомендательных интернет-сервисов

Март 2, 2021

Главная
Разное
Метод скользящего контроля для оценки качества рекомендательных интернет-сервисов

Содержание

2. Содержание Постановка задачи Мотивация Примеры моделей рекомендательных систем User-based RS Item-based RS Выбор меры (метрики) сходства
3. Постановка задачи Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию Оценка (проверка) качества рекомендаций
4. Мотивация Существует огромное количество РС Требуются эффективные алгоритмы Время выполнения Качество рекомендаций Количество ошибок и полнота
5. User-based RS целевой пользователь - предметы, которые он оценивал - сходство с пользователем - top-n ближайших
6. Item-based RS целевой пользователь - предметы, которые он оценивал - сходство товара i с товаром j
7. Пример User-based RS
8. Выбор меры (метрики) сходства Сходство, основанное на расстоянии: Евклида Хемминга Корреляция как сходство: коэффициент Пирсона Косинусная
9. Корреляция Пирсона Недостатки не определена на векторах с постоянными значениями: (4,4,4,...,4) теряются рекомендации a=(0,5,5,4) b=(0,4,5,0)
10. Методика сравнения Метрики качества: точность и полнота рекомендаций Скользящий контроль (кросс-валидация)
11. Точность и полнота Полнота – число релевантных рекомендаций к числу всех выбранных пользователем товаров Точность –
12. Скользящий контроль Разбиение на тестовую и обучающую выборки: Сокрытие признаков для тестирования рекомендаций: Вычисление точности и
13. Точность и полнота: раскрытие неопределенностей else
14. Алгоритм Параметры: test% - размер тестового множества hidden% - размер скрытого множества признаков p – число
15. Данные MovieLens и Yahoo MovieLens 100K dataset: 943 пользователя 1,682 фильма Каждый оценил как минимум 20
16. Результаты
17. Результаты
18. Результаты
19. Результаты
20. Результаты
21. Результаты
22. Результаты
23. Выводы и дальнейшая работа Предложенная методика позволяет оценить качество работы рекомендательной системы вне зависимости от выбора
25. Скачать презентацию

Содержание
Постановка задачи
Мотивация
Примеры моделей рекомендательных систем
User-based RS
Item-based RS
Выбор меры (метрики) сходства
Методика сравнения
Данные MovieLens

и Yahoo
Результаты
Выводы и дальнейшая работа

Постановка задачи
Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию
Оценка (проверка)

качества рекомендаций

Мотивация
Существует огромное количество РС
Требуются эффективные алгоритмы
Время выполнения
Качество рекомендаций
Количество ошибок и полнота рекомендаций

User-based RS
целевой пользователь
- предметы, которые он оценивал
- сходство

с пользователем
- top-n ближайших к
нему соседей, n определяет
- пользователи из ,
которые оценили предмет i
- оценка предмета i пользователем u
предсказанная системой оценка для целевого пользователя:

Слайд 6

Item-based RS
целевой пользователь
- предметы, которые он оценивал
- сходство

товара i с товаром j
- top-n ближайших к нему
товаров, top-n определяет
- для
- оценка предмета i пользователем u
предсказанная системой оценка для целевого
пользователя:

Слайд 7

Пример
User-based RS

Слайд 8

Выбор меры (метрики) сходства
Сходство, основанное на расстоянии:
Евклида
Хемминга
Корреляция как сходство:
коэффициент Пирсона
Косинусная мера
Коэффициент

Жаккара

Слайд 9

Корреляция Пирсона

Недостатки
не определена на векторах с постоянными значениями: (4,4,4,...,4)
теряются рекомендации

a=(0,5,5,4)
b=(0,4,5,0)

Слайд 10

Методика сравнения
Метрики качества: точность и полнота рекомендаций
Скользящий контроль (кросс-валидация)

Слайд 11

Точность и полнота
Полнота – число релевантных рекомендаций к числу всех выбранных пользователем

товаров
Точность – число релевантных к числу всех рекомендаций

Слайд 12

Скользящий контроль
Разбиение на тестовую и обучающую выборки:
Сокрытие признаков для тестирования рекомендаций:
Вычисление точности

и полноты для
на признаках :

Слайд 13

Точность и полнота: раскрытие неопределенностей
else

Слайд 14

Алгоритм
Параметры:
test% - размер тестового множества
hidden% - размер скрытого множества признаков
p – число

повторений разбиения на тестовое и обучающее множество
q – число повторений разбиения на оцененное и неоцененное множества признаков
Выход: средние значения точности и полноты по множеству Utest и Ihidden

Слайд 15

Данные MovieLens и Yahoo
MovieLens 100K dataset:
943 пользователя
1,682 фильма
Каждый оценил как минимум 20

фильмов, всего 100,000 оценок
Yahoo binary dataset:
2,000 фирм
3,000 рекламных словосочетаний
92,345 ненулевых ячеек

Слайд 16

Результаты

Слайд 17

Результаты

Слайд 18

Результаты

Слайд 19

Результаты

Слайд 20

Результаты

Слайд 21

Результаты

Слайд 22

Результаты

Слайд 23

Выводы и дальнейшая работа
Предложенная методика позволяет оценить качество работы рекомендательной системы вне

зависимости от выбора метода
По-видимому, впервые в экспериментах исследуется точность и полнота в зависимости от количества скрытых признаков
Для сравнения методов необходимо проведение аналогичных экспериментов для более совершенных моделей РС, например, основанных на бикластеризации

Метод скользящего контроля для оценки качества рекомендательных интернет-сервисов

Содержание

СодержаниеПостановка задачиМотивацияПримеры моделей рекомендательных системUser-based RSItem-based RSВыбор меры (метрики) сходстваМетодика сравненияДанные MovieLens

Постановка задачиЗная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендациюОценка (проверка)

МотивацияСуществует огромное количество РСТребуются эффективные алгоритмыВремя выполненияКачество рекомендацийКоличество ошибок и полнота рекомендаций

User-based RSцелевой пользователь - предметы, которые он оценивал - сходство

Item-based RSцелевой пользователь - предметы, которые он оценивал - сходство

ПримерUser-based RS

Выбор меры (метрики) сходства Сходство, основанное на расстоянии:Евклида ХеммингаКорреляция как сходство:коэффициент ПирсонаКосинусная мераКоэффициент

Корреляция Пирсона Недостаткине определена на векторах с постоянными значениями: (4,4,4,...,4)теряются рекомендации

Методика сравнения Метрики качества: точность и полнота рекомендацийСкользящий контроль (кросс-валидация)

Точность и полнотаПолнота – число релевантных рекомендаций к числу всех выбранных пользователем

Скользящий контрольРазбиение на тестовую и обучающую выборки:Сокрытие признаков для тестирования рекомендаций:Вычисление точности

Точность и полнота: раскрытие неопределенностейelse

АлгоритмПараметры:test% - размер тестового множестваhidden% - размер скрытого множества признаковp – число

Данные MovieLens и Yahoo MovieLens 100K dataset:943 пользователя1,682 фильмаКаждый оценил как минимум 20

Результаты

Результаты

Результаты

Результаты

Результаты

Результаты

Результаты

Выводы и дальнейшая работаПредложенная методика позволяет оценить качество работы рекомендательной системы вне

Похожие презентации

Содержание
Постановка задачи
Мотивация
Примеры моделей рекомендательных систем
User-based RS
Item-based RS
Выбор меры (метрики) сходства
Методика сравнения
Данные MovieLens

Постановка задачи
Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию
Оценка (проверка)

Мотивация
Существует огромное количество РС
Требуются эффективные алгоритмы
Время выполнения
Качество рекомендаций
Количество ошибок и полнота рекомендаций

User-based RS
целевой пользователь
- предметы, которые он оценивал
- сходство

Item-based RS
целевой пользователь
- предметы, которые он оценивал
- сходство

Пример
User-based RS

Выбор меры (метрики) сходства
Сходство, основанное на расстоянии:
Евклида
Хемминга
Корреляция как сходство:
коэффициент Пирсона
Косинусная мера
Коэффициент

Корреляция Пирсона

Недостатки
не определена на векторах с постоянными значениями: (4,4,4,...,4)
теряются рекомендации

Методика сравнения
Метрики качества: точность и полнота рекомендаций
Скользящий контроль (кросс-валидация)

Точность и полнота
Полнота – число релевантных рекомендаций к числу всех выбранных пользователем

Скользящий контроль
Разбиение на тестовую и обучающую выборки:
Сокрытие признаков для тестирования рекомендаций:
Вычисление точности

Точность и полнота: раскрытие неопределенностей
else

Алгоритм
Параметры:
test% - размер тестового множества
hidden% - размер скрытого множества признаков
p – число

Данные MovieLens и Yahoo
MovieLens 100K dataset:
943 пользователя
1,682 фильма
Каждый оценил как минимум 20

Выводы и дальнейшая работа
Предложенная методика позволяет оценить качество работы рекомендательной системы вне