кол-во купленных за всю историю продуктов. В результате будем иметь для каждого пользователя такую картину: Повторим эту операцию 100 000 раз (для каждого пользователя) и преобразовав к итоговому виду, получим скор 0.27841.
Это будет наш эталон, к нему мы будем стремиться, однако мы не можем назвать такой подход рекомендательной системой, ведь мы ничего нового не предлагаем пользователю, а принимаем в учет только те товары, про которые он сам прекрасно знает и, более того, любит, т к это его топ.
LightFM
(Матрица формируется не из конкретных данных, а из их индексов)
Нельзя просто так взять и сделать матрицу из списка продуктов/пользователей, необходим маппинг по индексам.
При создании модели можно настраивать и изменять: (функцию потерь, специальные доп. фичи, кол-во эпох обучения, кол-во ядер процессора)
Лучший скор - 0.05358
Ходят слухи, что алгоритм может быть довольно эффективен при правильной подготовке тех самых фичей.
Первичный анализ и «Наивный алгоритм»