СЁРЧ. Автоматическая система рекомендаций и подбора контента

Содержание

Слайд 2

Постановка проблемы

В современном мире социальные сети играют важную роль. Они позволяют пользователям

Постановка проблемы В современном мире социальные сети играют важную роль. Они позволяют
получать любую информацию

невозможно

Но ориентироваться в этом потоке почти

Слайд 3

Насколько Вам сложно найти интересную группу ВКонтакте?

Насколько Вам сложно найти интересную группу ВКонтакте?

Слайд 4

Цели и задачи

Создание сервиса, который поможет пользователям в поиске интересных сообществ ВКонтакте
Разработка

Цели и задачи Создание сервиса, который поможет пользователям в поиске интересных сообществ
набора алгоритмов машинного обучения и обработки больших данных, который решал бы задачу рекомендации контента пользователю
Разработка программной архитектуры сервиса и ее реализация

Слайд 5

Гипотеза

Если получится создать сервис рекомендаций контента социальных сетей, то пользователям будет удобнее

Гипотеза Если получится создать сервис рекомендаций контента социальных сетей, то пользователям будет удобнее его получать
его получать

Слайд 6

Краткое описание

Сёрч – система подбора и рекомендаций сообществ ВКонтакте

Работает на технологиях машинного

Краткое описание Сёрч – система подбора и рекомендаций сообществ ВКонтакте Работает на
обучения и обработки больших данных

Используются передовые технологии

Слайд 7

Пример выдачи результатов

Пример выдачи результатов

Слайд 8

Получение данных

Происходит при помощи поискового бота

Необходимо для пополнения базы данных новыми сообществами

Получение данных Происходит при помощи поискового бота Необходимо для пополнения базы данных новыми сообществами

Слайд 9

Принципы работы

Нейрон – наименьший элемент нейронной сети

Нейрон

Суммирование
сигналов

Функция нейрона

Принципы работы Нейрон – наименьший элемент нейронной сети Нейрон Суммирование сигналов Функция нейрона

Слайд 10

Нейронная сеть – множество нейронов, связанных в одно целое. Сейчас они используются

Нейронная сеть – множество нейронов, связанных в одно целое. Сейчас они используются
в самых разных задачах (определение объектов по фото, распознавание речи, её синтез и прочее)
Функции нейронных сетей

Обучение

Обработка данных

Слайд 11

Математический вектор

Вектор – упорядоченное множество элементов
Размерность вектора – количество элементов в нём

 

 

Математический вектор Вектор – упорядоченное множество элементов Размерность вектора – количество элементов в нём

Слайд 12

Автоэнкодер

Энкодер получает на вход вектор и уменьшает его размерность. На выходе получается

Автоэнкодер Энкодер получает на вход вектор и уменьшает его размерность. На выходе
внутреннее представление
Декодер на вход получает от энкодера внутреннее представление входных данных и пытается по ним восстановить сами входные данные
Декодер используется только при обучении нейронной сети

Энкодер

Декодер

Слайд 13

Предобработка текста

Удаляются небуквенные символы
В словах исправляются ошибки
Они принимают начальную форму, маленькие слова

Предобработка текста Удаляются небуквенные символы В словах исправляются ошибки Они принимают начальную
отбрасываются

0. Съешь же ещё этих мяхких французких __-булок да выпей чаю!
Съешь же ещё этих мяхких французких булок да выпей чаю
Съешь же еще этих мягких французских булок да выпей чаю
Есть ещё этот мягкий французский булка пить чай

Слайд 14

Словарь

Есть ещё этот мягкий французский булка

0

Я

1

этот

1

еще

1

1

1

0

1

0

0

есть

мягкий

французский

япония

булка

хлеб

три

Словарь Есть ещё этот мягкий французский булка 0 Я 1 этот 1

Слайд 15

Что дальше?

Получили много текстовых данных (поисковый бот)
Получили их векторное представление (энкодер)
???

Что дальше? Получили много текстовых данных (поисковый бот) Получили их векторное представление (энкодер) ???

Слайд 16

Сходство векторов

 

Сходство векторов

Слайд 17

 

Сходство наших векторов примерно равно 0.94. Чем больше значение – тем выше

Сходство наших векторов примерно равно 0.94. Чем больше значение – тем выше сходство
сходство

Слайд 18

Получение общего вектора сообщества

 

Получение общего вектора сообщества

Слайд 19

Общая архитектура реализации

Общая архитектура реализации

Слайд 20

Оценки пользователей-тестеров

Оценки пользователей-тестеров

Слайд 21

Итоги

Проект, который поможет пользователям в поисках информации, который активно разрабатывается и будет

Итоги Проект, который поможет пользователям в поисках информации, который активно разрабатывается и
готов летом
Произведены различные исследования на темы использования различных алгоритмов, способов обработки, хранения информации и прочие
Изучены и разработаны новые технологии и способы применения уже имеющихся
Разработана архитектура проекта

Слайд 22

Выводы

Нейронные сети стали неотъемлемой частью современной IT индустрии
Они позволяют делать многие интересные

Выводы Нейронные сети стали неотъемлемой частью современной IT индустрии Они позволяют делать
вещи, в том числе и обрабатывать текстовую информацию
Интернет-сообществу можно помочь при помощи создания сервисов подбора и рекомендации контента, а значит, можно помочь и пользователям в самообразовании

Слайд 23

Цели на будущее

Найти средства на несколько мощных серверов
Реализовать сравнение сообществ не только

Цели на будущее Найти средства на несколько мощных серверов Реализовать сравнение сообществ
по тексту постов, но и по другим параметрам (фото и видео, другие медиа)
Разработать алгоритмы создания еженедельных подборок сообществ по тематикам на главной странице
Оптимизировать все процессы получения и обработки информации
Создать красивый и удобный дизайн сайта
Привлечь пользователей

Слайд 24

Спасибо за внимание

Группа проекта ВКонтакте

Спасибо за внимание Группа проекта ВКонтакте