Машинное обучение. Линейная регрессия и переобучение. Алгоритм применения ML к задачам

Содержание

Слайд 2

План
курса

Машинное обучение (3 занятия)
Нейронные сети (2 занятия)
Сверточные нейронные сети (2 занятия)
Детекция (1

План курса Машинное обучение (3 занятия) Нейронные сети (2 занятия) Сверточные нейронные
занятие)
Сегментация (1 занятие)
GAN (1 занятие)
Гостевая лекция (1 занятие)
Практическое занятие по CNN (1 занятие)
Kaggle (1 занятие)

Слайд 3

План
лекции

Типы задач машинного обучения
Обучение с учителем
KNN
Обучение моделей
Линейная регрессия и переобучение
Алгоритм применения ML

План лекции Типы задач машинного обучения Обучение с учителем KNN Обучение моделей
к задачам

Слайд 4

Типы задач машинного обучения

Типы задач машинного обучения

Слайд 6

Unsupervised learning

Кластеризация. Применение на практике: разделение аудитории на группы с общими интересами

Unsupervised learning Кластеризация. Применение на практике: разделение аудитории на группы с общими интересами для эффективной рекламы.
для эффективной рекламы.

Слайд 7

Reinforcement learning

Reinforcement Learning основан на том, что алгоритм за каждое свое действие

Reinforcement learning Reinforcement Learning основан на том, что алгоритм за каждое свое
получает награду или наказание.
AlphaGo сыграл сам с собой миллионы партий.

Слайд 8

Обучение с учителем

Обучение с учителем

Слайд 9

Обучение с учителем (supervised learning)

X - множество объектов
Y - множество ответов

истинная зависимость.

Обучающий

Обучение с учителем (supervised learning) X - множество объектов Y - множество
датасет - множество наборов из фичей и значений целевой переменной. Мы обозначим его .

Слайд 10

Обучение с учителем (supervised learning)

Типы признаков (features):

Числовые (Numerical)
Категориальные (Categorical)
Порядковые (Ordinal)
Типы задач:
Классификация (Classification)
Регрессия

Обучение с учителем (supervised learning) Типы признаков (features): Числовые (Numerical) Категориальные (Categorical)
(Regression)
Ранжирование (Ranking)

(числа упорядочены)

Слайд 11

Примеры задач (Ирисы Фишера)

Какая это задача?
Какие есть признаки?

Примеры задач (Ирисы Фишера) Какая это задача? Какие есть признаки?

Слайд 12

Примеры задач (Ирисы Фишера)

Какая это задача?
.
Задача классификации.
Какие есть признаки?
.
Есть

Примеры задач (Ирисы Фишера) Какая это задача? . Задача классификации. Какие есть
только числовые признаки.

Слайд 13

Примеры задач (Цена дома)

Какая это задача?
Какие есть признаки?

Нужно предсказать стоимость дома. Есть

Примеры задач (Цена дома) Какая это задача? Какие есть признаки? Нужно предсказать
обучающий датасет со следующими признаками:
Удаленность от метро.
Оценка состояния дома (плохое, среднее, хорошее, отличное).
Количество комнат.
Площадь.
Год строительства.
Название района, в котором находится дом.

Слайд 14

Примеры задач (Цена дома)

Какая это задача?
.
Задача регрессии.
Какие есть признаки?
Числовые, порядковые,

Примеры задач (Цена дома) Какая это задача? . Задача регрессии. Какие есть
категориальные.

Нужно предсказать стоимость дома. Есть обучающий датасет со следующими признаками:
Удаленность от метро.
Оценка состояния дома (плохое, среднее, хорошее, отличное).
Количество комнат.
Площадь.
Год строительства.
Название района, в котором находится дом.

Слайд 15

Примеры задач (Поисковая выдача)

Какая это задача?
Какие есть признаки?

Получив запрос от пользователя нужно

Примеры задач (Поисковая выдача) Какая это задача? Какие есть признаки? Получив запрос
найти наиболее полезные документы из некоторой базы.
Что нам известно:
Запрос пользователя.
Текст документа.
Какие ключевые слова есть в каждом документе.
Насколько каждый документ популярен.
итд.

Слайд 16

Примеры задач (Поисковая выдача)

Какая это задача?
Задача ранжирования.
Какие есть признаки?
Данные намного сложнее и

Примеры задач (Поисковая выдача) Какая это задача? Задача ранжирования. Какие есть признаки?
требуют предобработки.

Получив запрос от пользователя нужно найти наиболее полезные документы из некоторой базы.
Что нам известно:
Запрос пользователя.
Текст документа.
Какие ключевые слова есть в каждом документе.
Насколько каждый документ популярен.
итд.

(числа упорядочены)

Слайд 18

K-Nearest Neighbors

Images from https://www.unite.ai/what-is-k-nearest-neighbors

Решение задачи классификации:
Обучение: Просто запоминаем обучающую выборку.
Предсказание:
Получаем точку х,

K-Nearest Neighbors Images from https://www.unite.ai/what-is-k-nearest-neighbors Решение задачи классификации: Обучение: Просто запоминаем обучающую
в которой надо сделать предсказание.
Ищем k ближайших соседей.
В качестве ответа возвращаем класс, которого больше всего среди соседей.

Слайд 19

Curse of Dimensionality

В KNN мы делаем очень слабое предположение: близкие точки будут

Curse of Dimensionality В KNN мы делаем очень слабое предположение: близкие точки
иметь близкие ответы.
При большой размерности данных в близкую область попадет мало объектов.

Два признака

Три признака

Десятки признаков

Слайд 20

Feature Scale

Если в качестве метрики взять обычное расстояние между векторами, то возникает

Feature Scale Если в качестве метрики взять обычное расстояние между векторами, то
проблема масштаба признаков.
Пример:
Задача определения стоимости дома по признакам:
Расстояние до метро в метрах
Количество комнат
Количество комнат почти не будет влиять на
предсказание

Слайд 21

Обучение моделей

Обучение моделей

Слайд 22

Обучение с учителем (supervised learning)

Наша задача - найти функцию хорошо приближающую реальную

Обучение с учителем (supervised learning) Наша задача - найти функцию хорошо приближающую

зависимость .
Назовем такое решение (эта функция должна быть вычислима на компьютере).
Обычно мы выбираем решение из некоторого параметризованного семейства.

множество параметров.

Слайд 23

Пример семейства моделей (функции порога)

Задача: определить, можно ли ребенку пройти на аттракцион?

Пример семейства моделей (функции порога) Задача: определить, можно ли ребенку пройти на
Причем мы знаем его рост и возраст.
Множество, в котором мы будем искать решения состоит из функций вида:
Параметр в данном случае . А множество возможных значений параметра .

Слайд 24

Обучение с учителем (supervised learning)

Обучение -- процесс выбора параметра , которому соответствует

Обучение с учителем (supervised learning) Обучение -- процесс выбора параметра , которому
наиболее подходящее нам решение задачи .

Слайд 25

Обучение с учителем (supervised learning)

Как обучать алгоритм (подбирать оптимальные параметры)?

Обучение с учителем (supervised learning) Как обучать алгоритм (подбирать оптимальные параметры)?

Слайд 26

Обучение с учителем (supervised learning)

Функция потерь (loss):
Определим функцию , ее значение показывает

Обучение с учителем (supervised learning) Функция потерь (loss): Определим функцию , ее
насколько сильно наше предсказание отличается от реального значения.
Пример:
Задача предсказания цены дома из предыдущих примеров.
Возможные функции потерь:

--- квадратичная функция потерь

--- абсолютная функция потерь

Слайд 27

Обучение с учителем (supervised learning)

Эмпирический риск:
Определим эмпирический риск как среднее значение функции

Обучение с учителем (supervised learning) Эмпирический риск: Определим эмпирический риск как среднее
потерь на обучающем датасете.
Часто функцию эмпирического риска также называют лоссом.
Обучение:

(Это просто математическое определение. Конкретный алгоритм получения лучшего параметра для каждой модели свой.)

Слайд 28

Линейная регрессия и переобучение

Линейная регрессия и переобучение

Слайд 29

Переобучение для линейной регрессии

Вспомним как выглядит линейная регрессия:
Обучение линейной регрессии:
Классически в

Переобучение для линейной регрессии Вспомним как выглядит линейная регрессия: Обучение линейной регрессии:
качестве лосса берут Mean Squared Error (среднее квадратов ошибок)

Слайд 30

Переобучение для линейной регрессии

Вспомним как выглядит линейная регрессия:
Polynomial Regression:
Пусть у нас

Переобучение для линейной регрессии Вспомним как выглядит линейная регрессия: Polynomial Regression: Пусть
изначально есть только один признак x. Создадим новые:
Тогда линейная регрессия от таких признаков называется полиномиальной:

Слайд 31

Переобучение для линейной регрессии

Переобучение для линейной регрессии

Слайд 32

Переобучение (KNN)

Если в алгоритме KNN мы возьмем k = 1, то получим

Переобучение (KNN) Если в алгоритме KNN мы возьмем k = 1, то
идеальные предсказания на всем обучающем датасете и эмпирический риск (средний лосс) будет равен 0.
Но такие предсказания могут быть очень плохими.

Слайд 33

Как определить термин переобучение и потом находить его?

Как определить термин переобучение и потом находить его?

Слайд 34

Разделение на Train/Validation/Test

Train - данные для обучения.
Validation - данные для итеративной оценки

Разделение на Train/Validation/Test Train - данные для обучения. Validation - данные для
качества.
Test - данные для финальной оценки качества.
Часто можно опустить test часть. В этом случае название validation dataset и test dataset значат одно и то же.

Слайд 35

Разделение на Train/Validation/Test

Переобучение - ситуация, когда качество модели на train данных значительно

Разделение на Train/Validation/Test Переобучение - ситуация, когда качество модели на train данных
лучше, чем на validation/test.

-точка из test датасета

-точка из train датасета

Слайд 36

Cross-validation

Выполняем обучение для каждого из 5 сплитов.

Итоговая оценка качества

Cross-validation Выполняем обучение для каждого из 5 сплитов. Итоговая оценка качества

Слайд 37

Алгоритм применения ML

Алгоритм применения ML

Слайд 38

Решение задачи

Решение задачи
Имя файла: Машинное-обучение.-Линейная-регрессия-и-переобучение.-Алгоритм-применения-ML-к-задачам.pptx
Количество просмотров: 48
Количество скачиваний: 0