Машинное обучение. Лекция №4

Содержание

Слайд 2

Типы данных при линейной регрессии

Типы данных при линейной регрессии

Слайд 3

Типы данных при линейной регрессии

Бинарные переменные можно включать, если такого что большая

Типы данных при линейной регрессии Бинарные переменные можно включать, если такого что
часть значений это 0 или 1
Не должно быть выбросов и других аномалий

Слайд 4

Типы данных при линейной регрессии

Типы данных при линейной регрессии

Слайд 5

Типы данных при линейной регрессии

Типы данных при линейной регрессии

Слайд 6

Типы данных при линейной регрессии

Типы данных при линейной регрессии

Слайд 7

Подготовка данных при линейной регрессии

Подготовка данных при линейной регрессии

Слайд 8

Подготовка данных при линейной регрессии

Подготовка данных при линейной регрессии

Слайд 9

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 10

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 11

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 12

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 13

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 14

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 15

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 16

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 17

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 18

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 19

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 20

Оценка качества линейной регрессии

Оценка качества линейной регрессии

Слайд 21

Смещение, разброс, переобучение и недообучение.

Переобучение (overfitting) – явление, когда ошибка на

Смещение, разброс, переобучение и недообучение. Переобучение (overfitting) – явление, когда ошибка на
тестовой выборке заметно больше ошибки на обучающей. Это главная проблема машинного обучения: если бы такого эффекта не было (ошибка на тесте примерно совпадала с ошибкой на обучении), то всё обучение сводилось бы к минимизации ошибки на тесте (т.н. эмпирическому риску)
Недообучение (underfitting) – явление, когда ошибка на обучающей выборке достаточно большая, часто говорят «не удаётся настроиться на выборку». Такой странный термин объясняется тем, что недообучение при настройке алгоритмов итерационными методами (например, нейронных сетей методом обратного распространения) можно наблюдать, когда сделано слишком маленькое число итераций, т.е. «не успели обучиться»

Слайд 22

Смещение, разброс, переобучение и недообучение.

Сложность (complexity) модели алгоритмов (допускает множество формализаций) –

Смещение, разброс, переобучение и недообучение. Сложность (complexity) модели алгоритмов (допускает множество формализаций)
оценивает, насколько разнообразно семейство алгоритмов в модели с точки зрения их функциональных свойств (например, способности настраиваться на выборки). Повышение сложности (т.е. использование более сложных моделей) решает проблему недообучения и вызывает переобучение.

Пример переобучения.

 y = sin(4x) + шум

Слайд 23

Смещение, разброс, переобучение и недообучение.

Пример переобучения.

 зашумлённой пороговой зависимости

Видно, что с увеличением степени

Смещение, разброс, переобучение и недообучение. Пример переобучения. зашумлённой пороговой зависимости Видно, что
ошибка на обучающей выборке падает, а на тестовой (мы взяли очень мелкую сетку отрезка [0, 1]) – сначала падает, потом возрастает.

Слайд 24

Смещение, разброс, переобучение и недообучение.

Пример переобучения.

 зашумлённой пороговой зависимости

Видно, что с увеличением степени

Смещение, разброс, переобучение и недообучение. Пример переобучения. зашумлённой пороговой зависимости Видно, что
ошибка на обучающей выборке падает, а на тестовой (мы взяли очень мелкую сетку отрезка [0, 1]) – сначала падает, потом возрастает.

Слайд 25

Смещение, разброс, переобучение и недообучение.

Смещение, разброс, переобучение и недообучение.

Слайд 26

Смещение, разброс, переобучение и недообучение.

Смещение, разброс, переобучение и недообучение.

Слайд 27

Смещение, разброс, переобучение и недообучение.

Смещение, разброс, переобучение и недообучение.

Слайд 28

Смещение, разброс, переобучение и недообучение.

Смещение, разброс, переобучение и недообучение.

Слайд 29

Смещение, разброс, переобучение и недообучение.

Смещение, разброс, переобучение и недообучение.

Слайд 30

Смещение, разброс, переобучение и недообучение.

Смещение, разброс, переобучение и недообучение.