Нейросети

Март 16, 2021

Главная
Разное
Нейросети

Содержание

2. Виды обучения Обучение с учителем (supervised learning) – есть размеченные данные (для каждого примера есть «решение
3. Виды обучения Обучение с подкреплением (reinforcement learning) – есть размечаемые данные («ситуация, предполагаемое решение»). Алгоритм обучения
4. Выборки
5. Признаки Исходные Производные Агрегированные – показатели, определенные по группе (сумма, среднее, минимум, максимум) Индикаторы – наличие
6. Извлечение признаков Тексты – это токенизация Изображения – извлечение краев и цветовые пятна Дата и время
7. Ошибка обобщения Ошибка обобщения – сумма смещения, дисперсии и величины, называемой неустранимой погрешностью, которая является результатом
8. Сложность количество настраиваемых параметров архитектуры модели, другими словами, сложность модели определяет ее информационную емкость. При увеличении
9. Недообучение Недообучение (underfitting) – когда модель, построенная с помощью алгоритма, является слишком упрощенной, чтобы представлять базовую
10. Переобучение Переобучение (overfitting) – когда модель, построенная с помощью алгоритма, настолько сложна, что модель слишком точно
11. Нейросети по характеру связей Прямого распространения Обратного распространения, или рекуррентные Радиально-базисные функции Самоорганизующиеся
12. Кросс-валидация (скользящий контроль) Метод отложенных данных (holdout method) – разделение 70-30 или 60-40 или 80-20. Оценка
13. Кросс-валидация (скользящий контроль) Контроль по k-блокам (k-fold cross-validation) - данные случайным образом делятся на k непересекающихся
14. Оценка классификации
15. Оценка классификации
16. F-мера
17. ROC-кривая Вектора вероятностей классов, порог позволяет разделить классы, кривая строится для разных значений порога. Выбор порога
18. ROC-кривая
19. AUC
20. Оценка регрессии
21. Оценка регрессии
23. Формальный нейрон
24. Формальный нейрон
25. Сигмоида
26. Многослойный персептрон
27. Признаки Локальные признаки (local feature) извлекаются в первом скрытом слое. Глобальные признаки (global feature) извлекаются во
28. Распространение сигнала
29. Ошибка обучения
30. Обратное распространение ошибки
31. Скорость обучения
32. Влияние скорости на процесс обучения
33. Свертка
34. Свертка
35. Пулинг
36. Le-Net 5
37. Google Inception V3
38. Ядра сверток
39. VGG
40. Регуляризация
41. Штрафы по норме параметров
42. Регуляризация Тихонова
43. Стохастический градиентный спуск Суть – обновление весов по одному объекту 1 эпоха = 1 итерация На
45. Скачать презентацию

Слайд 2

Виды обучения
Обучение с учителем (supervised learning) – есть размеченные данные (для каждого

примера есть «решение или метка класса»)
С частичным привлечением учителя (semi-supervised learning) – для части прецедентов задается пара «ситуация, решение», а для части - только «ситуация»
Обучение без учителя (unsupervised learning) – есть неразмеченные данные («ситуация»), требуется сгруппировать объекты

Слайд 3

Виды обучения
Обучение с подкреплением (reinforcement learning) – есть размечаемые данные («ситуация, предполагаемое

решение»). Алгоритм обучения работает через вознаграждение за правильное решение или наказание за неправильное.

Слайд 4

Выборки

Слайд 5

Признаки
Исходные
Производные
Агрегированные – показатели, определенные по группе (сумма, среднее, минимум, максимум)
Индикаторы – наличие

или отсутствие характеристики
Отношения – взаимосвязь между двумя или более значениями данных
Отображения – преобразование непрерывных в категориальные

Слайд 6

Извлечение признаков
Тексты – это токенизация
Изображения – извлечение краев и цветовые пятна
Дата и

время – полезно вычленить выходные и праздники, дни недели
Местоположение (адрес или координаты) - извлечь плотность, средний доход по району
Номер телефона – регион и оператор связи
Лаги по времени. Окно 3-7 последовательностей

Слайд 7

Ошибка обобщения
Ошибка обобщения – сумма смещения, дисперсии и величины, называемой неустранимой погрешностью,

которая является результатом шума в самой задаче.

Слайд 8

Сложность
количество настраиваемых параметров архитектуры модели, другими словами, сложность модели определяет ее информационную

емкость. При увеличении сложности модели происходит уменьшение смещения и увеличение разброса.

Слайд 9

Недообучение
Недообучение (underfitting) – когда модель, построенная с помощью алгоритма, является слишком упрощенной,

чтобы представлять базовую взаимосвязь между признаками и классом в обучающей выборке.
Это явление можно заметить по большой ошибке на обучающей выборке (еще говорят, что «не удаётся настроиться на выборку»). Помимо простоты модели, недообучение может возникать еще и из-за малого количества эпох обучения.

Слайд 10

Переобучение
Переобучение (overfitting) – когда модель, построенная с помощью алгоритма, настолько сложна, что

модель слишком точно приближает обучающую выборку и становится чувствительной к шуму.
Это явление можно заметить по увеличивающейся разнице между ошибкой на обучающей выборке и тестовой выборке с каждой эпохой обучения. Поэтому при обучении строится график изменения ошибки на обучающей и тестовой выборках. Переобученная модель обладает низкой обобщающей способностью, в эксплуатации она будет часто ошибаться.

Слайд 11

Нейросети по характеру связей
Прямого распространения
Обратного распространения, или рекуррентные
Радиально-базисные функции
Самоорганизующиеся

Слайд 12

Кросс-валидация (скользящий контроль)
Метод отложенных данных (holdout method) – разделение 70-30 или 60-40

или 80-20.
Оценка ошибки близка к ошибке модели на новых данных, но сильно зашумлена.
Для борьбы с шумом многократно случайно разделяют обучающую и тестовую выборку, параметр ошибки при этом усредняют.
Но в процессе итераций каждая точка данных будет попадать в тестовое подмножество различное число раз, что может привести к смещению оценки.

Слайд 13

Кросс-валидация (скользящий контроль)
Контроль по k-блокам (k-fold cross-validation) - данные случайным образом делятся

на k непересекающихся подмножеств (5, 10 или 20). После циклического перебора всех k подмножеств полученная оценка усредняется.

Слайд 14

Оценка классификации

Слайд 15

Оценка классификации

Слайд 16

F-мера

Слайд 17

ROC-кривая
Вектора вероятностей классов, порог позволяет разделить классы, кривая строится для разных значений

порога. Выбор порога обусловлен задачей, можно сдвинуть в сторону того или иного класса.
Для каждого класса своя ROC-кривая при многоклассовой классификации

Слайд 18

ROC-кривая

Слайд 19

AUC

Слайд 20

Оценка регрессии

Слайд 21

Оценка регрессии

Слайд 22

Слайд 23

Формальный нейрон

Слайд 24

Формальный нейрон

Слайд 25

Сигмоида

Слайд 26

Многослойный персептрон

Слайд 27

Признаки
Локальные признаки (local feature) извлекаются в первом скрытом слое.
Глобальные признаки (global

feature) извлекаются во втором скрытом слое. В частности, нейрон второго скрытого слоя "обобщает" выходные сигналы нейронов первого скрытого слоя, относящихся к конкретной области входного пространства

Слайд 28

Распространение сигнала

Слайд 29

Ошибка обучения

Слайд 30

Обратное распространение ошибки

Слайд 31

Скорость обучения

Слайд 32

Влияние скорости на процесс обучения

Слайд 33

Свертка

Слайд 34

Свертка

Слайд 35

Пулинг

Слайд 36

Le-Net 5

Слайд 37

Google Inception V3

Слайд 38

Ядра сверток

Слайд 39

VGG

Слайд 40

Регуляризация

Слайд 41

Штрафы по норме параметров

Слайд 42

Регуляризация Тихонова

Слайд 43

Стохастический градиентный спуск
Суть – обновление весов по одному объекту
1 эпоха = 1

итерация
На каждой эпохе не гарантируется движение в сторону наискорейшего убывания функции

Нейросети

Содержание

Виды обученияОбучение с учителем (supervised learning) – есть размеченные данные (для каждого

Виды обученияОбучение с подкреплением (reinforcement learning) – есть размечаемые данные («ситуация, предполагаемое

Выборки

ПризнакиИсходныеПроизводныеАгрегированные – показатели, определенные по группе (сумма, среднее, минимум, максимум)Индикаторы – наличие

Извлечение признаковТексты – это токенизацияИзображения – извлечение краев и цветовые пятнаДата и

Ошибка обобщенияОшибка обобщения – сумма смещения, дисперсии и величины, называемой неустранимой погрешностью,

Сложностьколичество настраиваемых параметров архитектуры модели, другими словами, сложность модели определяет ее информационную

НедообучениеНедообучение (underfitting) – когда модель, построенная с помощью алгоритма, является слишком упрощенной,

ПереобучениеПереобучение (overfitting) – когда модель, построенная с помощью алгоритма, настолько сложна, что

Нейросети по характеру связейПрямого распространенияОбратного распространения, или рекуррентныеРадиально-базисные функцииСамоорганизующиеся

Кросс-валидация (скользящий контроль)Метод отложенных данных (holdout method) – разделение 70-30 или 60-40

Кросс-валидация (скользящий контроль)Контроль по k-блокам (k-fold cross-validation) - данные случайным образом делятся

Оценка классификации

Оценка классификации

F-мера

ROC-криваяВектора вероятностей классов, порог позволяет разделить классы, кривая строится для разных значений

ROC-кривая

AUC

Оценка регрессии

Оценка регрессии

Формальный нейрон

Формальный нейрон

Сигмоида

Многослойный персептрон

ПризнакиЛокальные признаки (local feature) извлекаются в первом скрытом слое. Глобальные признаки (global

Распространение сигнала

Ошибка обучения

Обратное распространение ошибки

Скорость обучения

Влияние скорости на процесс обучения

Свертка

Свертка

Пулинг

Le-Net 5

Google Inception V3

Ядра сверток

VGG

Регуляризация

Штрафы по норме параметров

Регуляризация Тихонова

Стохастический градиентный спускСуть – обновление весов по одному объекту1 эпоха = 1

Похожие презентации

Виды обучения
Обучение с учителем (supervised learning) – есть размеченные данные (для каждого

Виды обучения
Обучение с подкреплением (reinforcement learning) – есть размечаемые данные («ситуация, предполагаемое

Признаки
Исходные
Производные
Агрегированные – показатели, определенные по группе (сумма, среднее, минимум, максимум)
Индикаторы – наличие

Извлечение признаков
Тексты – это токенизация
Изображения – извлечение краев и цветовые пятна
Дата и

Ошибка обобщения
Ошибка обобщения – сумма смещения, дисперсии и величины, называемой неустранимой погрешностью,

Сложность
количество настраиваемых параметров архитектуры модели, другими словами, сложность модели определяет ее информационную

Недообучение
Недообучение (underfitting) – когда модель, построенная с помощью алгоритма, является слишком упрощенной,

Переобучение
Переобучение (overfitting) – когда модель, построенная с помощью алгоритма, настолько сложна, что

Нейросети по характеру связей
Прямого распространения
Обратного распространения, или рекуррентные
Радиально-базисные функции
Самоорганизующиеся

Кросс-валидация (скользящий контроль)
Метод отложенных данных (holdout method) – разделение 70-30 или 60-40

Кросс-валидация (скользящий контроль)
Контроль по k-блокам (k-fold cross-validation) - данные случайным образом делятся

ROC-кривая
Вектора вероятностей классов, порог позволяет разделить классы, кривая строится для разных значений

Признаки
Локальные признаки (local feature) извлекаются в первом скрытом слое.
Глобальные признаки (global

Стохастический градиентный спуск
Суть – обновление весов по одному объекту
1 эпоха = 1