Слайд 2План
Туториалы и домашнее задание
Мотивация
Свёртки, Stride, Padding
Свёрточный слой
CNN
AlexNet
Слайд 6Мотивация
Из книги
Ф. Розенблата «Основы нейродинамики»
Слайд 7Архитектура(зрительной коры)
Слайд 8Архитектура(многослойный перцептрон)
Слайд 10Как выглядят наши данные?
Существует много разных типов данных, но все они, вообще
говоря, представляют собой некоторый многомерный массив «тензор»
Данные, как правило, имеют определённую структуру. Направления по осям неравнозначные (напр. шкала времени)
Слайд 11Как выглядят наши данные?
Главный представитель для нас – изображения. В данном случае
изображение
цветное, поэтому каждый пиксель это три числа, соответствующие своим
каналам RGB, т.е. цветное изображение RGB это трёхмерные «тензоры»
Слайд 12Как выглядят наши данные?
В данном случае изображения чёрно-белые и задаются матрицами интенсивностей,
т. е. представляют собой двухмерные «тензоры»
Слайд 13Свёртка(интуиция)
Распознавание объектов на изображении должно осуществляться безотносительно их положения
Нужно использовать наши знания
о структуре и топологии данных(в обычных полносвязных сетях этого нет)
Слайд 14Свёртка 2D
gif was stolen from Wiki
Слайд 15Свёртка 3D
Слайд из презентации Andrew Ng
Слайд 22Свёрточный слой
Сколько параметров в свёрточном слое с 10 фильтрами размером 3 х
3 х 3?
Ответ 280
Слайд 23CNN это
Свёрточные слои
FC-слои
Pooling-слои
Слайд 24Pooling layer
Max Pooling
Average Pooling