Слайд 2План
Туториалы и домашнее задание
Мотивация
Свёртки, Stride, Padding
Свёрточный слой
CNN
AlexNet
![План Туториалы и домашнее задание Мотивация Свёртки, Stride, Padding Свёрточный слой CNN AlexNet](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-1.jpg)
Слайд 6Мотивация
Из книги
Ф. Розенблата «Основы нейродинамики»
![Мотивация Из книги Ф. Розенблата «Основы нейродинамики»](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-5.jpg)
Слайд 7Архитектура(зрительной коры)
![Архитектура(зрительной коры)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-6.jpg)
Слайд 8Архитектура(многослойный перцептрон)
![Архитектура(многослойный перцептрон)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-7.jpg)
Слайд 10Как выглядят наши данные?
Существует много разных типов данных, но все они, вообще
![Как выглядят наши данные? Существует много разных типов данных, но все они,](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-9.jpg)
говоря, представляют собой некоторый многомерный массив «тензор»
Данные, как правило, имеют определённую структуру. Направления по осям неравнозначные (напр. шкала времени)
Слайд 11Как выглядят наши данные?
Главный представитель для нас – изображения. В данном случае
![Как выглядят наши данные? Главный представитель для нас – изображения. В данном](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-10.jpg)
изображение
цветное, поэтому каждый пиксель это три числа, соответствующие своим
каналам RGB, т.е. цветное изображение RGB это трёхмерные «тензоры»
Слайд 12Как выглядят наши данные?
В данном случае изображения чёрно-белые и задаются матрицами интенсивностей,
![Как выглядят наши данные? В данном случае изображения чёрно-белые и задаются матрицами](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-11.jpg)
т. е. представляют собой двухмерные «тензоры»
Слайд 13Свёртка(интуиция)
Распознавание объектов на изображении должно осуществляться безотносительно их положения
Нужно использовать наши знания
![Свёртка(интуиция) Распознавание объектов на изображении должно осуществляться безотносительно их положения Нужно использовать](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-12.jpg)
о структуре и топологии данных(в обычных полносвязных сетях этого нет)
Слайд 14Свёртка 2D
gif was stolen from Wiki
![Свёртка 2D gif was stolen from Wiki](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-13.jpg)
Слайд 15Свёртка 3D
Слайд из презентации Andrew Ng
![Свёртка 3D Слайд из презентации Andrew Ng](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-14.jpg)
Слайд 22Свёрточный слой
Сколько параметров в свёрточном слое с 10 фильтрами размером 3 х
![Свёрточный слой Сколько параметров в свёрточном слое с 10 фильтрами размером 3](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-21.jpg)
3 х 3?
Ответ 280
Слайд 23CNN это
Свёрточные слои
FC-слои
Pooling-слои
![CNN это Свёрточные слои FC-слои Pooling-слои](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-22.jpg)
Слайд 24Pooling layer
Max Pooling
Average Pooling
![Pooling layer Max Pooling Average Pooling](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1090400/slide-23.jpg)