Слайд 2СОДЕРЖАНИЕ
Постановка задачи
Выбор базового алгоритма
Модификация алгоритма
Программная реализация
Результаты экспериментов
Заключение
Слайд 3ПОСТАНОВКА ЗАДАЧИ
Задача распознавания человека по портретному изображению лица
Количество классов до 100
Множественные изображения
для каждого класса в обучающей выборке
Требования к алгоритму
устойчивость к местоположению лица, уровню освещённости и помехам
приемлимое время обучения и работы
Слайд 5БАЗОВЫЙ АЛГОРИТМ
Описан в работе Lawrence S., Giles C. L., Tsoi A. C.,
Back A. D.
Face Recognition: A Convolutional Neural Network Approach
Обучение
Предобработка (масштабирование)
Прямое распространение по свёрточной сети
Вычисление ошибки сети
Обратное распространение и корректировка весов (шаг обучения зависит от эпохи)
Распознавание
Предобработка (масштабирование)
Прямое распространение по свёрточной сети
Принятие решения на основе выходного вектора
Характеристики:
Высокая точность
Устойчивость к изменению местоположения лица
Слабая устойчивость к уровню освещённости и шумам
Большая вычислительная сложность (особенно процесс обучения)
Слайд 6ВИЗУАЛИЗАЦИЯ РАБОТЫ АЛГОРИТМА
Слайд 9ПРОГРАММНАЯ РЕАЛИЗАЦИЯ
Три основных компонента:
Компоненты представляют собой программные модули, написанные на языке программирования
C# (платформа .NET).
Особенности реализации алгоритма свёрточной сети:
Гибкость при настройке (возможность задания параметров архитектуры сети: кол-во слоёв, их тип, кол-во нейронов и связей между слоями, размер входных данных)
Возможность получения структурированной информации о внутреннем состоянии сети (весах нейронов и промежуточных значениях при вычислении);
Слайд 10РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ
Базы – ORL и FERET
Обучающая и тестовая выборки не пересекаются
Конфигурации нейронных
сетей:
2 свёрточных слоя (10 и 30 нейронов)
2 свёрточных слоя (20 и 20 нейронов)
3 свёрточных слоя (10, 20 и 20 нейронов)
3 свёрточных слоя (5, 10 и 10 нейронов)
Слайд 11РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ
База ORL
База FERET
Слайд 12ПРИМЕРЫ
Устойчивость к местоположению
Устойчивость к уровню освещённости
Пример ошибочного распознавания
Слайд 13ЗАКЛЮЧЕНИЕ
Рассмотрен подход на основе свёрточных нейронных сетей
Предложена модификация базового алгоритма Лоренса-Гилса включающая
вейвлетную предобработку, локальную нормализацию, введение обратных связей и адаптивного шага обучения.
Эксперименты показали снижение уровня ошибок распознавания в 1,2 – 2,5 раз для баз изображений ORL и FERET