Тарасюк Александр Евгеньевич

Содержание

Слайд 2

СОДЕРЖАНИЕ

Постановка задачи
Выбор базового алгоритма
Модификация алгоритма
Программная реализация
Результаты экспериментов
Заключение

СОДЕРЖАНИЕ Постановка задачи Выбор базового алгоритма Модификация алгоритма Программная реализация Результаты экспериментов Заключение

Слайд 3

ПОСТАНОВКА ЗАДАЧИ

Задача распознавания человека по портретному изображению лица
Количество классов до 100
Множественные изображения

ПОСТАНОВКА ЗАДАЧИ Задача распознавания человека по портретному изображению лица Количество классов до
для каждого класса в обучающей выборке
Требования к алгоритму
устойчивость к местоположению лица, уровню освещённости и помехам
приемлимое время обучения и работы

Слайд 4

СХЕМА СВЁРТОЧНОЙ СЕТИ

СХЕМА СВЁРТОЧНОЙ СЕТИ

Слайд 5

БАЗОВЫЙ АЛГОРИТМ

Описан в работе Lawrence S., Giles C. L., Tsoi A. C.,

БАЗОВЫЙ АЛГОРИТМ Описан в работе Lawrence S., Giles C. L., Tsoi A.
Back A. D.
Face Recognition: A Convolutional Neural Network Approach
Обучение
Предобработка (масштабирование)
Прямое распространение по свёрточной сети
Вычисление ошибки сети
Обратное распространение и корректировка весов (шаг обучения зависит от эпохи)
Распознавание
Предобработка (масштабирование)
Прямое распространение по свёрточной сети
Принятие решения на основе выходного вектора
Характеристики:
Высокая точность
Устойчивость к изменению местоположения лица
Слабая устойчивость к уровню освещённости и шумам
Большая вычислительная сложность (особенно процесс обучения)

Слайд 6

ВИЗУАЛИЗАЦИЯ РАБОТЫ АЛГОРИТМА

ВИЗУАЛИЗАЦИЯ РАБОТЫ АЛГОРИТМА

Слайд 7

МОДИФИКАЦИЯ АЛГОРИТМА

МОДИФИКАЦИЯ АЛГОРИТМА

Слайд 8

МОДИФИКАЦИЯ АЛГОРИТМА

МОДИФИКАЦИЯ АЛГОРИТМА

Слайд 9

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ

Три основных компонента:
Компоненты представляют собой программные модули, написанные на языке программирования

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ Три основных компонента: Компоненты представляют собой программные модули, написанные на
C# (платформа .NET).
Особенности реализации алгоритма свёрточной сети:
Гибкость при настройке (возможность задания параметров архитектуры сети: кол-во слоёв, их тип, кол-во нейронов и связей между слоями, размер входных данных)
Возможность получения структурированной информации о внутреннем состоянии сети (весах нейронов и промежуточных значениях при вычислении);

Слайд 10

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ

Базы – ORL и FERET
Обучающая и тестовая выборки не пересекаются
Конфигурации нейронных

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ Базы – ORL и FERET Обучающая и тестовая выборки не
сетей:
2 свёрточных слоя (10 и 30 нейронов)
2 свёрточных слоя (20 и 20 нейронов)
3 свёрточных слоя (10, 20 и 20 нейронов)
3 свёрточных слоя (5, 10 и 10 нейронов)

Слайд 11

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ

База ORL
База FERET

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ База ORL База FERET

Слайд 12

ПРИМЕРЫ

Устойчивость к местоположению
Устойчивость к уровню освещённости
Пример ошибочного распознавания

ПРИМЕРЫ Устойчивость к местоположению Устойчивость к уровню освещённости Пример ошибочного распознавания

Слайд 13

ЗАКЛЮЧЕНИЕ

Рассмотрен подход на основе свёрточных нейронных сетей
Предложена модификация базового алгоритма Лоренса-Гилса включающая

ЗАКЛЮЧЕНИЕ Рассмотрен подход на основе свёрточных нейронных сетей Предложена модификация базового алгоритма
вейвлетную предобработку, локальную нормализацию, введение обратных связей и адаптивного шага обучения.
Эксперименты показали снижение уровня ошибок распознавания в 1,2 – 2,5 раз для баз изображений ORL и FERET
Имя файла: Тарасюк-Александр-Евгеньевич.pptx
Количество просмотров: 110
Количество скачиваний: 0