Слайд 2ПЛАН
Задача детектирования
Демонстрация Tensorflow Object Detection API
Создание своей модели детектирования
Демонстрация обучения модели
Детектирование объектов
на видео
Пример детектирования движущихся объектов, с помощью ImageAI
Слайд 3Задача детектирования
Требуется определить местоположение всех объектов заданного класса на изображении.
Класс объектов:
Конкретный объект
Произвольный
регистрационный знак (номер) автомобиля
Лицо произвольного человека
Произвольный человек
...
Местоположение:
Пиксели, принадлежащие изображению объекта
Контур объекта
Область изображения, содержащая объект
(прямоугольник, эллипс, ...)
Слайд 4Сложность задачи детектирования
Сложность определяется:
изменчивостью изображений объектов рассматриваемого класса
Положение
Ракурс
Освещение
Цвет
Форма
Частичное перекрытие другими объектами
Разнообразием окружающих
объектов
Слайд 5Детектирование, как задача регрессии
На вход нейронной сети подаются изображения
Выходом является предсказание координат
точек, ограничивающих объект
Слайд 6Инструменты применяемые для детектирования
Tensorflow Object Detection API
https://github.com/tensorflow/models/tree/master/research/object_detection
YOLO: Real-Time Object Detection
https://github.com/pjreddie/darknet/wiki/YOLO:-Real-Time-Object-Detection
ImageAI
https://imageai.readthedocs.io/en/latest/
Слайд 7Демонстрация применения Tensorflow Object Detection API
Слайд 8ПЛАН
Задача детектирования
Демонстрация Tensorflow Object Detection API
Создание своей модели детектирования
Демонстрация обучения модели
Детектирование объектов
на видео
Пример детектирования движущихся объектов, с помощью ImageAI
Слайд 9Примеры
наборов данных для обучения
The Oxford-IIIT Pet Dataset
http://www.robots.ox.ac.uk/~vgg/data/pets/
Pascal VOC Dataset
https://pjreddie.com/projects/pascal-voc-dataset-mirror/
Слайд 10Подготовка данных для обучения
Инструменты для разметки наборов данных
Label Image https://github.com/tzutalin/labelImg
Open CV Computer
Vision Annotation Tool (CVAT)
https://github.com/opencv/cvat
Yolo_Label https://github.com/developer0hye/Yolo_Label
Слайд 11Демонстрация обучения детектора объектов на основе предварительно обученной модели
Слайд 12ПЛАН
Задача детектирования
Демонстрация Tensorflow Object Detection API
Создание своей модели детектирования
Демонстрация обучения модели
Детектирование объектов
на видео
Пример детектирования движущихся объектов, с помощью ImageAI
Слайд 13Видео
Видео – это набор кадров
Видео можно представить, как тензор с размерностью
(k, h,
w)
где k – количество кадров в видео потоке
h – высота кадра
w – кадра
Значит задачу анализа видео-потока можно свести к задаче анализа изображений
Слайд 14Видео
Видео – это N кадров в секунду
Требует большего количества ресурсов
Предполагает анализ изображения
в динамике, а не в статике
Слайд 15Видео
Можно применить тот же набор инструментов, что и для изображений, но с
использованием некоторого нового функционала:
Tensorflow Object Detection API
YOLO: Real-Time Object Detection
ImageAI
OpenCV
Слайд 16Демонстрация детектирования объектов на видео