Компьютерное зрение. Математика в задачах обработки изображений

Содержание

Слайд 2

Компьютерное зрение

Распознавание образов

Компьютерное зрение

Фотограм-
метрия

Машинное зрение

Глубокое 
обучение

Машинное
обучение

Компьютерное зрение Распознавание образов Компьютерное зрение Фотограм- метрия Машинное зрение Глубокое обучение Машинное обучение

Слайд 3

Примеры задач

Распознавание автомобильных номеров
Классификация изображений
Выявление движущихся объектов на видео, слежение
Создание панорам из

Примеры задач Распознавание автомобильных номеров Классификация изображений Выявление движущихся объектов на видео,
изображений
Построение трёхмерных моделей объектов по снимкам
Детектирование объектов определённого класса
Ориентация робота в пространстве
Синтез реалистичных текстур
Поиск по изображениям
Анализ медицинских изображений (подсчёт клеток и их типов)
Биометрия

Слайд 4

Пример: Задача выделения объектов

Задача: выделить объекты, определив порог бинаризации

Низкий порог

Высокий порог

Пример: Задача выделения объектов Задача: выделить объекты, определив порог бинаризации Низкий порог Высокий порог

Слайд 5

Яркости пикселей объектов и фона имеют различное распределение

Гипотеза

Яркости пикселей объектов и фона имеют различное распределение Гипотеза

Слайд 6

Модель

Бимодальное распределение

Модель Бимодальное распределение

Слайд 7

Метод Оцу

Идея: найти порог оптимальным образом, так чтобы минимизировать дисперсию внутри одного

Метод Оцу Идея: найти порог оптимальным образом, так чтобы минимизировать дисперсию внутри
класса (и максимизировать дисперсию между классами)

Слайд 8

Пример

Задача: разделить изображение на области так чтобы каждая область соответствовала одному объекту

Пример Задача: разделить изображение на области так чтобы каждая область соответствовала одному объекту

Слайд 9

Соседние пикселы внутри одного объекта мало различаются по яркости

Гипотеза

Соседние пикселы внутри одного объекта мало различаются по яркости Гипотеза

Слайд 10

Модель

Неориентированный граф. Вершины - это все пиксели. Рёбра ставятся между соседними пикселями. Чем больше

Модель Неориентированный граф. Вершины - это все пиксели. Рёбра ставятся между соседними
разность яркости - тем больше вес ребра.

Слайд 11

Метод  «Efficient Graph-Based Image Segmentation»

Идея: Будем добавлять рёбра между пикселами с минимальным весом,

Метод «Efficient Graph-Based Image Segmentation» Идея: Будем добавлять рёбра между пикселами с
чтобы строить MST. Если ребро объединяет два дерева (региона), используем хитрое правило

Слайд 12

Graph-Based Image Segmentation

Graph-Based Image Segmentation

Слайд 13

Пример

Внутри областей имеются резкие границы, цвет неоднороден

Пример Внутри областей имеются резкие границы, цвет неоднороден

Слайд 14

Будем штрафовать точки границы, чтобы она была только там где точно необходимо

Гипотеза

Будем штрафовать точки границы, чтобы она была только там где точно необходимо Гипотеза

Слайд 15

Модель

Условные/марковские случайные поля

Скрытые переменные

Наблюдаемые переменные

Вероятностная модель связей

Модель Условные/марковские случайные поля Скрытые переменные Наблюдаемые переменные Вероятностная модель связей

Слайд 16

Метод GrubCut

Идея: представим картинку как граф, веса рёбер зададим в соответствии с

Метод GrubCut Идея: представим картинку как граф, веса рёбер зададим в соответствии
энергиями. Применим метод разреза графа

Слайд 17

Пример

На изображении много областей, они относительно однородны

Пример На изображении много областей, они относительно однородны

Слайд 18

Пикселы одного объекта близки в пространстве яркость-координата 

Гипотеза

Пикселы одного объекта близки в пространстве яркость-координата Гипотеза

Слайд 19

Модель

Кластеры в многомерном пространстве (RGB-XY)

Модель Кластеры в многомерном пространстве (RGB-XY)

Слайд 20

Метод Mean-Shift

Идея: Сопоставим пикселам изображения точки в пространстве RGBXY. Выполним оценку среднего

Метод Mean-Shift Идея: Сопоставим пикселам изображения точки в пространстве RGBXY. Выполним оценку
в окрестности точки. Запишем вектор смещения среднего относительно каждой точки. Все точки, от которых вектора смещаются в один и тот же центр отнесём к одному классу

Слайд 21

Mean-Shift

Mean-Shift

Слайд 22

Совсем сложный пример

Совсем сложный пример

Слайд 23

Нейросети могут всё!

Гипотеза

Нейросети могут всё! Гипотеза

Слайд 24

Модель

Модель придумывать не будем
Соберём побольше данных и закинем в нейросеть
...
Profit!!!

Модель Модель придумывать не будем Соберём побольше данных и закинем в нейросеть ... Profit!!!

Слайд 25

Нейронные сети Эволюция архитектур

Нейронные сети Эволюция архитектур

Слайд 26

Линейный классификатор

Сумма + Нелинейность (Сигмоид) = Logistic regression

 

это и есть нейрон

Линейный классификатор Сумма + Нелинейность (Сигмоид) = Logistic regression это и есть нейрон

Слайд 27

Нейронные сети

LogReg + LogReg = Neural Network

За счёт нескольких нелинейностей нейросеть не

Нейронные сети LogReg + LogReg = Neural Network За счёт нескольких нелинейностей
сводится к линейной функции

 

 

Слайд 28

Многослойные нейронные сети

Больше скрытых слоёв!

Это всё ещё комбинация суммирования и нелинейности

Многослойные нейронные сети Больше скрытых слоёв! Это всё ещё комбинация суммирования и нелинейности

Слайд 29

Многослойные нейронные сети

ЕЩЁ БОЛЬШЕ!

ЭТО МАГИЯ! Это всё ещё комбинация суммирования и нелинейности

Многослойные нейронные сети ЕЩЁ БОЛЬШЕ! ЭТО МАГИЯ! Это всё ещё комбинация суммирования и нелинейности

Слайд 30

Свёрточные сети

Свёртка + Нейросеть = Свёрточные сети

При свёртке входов сети гораздо меньше,

Свёрточные сети Свёртка + Нейросеть = Свёрточные сети При свёртке входов сети
чем количество пикселей

Слайд 31

Свёрточные сети

Свёртка + Нейросеть = Свёрточные сети

Да, ещё используется уменьшение размера картинки

Свёрточные сети Свёртка + Нейросеть = Свёрточные сети Да, ещё используется уменьшение размера картинки (Pooling/Subsampling)
(Pooling/Subsampling)

Слайд 32

Свёрточные сети

Одна из первых сетей для классификации

Неплохо, но так просто уже никто не

Свёрточные сети Одна из первых сетей для классификации Неплохо, но так просто
делает.
Гляньте на GoogLeNet

Слайд 33

Применение

Классификация
Регрессия
Детектирование
Обучение представлений (Embeddings)

Применение Классификация Регрессия Детектирование Обучение представлений (Embeddings) …

Слайд 34

За кадром

ReLU
Dropout
1x1 convolution
Residual Blocks
Inception Blocks
Batch Normalization
Fully Convolutional Networks

За кадром ReLU Dropout 1x1 convolution Residual Blocks Inception Blocks Batch Normalization Fully Convolutional Networks

Слайд 35

Автоэнкодер

Нейросеть + Нейросеть наоборот = Автоэнкодер

Автоэнкодер Нейросеть + Нейросеть наоборот = Автоэнкодер

Слайд 36

Автоэнкодер

Нейросеть + Нейросеть наоборот = Автоэнкодер

Если сигнал на выходе будет близок ко

Автоэнкодер Нейросеть + Нейросеть наоборот = Автоэнкодер Если сигнал на выходе будет
входу, то Code будет представлять собой хорошее компактное описание сигнала
Система может снижать уровень шума сигнала, восстанавливать изображения
Система может переводить данные в пространство меньшей размерности
Decoder может преобразовывать сигнал в другую область, например переводить предложения или генерировать ответы на фразы

Слайд 37

U-net

Автоэнкодер + Skip-connection = U-net

shortcut

shortcut

Можно делать сегментацию изображений!

U-net Автоэнкодер + Skip-connection = U-net shortcut shortcut Можно делать сегментацию изображений!

Слайд 38

Генерирующие сети

Случайный вход + Нейросеть наоборот = Генерирующая сеть

Хотим генерировать реалистичные изображения

Генерирующие сети Случайный вход + Нейросеть наоборот = Генерирующая сеть Хотим генерировать реалистичные изображения

Слайд 39

Generative adversarial network

Генерирующая сеть + Классифицирующая Нейросеть = GAN

Generative adversarial network Генерирующая сеть + Классифицирующая Нейросеть = GAN

Слайд 40

Этих людей не существует

Их нет! Изображения сгенерированы сетью по случайным входам

Этих людей не существует Их нет! Изображения сгенерированы сетью по случайным входам

Слайд 41

Conditional GAN

U-net + Нейросеть (Классификатор) = Conditional GAN

Real or fake pair?

U-net

Ещё более

Conditional GAN U-net + Нейросеть (Классификатор) = Conditional GAN Real or fake
хитрый способ решения задачи сегментации

Слайд 42

Pix2pix

Код в open-source

Pix2pix Код в open-source

Слайд 43

Conditional GAN

Информация + Генератор + Дискриминатор = cGAN

Можно гененировать изображения по текстовому

Conditional GAN Информация + Генератор + Дискриминатор = cGAN Можно гененировать изображения по текстовому описанию
описанию

Слайд 44

CycleGAN

cycle-consistency

cycle-consistency

Нет соответствующих пар! Обучение без учителя

CycleGAN cycle-consistency cycle-consistency Нет соответствующих пар! Обучение без учителя

Слайд 45

CycleGAN

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. Zhu, Park, Isola, Efros

Два умных

CycleGAN Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. Zhu, Park, Isola, Efros
мужика и два китайца делают чудеса

Слайд 46

Паровоз ещё не уехал! Новые архитектуры и модели впереди!

Паровоз ещё не уехал! Новые архитектуры и модели впереди!

Слайд 47

Мои проекты

ФГУП "ГосНИИАС" (ГНЦ РФ) (Кафедра управляющих и информационных систем МФТИ)
Лаборатория гибридных интеллектуальных

Мои проекты ФГУП "ГосНИИАС" (ГНЦ РФ) (Кафедра управляющих и информационных систем МФТИ)
систем МФТИ
Лаборатория МФТИ-Сбербанк

Слайд 48

Магазин будущего

Магазин будущего

Слайд 49

Магазин будущего

Детектирование товаров
Трекинг товаров
Распознавание действий и позы покупателей
Идентификация покупателей
Трекинг покупателей по залу
Составление виртуальной

Магазин будущего Детектирование товаров Трекинг товаров Распознавание действий и позы покупателей Идентификация
корзины покупок и привязка к покупателю для автоматической оплаты
Отслеживание пустот на полках

Слайд 50

Семантическая сегментация аэро- и космоснимков

Семантическая сегментация аэро- и космоснимков

Слайд 51

Визуальный осмотр воздушных судов с помощью дронов и ИИ

Дрон + Детектор +

Визуальный осмотр воздушных судов с помощью дронов и ИИ Дрон + Детектор
Система ориентирования + Система управления = Автоматический визуальны осмотр

Слайд 52

Новая биометрия

Динамические паттерны вместо статических + Случайные стимулы = Защита от копирования биометрических

Новая биометрия Динамические паттерны вместо статических + Случайные стимулы = Защита от копирования биометрических шаблонов
шаблонов
Имя файла: Компьютерное-зрение.-Математика-в-задачах-обработки-изображений.pptx
Количество просмотров: 37
Количество скачиваний: 0