Семантическая сегментация

Содержание

Слайд 2

Наивная классификация

Нужно классифицировать каждый пиксель
1 МП на картинку!
Что можно сказать про

Наивная классификация Нужно классифицировать каждый пиксель 1 МП на картинку! Что можно
1 пиксел?
Классификация окрестности пиксела

Слайд 3

Наивная классификация

Сегментируем картинку, затем классифицируем сегменты

Классифицируем каждый пиксель по окрестности

Наивная классификация Сегментируем картинку, затем классифицируем сегменты Классифицируем каждый пиксель по окрестности

Слайд 4

Пространственная поддержка

50x50 Patch

50x50 Patch

По небольшой окрестности зачастую невозможно правильно определить метку
Пространственная поддержка
Необходимо

Пространственная поддержка 50x50 Patch 50x50 Patch По небольшой окрестности зачастую невозможно правильно
каким-то образом задавать метки для всех пикселов в совокупности

Слайд 5

Построение решения

Задача / Данные
Элемент
Пиксель
Сегмент
Классификация пикселов / регионов
Признаки для классификации
Метод классификации (бустинг,

Построение решения Задача / Данные Элемент Пиксель Сегмент Классификация пикселов / регионов
лес, SVM)
Расширение пространственной поддержки
Множественные сегментации
Случайные поля

Слайд 6

Цель: 7 геометрических классов
Земля
Вертикальные стены
Плоскости: смотрящие влево (?), Прямо ( ), Направо

Цель: 7 геометрических классов Земля Вертикальные стены Плоскости: смотрящие влево (?), Прямо
(?)
Другоеr: Твердые (X), Дырявые (O)
Небо

?

Уличные изображения

Hoiem et al 2005

Слайд 7

Размеченные данные

300 изображений из гугла

Размеченные данные 300 изображений из гугла

Слайд 8

Признаки

Положение

Признаки Положение

Слайд 9

Сегментация изображений

Использование нескольких вариантов сегментации (с разными параметрами)
Решение, какие сегменты хорошие, откладывается

Сегментация изображений Использование нескольких вариантов сегментации (с разными параметрами) Решение, какие сегменты
на потом


Слайд 10

Что мы хотим узнать:
Хороший ли это сегмент?
Если сегмент хороший, то какая у

Что мы хотим узнать: Хороший ли это сегмент? Если сегмент хороший, то
него метка?
Обучаем модель по размеченным данным
Бустинг на решающих деревьях

Классификация областей

P(good segment | data)

P(label | good segment, data)

Слайд 11

Классификация



Для каждого сегмента вычисляется:
- P(good segment | data) P(label | good

Классификация … … Для каждого сегмента вычисляется: - P(good segment | data)
segment, data)

Слайд 12

Разметка изображений


Размеченные сегментации

Размеченные пиксели

Разметка изображений … Размеченные сегментации Размеченные пиксели

Слайд 13

Вероятностная разметка

Support

Vertical

Sky

V-Left

V-Center

V-Right

V-Porous

V-Solid

Вероятностная разметка Support Vertical Sky V-Left V-Center V-Right V-Porous V-Solid

Слайд 14

Результат

Вход

Ручная разметка

Результат алгоритма

Результат Вход Ручная разметка Результат алгоритма

Слайд 15

Изображения из помещений

Вход

Ручная разметка

Результат

Изображения из помещений Вход Ручная разметка Результат

Слайд 16

Рисунки

Вход

Результат

Рисунки Вход Результат

Слайд 17

Приложение: Automatic Photo Pop-up (SIGGRAPH’05)

Изображение

Метки

Приложение: Automatic Photo Pop-up (SIGGRAPH’05) Изображение Метки

Слайд 18

Automatic Photo Pop-up

Automatic Photo Pop-up

Слайд 19

TextonBoost

J. Shotton, J. Winn, C. Rother, A. Criminisi, TextonBoost: Joint Appearance, Shape

TextonBoost J. Shotton, J. Winn, C. Rother, A. Criminisi, TextonBoost: Joint Appearance,
and Context Modeling for Multi-Class Object Recognition and Segmentation, ECCV 2006

Слайд 20

Data and Classes

Goal: assign every pixel to a label
MSRC-21 database (“void” label

Data and Classes Goal: assign every pixel to a label MSRC-21 database
ignored for training and testing)

Слайд 21

Марковские Случайные Поля

Независимая классификация
Применяем обычный метод классификации (SVM, бустинг и т.д.)
Схема Марковских

Марковские Случайные Поля Независимая классификация Применяем обычный метод классификации (SVM, бустинг и
Случайных Полей (MRF) для совместной классификации
Каждый пиксел – вершина неориентированного графа
Связи между пикселами задаются ребрами графа
Why?

Слайд 22

Условные случайные поля

МСП для совместной оценки разметки случайных переменных (c), при условии

Условные случайные поля МСП для совместной оценки разметки случайных переменных (c), при
всех данных (x)
Модель совместного распределения
Ψ(1) – модель локальной оценки качества метки
Ψ(2)- - модель попарной оценки качества разметки

Images from Szummer DAR’05

Слайд 23

Вывод (Inference)

Вывод = поиск наилучшей совместной разметки
NP-полная задача в общем случае
Argmax-разметка
Попарные

Вывод (Inference) Вывод = поиск наилучшей совместной разметки NP-полная задача в общем
потенциалы должны удовлетворять условию субмодулярности
Разрезы графов (GraphCuts)
Не-субмодулярные потенциалы
Quadratic Pseudo-Boolean Optimization (QPBO)
Разметка с оценкой достоверности
Belief Propagation, TRW
Приближенное решение при наличии циклов
Сложность экспоненциально зависит от размера клики
Поэтому в основном рассматриваются модели с кликой не выше 2 (попарные)

Слайд 24

Обзор метода

Модель TextonBoost на основе CRF
4-х связанные окрестности
Параметры обучаются независимо
Вывод GraphCut

VS

Обзор метода Модель TextonBoost на основе CRF 4-х связанные окрестности Параметры обучаются независимо Вывод GraphCut VS

Слайд 25

Форма и текстура (Shape & Texture)

Первая и главная компонента модели
Текстоны
Фильтруем изображение банком

Форма и текстура (Shape & Texture) Первая и главная компонента модели Текстоны
фильтров (17 фильтров)
Каждый фильтр – вычисление определенной характеристики/статистики окрестности точки
Получаем 17 признаков для каждого пиксела (вектор-признаки)
Кластеризуем список всех вектор-признаков (400 кластеров)
Каждые кластер – «текстон»
Квантуем каждый пиксель к ближайшему текстону (карта текстонов)

Слайд 26

Моделирование формы
Шаг 1: получили карту текстонов
Шаг 2: Фильтры формы (Shape Filters)
Для каждого

Моделирование формы Шаг 1: получили карту текстонов Шаг 2: Фильтры формы (Shape
текстона t
Вход
Карта текстонов
(Прямоугольная маска r, текстон t)
Положение пикселя i
Выход
Площадь в маске r, отвечающая t
Результат – гистограмма откликов по окрестностям

Слайд 27

Фильтры формы

Пара:
Отклики v(i, r, t)
Большие области обеспечивают большую пространственную поддержку
Рассчет через интегральные

Фильтры формы Пара: Отклики v(i, r, t) Большие области обеспечивают большую пространственную
изображения

rectangle r

texton t

(

,

)

v(i1, r, t) = a

v(i2, r, t) = 0

v(i3, r, t) = a/2

appearance context

up to 200 pixels

Slides from Shotton’s ECCV talk

Слайд 28

feature response image
v(i, r1, t1)

feature response image
v(i, r2, t2)

Форма задается положением текстонов

texton

feature response image v(i, r1, t1) feature response image v(i, r2, t2)
map

ground truth

texton map

Slides from Shotton’s ECCV talk

Слайд 29

summed response images
v(i, r1, t1) + v(i, r2, t2)

Форма задается положением текстонов

(

,

)

(r1,

summed response images v(i, r1, t1) + v(i, r2, t2) Форма задается
t1) =

(

,

)

(r2, t2) =

texton map

ground truth

texton map

summed response images
v(i, r1, t1) + v(i, r2, t2)

texton map

Слайд 30

Обучение

Используется бустинг
Обычный бустинг
Для каждого пикселя
Для каждой возможной маски
Для каждого текстона
Считаем признак
Ускоренная версия
Для

Обучение Используется бустинг Обычный бустинг Для каждого пикселя Для каждой возможной маски
каждого пикселя в уменьшенном изображении
Для 10 случайных масок
Для каждого текстона (K=400)
Считаем признаки
42 часа на 276 изображениях

Слайд 31

Первый результат

Только форма и текстура: 69.6%

shape-texture

Точность
попиксельной
сегментации

Slides from Shotton’s ECCV talk

Первый результат Только форма и текстура: 69.6% shape-texture Точность попиксельной сегментации Slides from Shotton’s ECCV talk

Слайд 32

Уточняем разметку

Добавляем границы
Потенциал границ
Используем попарные потенциалы для определения и подчеркивания границ
Идея:
Если метки

Уточняем разметку Добавляем границы Потенциал границ Используем попарные потенциалы для определения и
одинаковые, разница пикселей должна быть маленькой
Если метки разные, разница пикселей должна быть большой
Модель Поттса, допускает разрезы графов

Слайд 33

Точность

Форма-текстура: 69.6%
+ границы: 70.3%

shape-texture

+ edge

Точность
Попиксельной
сегментации

Slides from Shotton’s ECCV talk

Точность Форма-текстура: 69.6% + границы: 70.3% shape-texture + edge Точность Попиксельной сегментации

Слайд 34

Положение объектов

Положение
Нормализуем координаты по всем изображениям
Посчитываем частоту появления объектов в данной точке

Положение объектов Положение Нормализуем координаты по всем изображениям Посчитываем частоту появления объектов
изображения
Ncow, = 1, N = 3

Think Naïve Bayes

Prevent overfit (tuned)

Слайд 35

Моделирование цвета

Цвет
Обучаем модель цвета только по изображению
Идея
Используем классификацию по другим признакам как

Моделирование цвета Цвет Обучаем модель цвета только по изображению Идея Используем классификацию
исходные параметры
Обучаем модель смеси гауссиан (кластеризация цветов)
Каждый класс – свои веса смеси
Обучаем веса итеративным EM-алгоритмом

Слайд 36

Общий результат

Форма и текстура: 69.6%
+ границ: 70.3%
+ цвет: 72.0%
+ положение: 72.2%

shape-texture

+ edge

+

Общий результат Форма и текстура: 69.6% + границ: 70.3% + цвет: 72.0%
colour & location

Точность
Попиксельной
сегментации

Slides from Shotton’s ECCV talk

Слайд 37

Результаты

Successes

Результаты Successes

Слайд 38

Ошибки

Ошибки
Имя файла: Семантическая-сегментация.pptx
Количество просмотров: 238
Количество скачиваний: 0