Содержание
- 2. Наивная классификация Нужно классифицировать каждый пиксель 1 МП на картинку! Что можно сказать про 1 пиксел?
- 3. Наивная классификация Сегментируем картинку, затем классифицируем сегменты Классифицируем каждый пиксель по окрестности
- 4. Пространственная поддержка 50x50 Patch 50x50 Patch По небольшой окрестности зачастую невозможно правильно определить метку Пространственная поддержка
- 5. Построение решения Задача / Данные Элемент Пиксель Сегмент Классификация пикселов / регионов Признаки для классификации Метод
- 6. Цель: 7 геометрических классов Земля Вертикальные стены Плоскости: смотрящие влево (?), Прямо ( ), Направо (?)
- 7. Размеченные данные 300 изображений из гугла
- 8. Признаки Положение
- 9. Сегментация изображений Использование нескольких вариантов сегментации (с разными параметрами) Решение, какие сегменты хорошие, откладывается на потом
- 10. Что мы хотим узнать: Хороший ли это сегмент? Если сегмент хороший, то какая у него метка?
- 11. Классификация … … Для каждого сегмента вычисляется: - P(good segment | data) P(label | good segment,
- 12. Разметка изображений … Размеченные сегментации Размеченные пиксели
- 13. Вероятностная разметка Support Vertical Sky V-Left V-Center V-Right V-Porous V-Solid
- 14. Результат Вход Ручная разметка Результат алгоритма
- 15. Изображения из помещений Вход Ручная разметка Результат
- 16. Рисунки Вход Результат
- 17. Приложение: Automatic Photo Pop-up (SIGGRAPH’05) Изображение Метки
- 18. Automatic Photo Pop-up
- 19. TextonBoost J. Shotton, J. Winn, C. Rother, A. Criminisi, TextonBoost: Joint Appearance, Shape and Context Modeling
- 20. Data and Classes Goal: assign every pixel to a label MSRC-21 database (“void” label ignored for
- 21. Марковские Случайные Поля Независимая классификация Применяем обычный метод классификации (SVM, бустинг и т.д.) Схема Марковских Случайных
- 22. Условные случайные поля МСП для совместной оценки разметки случайных переменных (c), при условии всех данных (x)
- 23. Вывод (Inference) Вывод = поиск наилучшей совместной разметки NP-полная задача в общем случае Argmax-разметка Попарные потенциалы
- 24. Обзор метода Модель TextonBoost на основе CRF 4-х связанные окрестности Параметры обучаются независимо Вывод GraphCut VS
- 25. Форма и текстура (Shape & Texture) Первая и главная компонента модели Текстоны Фильтруем изображение банком фильтров
- 26. Моделирование формы Шаг 1: получили карту текстонов Шаг 2: Фильтры формы (Shape Filters) Для каждого текстона
- 27. Фильтры формы Пара: Отклики v(i, r, t) Большие области обеспечивают большую пространственную поддержку Рассчет через интегральные
- 28. feature response image v(i, r1, t1) feature response image v(i, r2, t2) Форма задается положением текстонов
- 29. summed response images v(i, r1, t1) + v(i, r2, t2) Форма задается положением текстонов ( ,
- 30. Обучение Используется бустинг Обычный бустинг Для каждого пикселя Для каждой возможной маски Для каждого текстона Считаем
- 31. Первый результат Только форма и текстура: 69.6% shape-texture Точность попиксельной сегментации Slides from Shotton’s ECCV talk
- 32. Уточняем разметку Добавляем границы Потенциал границ Используем попарные потенциалы для определения и подчеркивания границ Идея: Если
- 33. Точность Форма-текстура: 69.6% + границы: 70.3% shape-texture + edge Точность Попиксельной сегментации Slides from Shotton’s ECCV
- 34. Положение объектов Положение Нормализуем координаты по всем изображениям Посчитываем частоту появления объектов в данной точке изображения
- 35. Моделирование цвета Цвет Обучаем модель цвета только по изображению Идея Используем классификацию по другим признакам как
- 36. Общий результат Форма и текстура: 69.6% + границ: 70.3% + цвет: 72.0% + положение: 72.2% shape-texture
- 37. Результаты Successes
- 38. Ошибки
- 40. Скачать презентацию