Слайд 2Когда люди ищут в интернете картинку или видео, они часто прибавляют к
запросу фразу «в хорошем качестве». Под качеством обычно имеется в виду разрешение — пользователи хотят, чтобы изображение было большим и при этом хорошо выглядело на экране современного компьютера, смартфона или телевизора. Но что делать, если источника в хорошем качестве просто не существует?
Слайд 3В интернете много видеоконтента в низком качестве и разрешении. Это могут быть
фильмы, снятые десятки лет назад. Когда пользователи растягивают такое видео на весь экран, то изображение становится мутным и нечётким. Идеальным решением для старых фильмов было бы найти оригинал плёнки, отсканировать на современном оборудовании и отреставрировать вручную, но это не всегда возможно. В связи с этим наиболее приемлемый вариант— увеличивать разрешение и вычищать артефакты, используя технологии компьютерного зрения.
Слайд 4В индустрии задачу увеличения картинок и видео без потери качества называют термином
super-resolution. На эту тему уже написано множество статей, но реалии «боевого» применения оказались намного сложнее и интереснее.
Слайд 5Коротко о главных проблемах, которые пришлось решать в технологии DeepHD:
Нужно уметь восстанавливать
детали, которых не было на оригинальном видео ввиду его низкого разрешения и качества, “дорисовывать” их.
Решения из области super-resolution восстанавливают детали, но они делают чёткими и детализованными не только объекты на видео, но и артефакты сжатия, что вызывает неприязнь у зрителей.
Есть проблема со сбором обучающей выборки – требуется большое количество пар, в которых одно и то же видео присутствует и в низком разрешении и качестве, и в высоком. В реальности для плохого контента обычно нет качественной пары.
Решение должно работать в реальном времени.
Слайд 6В последние годы использование нейронных сетей привело к значительным успехам в решении
практически всех задач компьютерного зрения, и задача super-resolution не исключение. Наиболее перспективными нам показались решения на основе GAN (Generative Adversarial Networks, генеративные соперничающие сети). Они позволяют получить фотореалистичные изображения высокой чёткости, дополняя их недостающими деталями.
Слайд 7В самом простом случае нейронная сеть состоит из двух частей. Первая часть
– генератор – принимает на вход изображение и возвращает увеличенное в два раза. Вторая часть – дискриминатор – получает на вход изображение, сгенерированные и “настоящие”, и пытается отличить друг от друга.
Слайд 8Весной технология DeepHD была испытанна на нескольких старых фильмах, посмотреть которые можно
на КиноПоиске: «Радуга» Марка Донского (1943), «Летят журавли» Михаила Калатозова (1957), «Дорогой мой человек» Иосифа Хейфица (1958), «Судьба человека» Сергея Бондарчука (1959), «Иваново детство» Андрея Тарковского (1962), «Отец солдата» Резо Чхеидзе (1964) и «Танго нашего детства» Альберта Мкртчяна (1985).
Слайд 9Разница между версиями до и после обработки особенно заметна, если вглядываться в
детали: изучать мимику героев на крупных планах, рассматривать фактуру одежды или рисунок ткани. Удалось компенсировать и некоторые недостатки оцифровки: например, убрать пересветы на лицах или сделать более заметными предметы, размещённые в тени.