Содержание
- 2. Who are you, again? 2015-2019 Бакалавриат Data Science 2018-now Разработчик машинного обучения
- 3. Глава 1 О проблеме
- 4. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3
- 5. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3 Заполнить данные в форму
- 6. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3 Распечатать и подписать заявление
- 7. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3 Отправить на проверку и дождаться
- 8. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3
- 9. Описание проблемы Шаг 1 Шаг 2 Шаг 3
- 10. Описание проблемы Шаг 1 Шаг 2 Шаг 3
- 11. Описание проблемы Шаг 1 Шаг 2 Шаг 3
- 12. Описание проблемы Шаг 1 Шаг 3 Шаг 2
- 13. Интересные цифры Время оператора на 1 заявление: 2 МИН.
- 14. Интересные цифры Время оператора на 1 заявление: 2 МИН. Время ожидания очереди к оператору: 2-4 ЧАСА
- 15. Решение Распознаем скан/фото и предупреждаем об ошибках: не совпадает дата не совпадает номер телефона не совпадают
- 16. Глава 2 О том, как устроена архитектура решения
- 17. Цели Быстро для создания Контролируемо Поменьше велосипедов
- 18. Заявление
- 19. Заявление QR код Таблица Дата Паспортные данные Блок подписей + печать Телефон
- 20. 1 giant model End2End
- 21. 1 giant model End2End – way too heavy Долго и сложно создавать Очень сложно контролировать
- 22. OCR OCR + rules rules
- 23. OCR OCR + rules – way too unstable rules Низкое качество Сложные и нестабильные правила
- 24. QR код Таблица Дата Паспортные данные Блок подписей + печать Телефон
- 25. QR код Таблица Дата Паспортные данные Блок подписей + печать Телефон
- 26. Таблица Дата Паспортные данные Блок подписей + печать Телефон
- 27. Pipeline Segmentation Text recognition Дата Телефон Другие данные ФИО, серия, номер Multilabel classification Есть печать Есть
- 28. Pipeline Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Дата Телефон
- 29. Pipeline Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Box extraction
- 30. Технологии Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Дата Телефон Другие данные
- 31. Глава 3 О граблях, технологиях и озарениях
- 32. Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Box extraction Предобработка
- 33. Предобработка картинки Сегментация Распознавание текста Как сделать поворот картинок?
- 34. Предобработка картинки Сегментация Распознавание текста Как максимально глупо (но очень быстро) сделать поворот картинки?
- 35. Предобработка картинки Сегментация Распознавание текста Как максимально глупо (но очень быстро) сделать поворот картинки? сделать обучающую
- 36. Предобработка картинки Сегментация Распознавание текста Как максимально глупо (но очень быстро) сделать поворот картинки? сделать обучающую
- 37. Предобработка картинки Сегментация Распознавание текста Как максимально глупо поворачивать картинку? Метрика: среднее отклонение угла Было Предсказание
- 38. Предобработка картинки Сегментация Распознавание текста Вывод: Иногда самое тупое решение может оказаться неплохим baseline-ом. P.S. В
- 39. Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Box extraction Предобработка
- 40. Предобработка картинки Сегментация Распознавание текста FPN – Feature Pyramid Network https://arxiv.org/abs/1612.03144
- 41. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c FPN: ну очень быстрый обзор
- 42. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c FPN: ну очень быстрый обзор U
- 43. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c Bottom-up: понижаем разрешение, увеличиваем семантический смысл картинки
- 44. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c Top-down: восстанавливаем разрешение картинки
- 45. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c 1x1 свертки: повторяют смысл skip-connections в ResNet
- 46. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c Предсказания каждого слоя скейлятся к нужному размеру и соединяются в
- 47. Предобработка картинки Сегментация Распознавание текста More on segmentation model Модель сегментации: FPN Backbone – ResNet, предтренированный
- 48. Предобработка картинки Сегментация Распознавание текста More on segmentation model Модель сегментации FPN Backbone – ResNet, предтренированный
- 49. Предобработка картинки Сегментация Распознавание текста More on segmentation model Модель сегментации FPN Backbone – ResNet, предтренированный
- 50. Предобработка картинки Сегментация Распознавание текста Spinoff bce_jaccard_loss Balanced cross entropy + Jaccard loss IoU metric
- 51. Предобработка картинки Сегментация Распознавание текста More on segmentation model Модель сегментации FPN Backbone – ResNet, предтренированный
- 52. Предобработка картинки Сегментация Распознавание текста Вывод Value: 0.9847
- 53. Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Box extraction Предобработка
- 54. Предобработка картинки Сегментация Распознавание текста Дано:
- 55. Предобработка картинки Сегментация Распознавание текста Мы распознаем текст с помощью Tesseract https://github.com/tesseract-ocr/ Open Source OCR Engine
- 56. Предобработка картинки Сегментация Распознавание текста Tesseract – очень хорош
- 57. Предобработка картинки Сегментация Распознавание текста Tesseract – очень хорош, но капризен Detected:
- 58. Предобработка картинки Сегментация Распознавание текста Tesseract – очень хорош, но капризен Detected: + 9 322- Detected:
- 59. Предобработка картинки Сегментация Распознавание текста Магия для Tesseract’а
- 60. Предобработка картинки Сегментация Распознавание текста Магия для Tesseract’а Padding Scaling
- 61. Предобработка картинки Сегментация Распознавание текста Что ещё полезно знать о Tesseract Используйте Tesseract V4, у которого
- 62. Предобработка картинки Сегментация Распознавание текста Вывод: Tesseract – на удивление простое в использовании и качественное решение.
- 63. Глава 4: Завершающая
- 64. Итоги Accuracy so far: даты: 98% телефоны: 96% паспортные данные: 86% Summary: FPN – очень сильная
- 66. Скачать презентацию































































Определение идеи алгоритма, выбор методов решения и структур данных. Деревья
Preparez vous a travailler pour eux
Моделирование дивана в программе 3D Max
Исследование прохождения амплитудно-модулированного колебания через колебательный контур. Лабораторная работа 3
Видеонаблюдение и WI-FI для ЦОК и учебных аудиторий УОРП
Логические элементы компьютеров
Шаблоны День Народного Единства
Заставка 100 идей для Беларуси
Международная ассоциация дилеров ПАО АВТОВАЗ. Вопросы по изменениям в чек-листах аудитов, MS, ГДР
Презентация на тему Составление программ на языке Pascal
История развития вычислительной техники
Электронный листок нетрудоспособности. Обзор функционала и пользовательских интерфейсов
Алгоритмы и работа с величинами
Разработка дизайна сайта Помощь жертвам насилия
Основы программирования на языке Python
Дискретные модели данных в компьютере
Алгоритмы и структуры данных на Python. Хеш-функции, хеши, хештаблицы
Презентация на тему Современные браузеры (11 класс)
Базы данных. Системы управления базами данных и банками знаний
Библиотека ГОУ ВО ЛНР ЛГАУ. Выставка новых поступлений книг
Программирование на языке Паскаль. Оператор выбора
Свойства логических высказываний
Manga Store. Our team developer
Формы мышления. Алгебра высказываний. Логические выражения и таблицы истинности
Разработка проектов приграничного сотрудничества
Инструкция по регистрации Coursera
Показ доработок версии 10.2.310pptx
Язык С# и платформа .NET