Содержание
- 2. Who are you, again? 2015-2019 Бакалавриат Data Science 2018-now Разработчик машинного обучения
- 3. Глава 1 О проблеме
- 4. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3
- 5. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3 Заполнить данные в форму
- 6. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3 Распечатать и подписать заявление
- 7. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3 Отправить на проверку и дождаться
- 8. Описание проблемы Пользователь Электронная подпись Шаг 1 Шаг 2 Шаг 3
- 9. Описание проблемы Шаг 1 Шаг 2 Шаг 3
- 10. Описание проблемы Шаг 1 Шаг 2 Шаг 3
- 11. Описание проблемы Шаг 1 Шаг 2 Шаг 3
- 12. Описание проблемы Шаг 1 Шаг 3 Шаг 2
- 13. Интересные цифры Время оператора на 1 заявление: 2 МИН.
- 14. Интересные цифры Время оператора на 1 заявление: 2 МИН. Время ожидания очереди к оператору: 2-4 ЧАСА
- 15. Решение Распознаем скан/фото и предупреждаем об ошибках: не совпадает дата не совпадает номер телефона не совпадают
- 16. Глава 2 О том, как устроена архитектура решения
- 17. Цели Быстро для создания Контролируемо Поменьше велосипедов
- 18. Заявление
- 19. Заявление QR код Таблица Дата Паспортные данные Блок подписей + печать Телефон
- 20. 1 giant model End2End
- 21. 1 giant model End2End – way too heavy Долго и сложно создавать Очень сложно контролировать
- 22. OCR OCR + rules rules
- 23. OCR OCR + rules – way too unstable rules Низкое качество Сложные и нестабильные правила
- 24. QR код Таблица Дата Паспортные данные Блок подписей + печать Телефон
- 25. QR код Таблица Дата Паспортные данные Блок подписей + печать Телефон
- 26. Таблица Дата Паспортные данные Блок подписей + печать Телефон
- 27. Pipeline Segmentation Text recognition Дата Телефон Другие данные ФИО, серия, номер Multilabel classification Есть печать Есть
- 28. Pipeline Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Дата Телефон
- 29. Pipeline Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Box extraction
- 30. Технологии Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Дата Телефон Другие данные
- 31. Глава 3 О граблях, технологиях и озарениях
- 32. Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Box extraction Предобработка
- 33. Предобработка картинки Сегментация Распознавание текста Как сделать поворот картинок?
- 34. Предобработка картинки Сегментация Распознавание текста Как максимально глупо (но очень быстро) сделать поворот картинки?
- 35. Предобработка картинки Сегментация Распознавание текста Как максимально глупо (но очень быстро) сделать поворот картинки? сделать обучающую
- 36. Предобработка картинки Сегментация Распознавание текста Как максимально глупо (но очень быстро) сделать поворот картинки? сделать обучающую
- 37. Предобработка картинки Сегментация Распознавание текста Как максимально глупо поворачивать картинку? Метрика: среднее отклонение угла Было Предсказание
- 38. Предобработка картинки Сегментация Распознавание текста Вывод: Иногда самое тупое решение может оказаться неплохим baseline-ом. P.S. В
- 39. Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Box extraction Предобработка
- 40. Предобработка картинки Сегментация Распознавание текста FPN – Feature Pyramid Network https://arxiv.org/abs/1612.03144
- 41. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c FPN: ну очень быстрый обзор
- 42. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c FPN: ну очень быстрый обзор U
- 43. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c Bottom-up: понижаем разрешение, увеличиваем семантический смысл картинки
- 44. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c Top-down: восстанавливаем разрешение картинки
- 45. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c 1x1 свертки: повторяют смысл skip-connections в ResNet
- 46. Предобработка картинки Сегментация Распознавание текста https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c Предсказания каждого слоя скейлятся к нужному размеру и соединяются в
- 47. Предобработка картинки Сегментация Распознавание текста More on segmentation model Модель сегментации: FPN Backbone – ResNet, предтренированный
- 48. Предобработка картинки Сегментация Распознавание текста More on segmentation model Модель сегментации FPN Backbone – ResNet, предтренированный
- 49. Предобработка картинки Сегментация Распознавание текста More on segmentation model Модель сегментации FPN Backbone – ResNet, предтренированный
- 50. Предобработка картинки Сегментация Распознавание текста Spinoff bce_jaccard_loss Balanced cross entropy + Jaccard loss IoU metric
- 51. Предобработка картинки Сегментация Распознавание текста More on segmentation model Модель сегментации FPN Backbone – ResNet, предтренированный
- 52. Предобработка картинки Сегментация Распознавание текста Вывод Value: 0.9847
- 53. Segmentation Text recognition Multilabel classification Есть печать Есть подпись субъекта Есть расшифровка Orientation Box extraction Предобработка
- 54. Предобработка картинки Сегментация Распознавание текста Дано:
- 55. Предобработка картинки Сегментация Распознавание текста Мы распознаем текст с помощью Tesseract https://github.com/tesseract-ocr/ Open Source OCR Engine
- 56. Предобработка картинки Сегментация Распознавание текста Tesseract – очень хорош
- 57. Предобработка картинки Сегментация Распознавание текста Tesseract – очень хорош, но капризен Detected:
- 58. Предобработка картинки Сегментация Распознавание текста Tesseract – очень хорош, но капризен Detected: + 9 322- Detected:
- 59. Предобработка картинки Сегментация Распознавание текста Магия для Tesseract’а
- 60. Предобработка картинки Сегментация Распознавание текста Магия для Tesseract’а Padding Scaling
- 61. Предобработка картинки Сегментация Распознавание текста Что ещё полезно знать о Tesseract Используйте Tesseract V4, у которого
- 62. Предобработка картинки Сегментация Распознавание текста Вывод: Tesseract – на удивление простое в использовании и качественное решение.
- 63. Глава 4: Завершающая
- 64. Итоги Accuracy so far: даты: 98% телефоны: 96% паспортные данные: 86% Summary: FPN – очень сильная
- 66. Скачать презентацию