TeamLead команды SMART

Содержание

Слайд 3

Интеллектуальная ECM

DIRECTUM Ario = ML + CV + NLP
Автоматизация выполнения рутинных операций

Интеллектуальная ECM DIRECTUM Ario = ML + CV + NLP Автоматизация выполнения
в ECM
Структурированный и неструктурированный контент

Слайд 4

Архитектура DIRECTUM Ario

DIRECTUM TextExtractor Service

DIRECTUM Classifier Service

DIRECTUM FactExtractor Service

классификация документов в различных разрезах

извлечение

Архитектура DIRECTUM Ario DIRECTUM TextExtractor Service DIRECTUM Classifier Service DIRECTUM FactExtractor Service
значимых данных (реквизитов)

извлечение текстового слоя из документов

DIRECTUM SmartService

управление, статистика,
API

Слайд 5

Реализация

Предобработка
Компьютерное зрение (Computer Vision, CV)
Распознавание таблиц
Контекстное распознавание текста

Сканер

Распознавание текста

Классификация документа

Извлечение значимых данных

Импорт

Реализация Предобработка Компьютерное зрение (Computer Vision, CV) Распознавание таблиц Контекстное распознавание текста
и валидация в DIRECTUM

Слайд 6

Реализация

Векторное представление текста
Машинное обучение

Сканер

Распознавание текста

Классификация документа

Извлечение значимых данных

Импорт и валидация в DIRECTUM

Точность

Реализация Векторное представление текста Машинное обучение Сканер Распознавание текста Классификация документа Извлечение
(precision) = TP / (TP + FP)

Полнота (recall) = TP / (TP + FN)

F1-мера = 2 * точность * полнота / (точность + полнота)

Правильность (accuracy) = (TP + TN) / все документы

Слайд 7

Реализация

Сканер

Распознавание текста

Классификация документа

Извлечение значимых данных

Импорт и валидация в DIRECTUM

Реализация Сканер Распознавание текста Классификация документа Извлечение значимых данных Импорт и валидация в DIRECTUM

Слайд 8

Реализация

Обработка естественного языка
Извлечение именованных сущностей (NER)
Правила, машинное обучение

Сканер

Распознавание текста

Классификация документа

Извлечение значимых данных

Импорт

Реализация Обработка естественного языка Извлечение именованных сущностей (NER) Правила, машинное обучение Сканер
и валидация в DIRECTUM

Слайд 9

Реализация

Conditional Random Fields (CRF)
Feature-инжиниринг

Сканер

Распознавание текста

Классификация документа

Извлечение значимых данных

Импорт и валидация в DIRECTUM

Реализация Conditional Random Fields (CRF) Feature-инжиниринг Сканер Распознавание текста Классификация документа Извлечение

Слайд 10

Реализация

Сканер

Распознавание текста

Классификация документа

Извлечение значимых данных

Импорт и валидация в DIRECTUM

Реализация Сканер Распознавание текста Классификация документа Извлечение значимых данных Импорт и валидация в DIRECTUM

Слайд 11

Направления развития

Расширение библиотеки правил извлечения
~100 готовых правил для видов документов
Удобный инструмент настройки

Направления развития Расширение библиотеки правил извлечения ~100 готовых правил для видов документов
правил
Визуализация создания новых правил Обучаемое извлечение фактов
«Интеллектуальная ECM»
Подготовка данных для поиска Аннотация документов, проекты резолюций, автоответы Интеллектуальное сравнение документов