Kofax. Настраиваемые (обучаемые) локаторы для счет-фактуры

Содержание

Слайд 2

Первый проект– Что дальше?

Обзор KTM Extraction
Обзор всех локаторов и анализаторов (evaluators)
Настраиваемые

Первый проект– Что дальше? Обзор KTM Extraction Обзор всех локаторов и анализаторов
(обучаемые) group locators (IGL, OGL, AGL, TGL)
Анализатор (Evaluators) – используются для сравнения локаторов
Некоторые более продвинутые локаторы
Оптимизация форм
Лучшие практики
Написание сценариев
Лицензирование

Module 9 - Trainable Invoice Locators

Слайд 3

KTM's Extraction Process

Module 9 - Trainable Invoice Locators

Примечание. Классификация (требуется для извлечения)

KTM's Extraction Process Module 9 - Trainable Invoice Locators Примечание. Классификация (требуется
происходит до или после полнотекстового OCR в зависимости от метода классификации.

Слайд 4

Локаторы и Анализаторы

Module 9 – Trainable Invoice Locators

Locators & evaluators in bold

Локаторы и Анализаторы Module 9 – Trainable Invoice Locators Locators & evaluators
black text are covered in this level 1 course.

Слайд 5


Обучаемые (настраиваемые) локаторы

Amount Group Locator – Содержит поля которые относятся к

Обучаемые (настраиваемые) локаторы Amount Group Locator – Содержит поля которые относятся к
сумме налога, общая сумма, и т. п. Обратите внимание что многие из этих полей необязательны и не должны присутствовать в счет-фактуре.
Invoice Group Locator – Поиск информации по заголовку в счет-фактуре такой как номер счет-фактры, дата, имя и идентификатор поставщика
Order Group Locator – Поиск информации, связанной с заказом, как номер заказа и дата заказа.
Trainable Group Locator – Поиск информации в зависимости от настройки (обучения): общие, конкретные или оба, и не ограничивается счетами, но может использоваться практически для любого вида формы.
Text Content Locator – на основе окружающего контекста. Полезно для неструктурированного документа, чтобы найти данные, которые вы не можете вернуть другим способом.
Table Locator – Используется специальное (layout) обучение для возврата подробной информации о позиции из сложных счетов-фактур, которые не извлекаются должным образом в автоматическом режиме.

Слайд 6


Другие локаторы и анализаторы (по алфавиту)

Address Evaluator – сравнивает поля адресов

Другие локаторы и анализаторы (по алфавиту) Address Evaluator – сравнивает поля адресов
с соответствующей базой данных и, если возможно, корректирует данные полей.
Advanced Evaluator – принимает входные данные до трех локаторов в поле вывода в оценочные условия или «шаги» и возвращает значение. Может быть настроен для вывода на несколько полей.
Advanced Zone Locator – считывает содержимое предопределенных зон на фиксированных формах.
Bar Code Locator – поиск и чтение штрих-кодов в документе.
Classification Locator – Позволяет другим Kofax Transformation Modules project (с другой схемой классификации из текущего проекта) классифицировать документ и выводить результаты в поле. Например, можно определить проект, который классифицирует документы для 50 разных языков. Используя этот языковой проект, текущий документ может быть дополнительно классифицирован для определения языка в поле, которое назначено локатору.

Слайд 7


Другие локаторы и анализаторы (по алфавиту)

Database Locator – позволяет сопоставлять записи

Другие локаторы и анализаторы (по алфавиту) Database Locator – позволяет сопоставлять записи
из данной базы данных с элементами документа. Должна использоваться плоская или «нечеткая» база данных со структурированными данными. Если база данных содержит данные клиента, локатор может идентифицировать имя, адрес и идентификатор клиента из документа, даже если документ может содержать даже не всю эту информацию.
Database Evaluator – сравнивает результаты для полей, полученных из локатора зоны, в связанную базу данных.
Format Locator – поиск элементов на основе регулярных выражений. Данные, которые обычно могут быть найдены с помощью этого типа локатора, включают суммы, даты и номера, такие как счет-фактура или страховой номер.
Invoice Header Locator – принимает результаты от 4-х форматных локаторов, предоставляющих номера счетов, заказов, количества и даты и выдержки, формируя эти правильные значения для типичных данных заголовка счета, таких как номер счета, дата заказа, общие и налоговые значения.

Слайд 8


Другие локаторы и анализаторы (по алфавиту)

Line Item Matching Locator – сопоставляет

Другие локаторы и анализаторы (по алфавиту) Line Item Matching Locator – сопоставляет
позиции в счете-фактуре для позиций в ERP или другой базе данных SQL / ODBC.
OCR Voting Evaluator – сравнивает результат зон с символом и выбирает лучший результат для каждого символа для сохранения в поле.
Relation Evaluator – оценивает результаты одного локатора по сравнению с результатами другого локатора на основе относительного местоположения результатов.
Script Locator – использует пользовательские события сценария WinWrap Basic для поиска данных. Локатор выходит на скрипт, который реализует метод определения местоположения или вызывает пользовательскую локализацию DLL.
Standard Evaluator – сравнивает результаты нескольких локаторов и выбирает набор результатов на основе заданных критериев.
Table Locator – заполняет поля таблицы. Доступны как ручные (основанные на шаблонах), так и автоматические методы извлечения на основе ключевых слов. Вы должны определить поля в «табличной модели», а затем сопоставить поля с локатором.
Vendor Locator – Обнаруживает и оценивает данные, возвращаемые локатором базы данных, на основе дополнительной информации, такой как идентификатор поставщика, номер заказа на поставку, банковская информация итд

Слайд 9

Обучаемые (настраиваемые) локаторы и база знаний

IGL, OGL, AGL и TGL требуют обучения

Обучаемые (настраиваемые) локаторы и база знаний IGL, OGL, AGL и TGL требуют
(так что локаторы текстового содержимого и некоторые локаторы таблиц). Обучение - это просто щелчок по слову или фразе на образце документов, чтобы заполнить поле, извлеченное обучаемым локатором.
Когда вы подготовили достаточное количество образцов, вы можете создавать базы знаний из своего проекта.
Базы знаний - это двоичные файлы специального назначения, которые заменяют ваши образцы учебных образцов и могут быть импортированы для использования другими проектами.
Образцы обучения и базы знаний используют общие или конкретные алгоритмы.
Общий алгоритм зависит от окружающих ключевых слов. По этой причине качество OCR важно. Он может использоваться в общем случае с помощью любого макета документа.
Конкретный алгоритм зависит от компоновки конкретного документа.

Module 9 - Trainable Invoice Locators

Слайд 10

Добавление счета в Группу Локаторов

Module 9 - Trainable Invoice Locators

Обратите внимание, что

Добавление счета в Группу Локаторов Module 9 - Trainable Invoice Locators Обратите
мы используем функцию DefaultDateFormatter для определения даты.

Слайд 11

Свойства групп локаторов

Module 9 - Trainable Invoice Locators

Тип обучения предназначен для использования

Свойства групп локаторов Module 9 - Trainable Invoice Locators Тип обучения предназначен
как общего, так и специального обучения. Примечание. Слабый словарь словаря и слайдеры проверки применяются только к общему обучению.

Мы будем импортировать один общий набор знаний, который мы предоставили вам для каждого из трех локаторов локаций, которые мы создадим. Поскольку они основаны на заранее подготовленных ключевых словах, это даст нам некоторые результаты прямо из коробки, без дополнительной подготовки. Но мы будем готовиться к лучшим результатам.

Слайд 12

Добавлений локатора группы заказов и локатор групп суммы

Module 9 - Trainable Invoice

Добавлений локатора группы заказов и локатор групп суммы Module 9 - Trainable
Locators

Создайте еще два локатора, используя Locator Group Locator и методы Locator Group.

Затем давайте попробуем изменить вход локатора для четырех созданных нами полей. IGL вернет номер счета и дату, OGL вернет номер заказа. И AGL вернет общую сумму.
То, что мы пытаемся сделать, - использовать более «общий» метод для поиска наших данных в более широком разнообразии форм.

Слайд 13

Новые поля

Пока мы это делаем, давайте выведем результаты для промежуточного итога и

Новые поля Пока мы это делаем, давайте выведем результаты для промежуточного итога
налогов. Это означает создание двух новых полей и вывод данных из наших локаторов. И мы применим формат форматирования по умолчанию для обоих.

Module 9 - Trainable Invoice Locators

Слайд 14

Теперь нам нужно обучаться извлечению

Module 9 - Trainable Invoice Locators

Вы можете выбрать

Теперь нам нужно обучаться извлечению Module 9 - Trainable Invoice Locators Вы
хорошие репрезентативные выборки из разных тренировок по извлечению макетов. Для конкретного обучения 1-4 выборки обычно достаточно. Для общего обучения важно получить образцы из как можно большего количества разных типов документов. Помните, что он основан на ключевых словах, и он должен знать все варианты, связанные с согласованными значениями.

Слайд 15

Пробуем в каждом поле левой кнопкой мыши или рисованием

Module 9 - Trainable

Пробуем в каждом поле левой кнопкой мыши или рисованием Module 9 -
Invoice Locators

Убедитесь, что курсор находится в правильном поле, а затем левой кнопкой мыши щелкните нужное значение для строк без пробелов или lasso значение, если пробелы включены.
Фиолетовыми значениями являются ключевые слова, используемые общим алгоритмом для нахождения значений и по конкретному алгоритму в качестве якорей для регистрации.

Начните с обучения на одном хорошем примере макета каждой формы.

Примечание. Чтобы исправить ошибочные ключевые слова, поместите курсор в соответствующее поле и [CTRL] щелкните правой кнопкой мыши по ключевому слову, чтобы очистить его, и, удерживая клавишу [CTRL], щелкните правой кнопкой мыши по правильному ключевому слову, чтобы установить его.

Слайд 16

Добавить тренировочный комплект

Module 9 - Trainable Invoice Locators

Примечание: На этой форме нет

Добавить тренировочный комплект Module 9 - Trainable Invoice Locators Примечание: На этой форме нет налогов.
налогов.

Слайд 17

Обучаемся на других документах

Module 9 - Trainable Invoice Locators

Обучаемся на других документах Module 9 - Trainable Invoice Locators

Слайд 18

Добавляем другой

Module 9 - Trainable Invoice Locators

Добавляем другой Module 9 - Trainable Invoice Locators

Слайд 19

Обучаемся на проекте

Module 9 - Trainable Invoice Locators

Автосохранение. Спасибо, Project Builder!

Обучаемся на проекте Module 9 - Trainable Invoice Locators Автосохранение. Спасибо, Project Builder!

Слайд 20

И тестируем

Module 9 - Trainable Invoice Locators

Не забывайте, что вы можете протестировать

И тестируем Module 9 - Trainable Invoice Locators Не забывайте, что вы
локатор каждой группы отдельно, и вы можете (и должны) запустить Extraction Benchmark, чтобы проверить результаты вашего извлечения.

Слайд 21

Удаляем неиспользованные форматы локаторов

Поскольку мы больше не используем локаторы формата, чтобы возвращать

Удаляем неиспользованные форматы локаторов Поскольку мы больше не используем локаторы формата, чтобы
результаты, мы собираемся удалить пару из них. Мы оставим пару на месте для использования со стандартным оценщиком, о котором мы узнаем немного позже...

Module 9 - Trainable Invoice Locators

x

x

Слайд 22

Добавляем KTM Верификацию

Модуль верификации позволяет верифицировать данные который уже были на валидации.

Добавляем KTM Верификацию Модуль верификации позволяет верифицировать данные который уже были на
Он является необязательным и должен использоваться только тогда, когда абсолютная точность некоторых полей является критичной. Верификация настроена для отдельных полей через Details Panel.

Module 9 - Trainable Invoice Locators

Существует три режима верификации:
Подтверждение требует от оператора на валидации подтвердить путем нажатия [Enter].
Blind double keying закрывает валидацию и требует от оператора ввода значения вручную. Затем сравниваются два значения.
Только для чтения отображается подтвержденное значение для поля, но не позволяет оператору изменять его.

We'll turn on Verification for the InvoiceNumber, InvoiceDate and Totalamount fields.

Имя файла: Kofax.-Настраиваемые-(обучаемые)-локаторы-для-счет-фактуры.pptx
Количество просмотров: 39
Количество скачиваний: 0