Содержание
- 2. Этапы обработки текста Токенизация Газеттер Морфологический анализ Семантический словарь Кейп (CAPE – C Annotation Patterns Engine)
- 3. Токенизация Кодировка 1251 и 1252 Форматы html и текст Категории токенизации: текстовый блок абзац предложение слово
- 4. Газеттер Осуществляет поиск слов и словосочетаний с учётом словоформ. Найденным терминам присваиваются указанные в словаре атрибуты.
- 5. Примеры из словарей газеттера Можно указывать грамматические значения для неизвестных слов: врио SYN {SpeechPartDetailed="NounAnimateM",WordBase="ВРИП", Case="Any",Number="Singular",Person="Third",Gender="Masculine"} Можно
- 6. Морфологический анализ Определение грамматических характеристик слова (часть речи, падеж, число, род, лицо и т.д.) В основном
- 7. Семантический словарь Навешивает на сущности текста семантические категории и определяет принадлежность к семантическому ряду. Основные категории:
- 8. Кейп (CAPE) Выделение в тексте сущностей с помощью специальных правил и регулярных выражений. Правила написаны на
- 9. Примеры правил CAPE Правила могут основываться на предыдущих правилах. В данном примере используется семантический тип, определяющийся
- 10. Модуль выделения именованных объектов Выделяет имена персон, названия организаций и географические наименования по общим правилам, опираясь
- 11. Примеры XML-описаний объектов Пример xml-описания для объекта «Путин», тип «персона»: мужской Путин Владимир Владимирович преемник Ельцина
- 12. Примеры XML-описаний объектов Пример xml-описания для объекта с типом «организация»: мужской Акционерный коммерческий Промышленно-торговый банк АК
- 13. Синтаксический анализ Синтаксический разбор предложения в терминах дерева зависимостей. Установление синтактико-семантических связей между словами и их
- 15. Поиск фактов Производится с помощью шаблонов на основе синтаксического разбора предложения. В графе синтаксического разбора атрибуты.
- 18. Скачать презентацию













Образные коды двузначных чисел (урок 11)
Исследовательская работа: Рисованная мультипликация. 4 класс
Массивы
Объединение компьютеров в локальную сеть
Язык запросов
Руководство по оплате инвестиционных программ компании ICN Holding с использованием платежной системы Банка Авангард
Как сформировать заявку на цикл
Алгоритмы, повторение
Путешествие в страну Информатику
Электронная почта. Телеконференции
Сюжет и дополнения. Стражи
Гендерное воспитание. Ты не один
Быть в 10 раз эффективнее благодаря Groovy
Информационные технологии в индустрии полимеров. Практическое занятие 1
Приложение к положению о конкурсе фоторабот Сибстрин в лицах
Операции арифметические, сравнения, логические и поразрядные. Лекция 10
Ustroystvo_kompyutera
Архитектура компьютеров и их основные характеристики
Лекция 3 2021
Применение технологии критического мышления на уроках информатики
Неправославные религиозные СМИ на территории Прикамья: тематика, структура, функции
Языки программирования. Pascal
Цифровое образование и информационная среда школы
Условные конструкции VBA
Современные периферийные устройства виртуальной реальности
Проектирование сетевой инфраструктуры локальной вычислительной сети для ООО Цефей сервис
Создание web-сайта. Коммуникационные технологии
prez_0