Содержание
- 2. Этапы обработки текста Токенизация Газеттер Морфологический анализ Семантический словарь Кейп (CAPE – C Annotation Patterns Engine)
- 3. Токенизация Кодировка 1251 и 1252 Форматы html и текст Категории токенизации: текстовый блок абзац предложение слово
- 4. Газеттер Осуществляет поиск слов и словосочетаний с учётом словоформ. Найденным терминам присваиваются указанные в словаре атрибуты.
- 5. Примеры из словарей газеттера Можно указывать грамматические значения для неизвестных слов: врио SYN {SpeechPartDetailed="NounAnimateM",WordBase="ВРИП", Case="Any",Number="Singular",Person="Third",Gender="Masculine"} Можно
- 6. Морфологический анализ Определение грамматических характеристик слова (часть речи, падеж, число, род, лицо и т.д.) В основном
- 7. Семантический словарь Навешивает на сущности текста семантические категории и определяет принадлежность к семантическому ряду. Основные категории:
- 8. Кейп (CAPE) Выделение в тексте сущностей с помощью специальных правил и регулярных выражений. Правила написаны на
- 9. Примеры правил CAPE Правила могут основываться на предыдущих правилах. В данном примере используется семантический тип, определяющийся
- 10. Модуль выделения именованных объектов Выделяет имена персон, названия организаций и географические наименования по общим правилам, опираясь
- 11. Примеры XML-описаний объектов Пример xml-описания для объекта «Путин», тип «персона»: мужской Путин Владимир Владимирович преемник Ельцина
- 12. Примеры XML-описаний объектов Пример xml-описания для объекта с типом «организация»: мужской Акционерный коммерческий Промышленно-торговый банк АК
- 13. Синтаксический анализ Синтаксический разбор предложения в терминах дерева зависимостей. Установление синтактико-семантических связей между словами и их
- 15. Поиск фактов Производится с помощью шаблонов на основе синтаксического разбора предложения. В графе синтаксического разбора атрибуты.
- 18. Скачать презентацию













Онлайн или не онлайн – вот в чем вопрос
Устройства ввода графической информации. Итоговое тестирование
Безопасность в сети Интернет
История создания Интернета
Компьютерные вирусы
Аппаратные и программные средства ИКТ
Трёхмерное измерение
Практические задания по PowerPoint
Компьютерное моделирование свободного падения
Системы счисления. Обобщение
Формы представления информации
Моделирование. Знаковая информационная модель
Изучение библиографических стилей. Составление списка источников. Лабораторная работа 7
Алгоритмы и исполнители. Основы алгоритмизации
Ответственное поведение в сети интернет. Киберпреступления
Коммерческий сайт компании
Особенности разработки сложных программных систем
Лекция 4
Информационная система
Язык программирования Pascal. Тест
Присоединение Средней Азии. Классификация изданий. Итоговая информативность
Основы алгоритмизации и программирования
Разработка программных модулей программного обеспечения для компьютерных систем
Человек на пути
Ежегодные мероприятия университета Частного права
Расчёт для аудио- и видеоданных
Lecture Plan: Diagonal Layout. Left-hand Margin. Which Language Used in Notes. When to Note
Компьютерное моделирование