Содержание
- 2. Основная цель При построении терминологических словарей важную роль играют многословные термины. Они составляют 80% всех терминов
- 3. Постановка задачи Разработать формальное представление словосочетаний текста в виде последовательности слов, а также дерева зависимостей между
- 4. Структура словосочетания Словосочетание – Phrase состоит из 4 элементов: Phrase = Parts – Упорядоченная последовательность слов
- 5. Структура словосочетания Phrase = Relations – Набор пар: позиции главного и подчиненного слова, и набор морфологический
- 6. Структура словосочетания Pattern = root - позиция корневого слова в словосочетании, то есть, является корневым, главным
- 7. Таблица согласований Зачастую согласования между некоторыми частями различных правил или словосочетаний совпадают. Например очень часто встречаются
- 8. Согласование Морфологическое согласование - набор параметров для согласования главного слова с подчиненным словом (падеж, род, число
- 9. Особенности построения связей между элементами словосочетания 1. Первая связь (пара) строится от корневого слова. Пример 6:
- 10. Структура правил Правило – Pattern состоит из 4 элементов, по аналогии с тем как строится Phrase,
- 11. Алгоритм извлечения словосочетаний из текста 0 шаг: (1 обход текста) Составляется словарь терминов. 1 шаг: (2
- 12. 2 шаг: (3 обход текста) Для каждой гипотезы в соответствии с текущей позицией в тексте проверяем
- 13. Извлечение словосочетаний ТАБЛИЦА СОГЛАСОВАНИЙ ТАБЛИЦА ПРАВИЛ СЛОВАРЬ СЛОВОСОЧЕТАНИЙ ЯДРО ПОИСКА ОБРАБАТЫВАЕМЫЙ ТЕКСТ СЛОВАРЬ ТЕРМИНОВ
- 14. Словарь словосочетаний Таблица правил
- 15. Редактор словосочетаний
- 16. Редактор правил
- 17. Согласование морфологических признаков.
- 18. Результаты обработки текстов Было обработано 3 текста из разных предметных областей. Таблица правил содержала 5 основных
- 19. Результаты обработки текстов
- 21. Скачать презентацию