ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Нат
Содержание
- 2. ТЕРМИНЫ И ИХ ВАРИАНТЫ Термины – слова и словосочетания, называющие понятия предметной области рентгеновское излучение Употребление
- 3. КЛАССИФИКАЦИЯ ВАРИАНТОВ Классификация терминологических вариантов для научно-технических текстов: графические – компьютер/Компьютер флективные – данные/данных орфографические –
- 4. ПОСТАНОВКА ЗАДАЧИ Изучить классификацию терминологических вариантов и подходы к их выявлению На базе классификации разработать методы
- 5. ПОДХОДЫ К ВЫЯВЛЕНИЮ Символьный (статистический) подход Термин и его варианты – символы Вычисляется функция близости для
- 6. ПРЕДЛАГАЕМОЕ РЕШЕНИЕ Для каждого типа терминологических вариантов используется свой метод, основанный на одном из подходов
- 7. ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ВАРИАНТЫ: ФОРМАЛИЗАЦИЯ Информация о лексико-синтаксических вариантах формализована в виде правил их образования Для формализации выбран
- 8. ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ВАРИАНТЫ: ВЫЯВЛЕНИЕ Основано на автоматической конкретизации шаблона правила A1 N1 # A1 N2 рентгеновские лучи
- 9. ОБЩАЯ ПРОЦЕДУРА ВЫЯВЛЕНИЯ Исходная информация: Список терминов L1 Список кандидатов в терминологические варианты L2 Алгоритм: 1.
- 10. ПРОГРАММНЫЕ СРЕДСТВА: АРХИТЕКТУРА Компонент выявления терминологических вариантов Консольные утилиты Компонент выявления терминов шаблоны текст шаблоны словари
- 11. РЕАЛИЗАЦИЯ И ТЕСТИРОВАНИЕ МЕТОДОВ Для реализации использован язык С++ Библиотеки: LSPL, AOT, boost, STL Система контроля
- 12. РЕЗУЛЬТАТЫ РАБОТЫ Проанализированы современные подходы к выявлению терминологических вариантов, изучена классификация вариантов, типичных для русскоязычных научно-технических
- 13. Результаты работы были представлены (с публикацией) на: Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов
- 15. Скачать презентацию