Содержание
- 2. План презентации Введение Цели и задачи работы Краткий обзор существующего положения Проекты извлечения информации из текстов
- 3. Введение Автоматическая обработка текстов на естественном языке (ЕЯ) - одно из приоритетных направлений в области новых
- 4. Введение Проект OntosMiner реализуется швейцарской фирмой Ontos AG и российской IT-фирмой АвиКомп Мотивация разработки: Создание многоплатформенного
- 5. Введение Проект OntosMiner Текущее состояние проекта: Разработан инструментарий для создания систем типа IE на базе среды
- 6. Введение Проект OntosMiner
- 7. Введение Проект OntosMiner
- 8. Цели и задачи настоящей работы Обсуждение метрик для оценки качества функционирования систем извлечения информации из текстов
- 9. Краткий обзор существующего положения Новые технологии и продукты (Прогноз Gartner Group 2005) Интеллектуальный анализ текстов Корпоративный
- 10. Проекты извлечения информации из текстов США Проект TIPSTER (1991 – 1998) Конференции TREC, MUC Программа TIDES
- 11. Проекты извлечения информации из текстов Проект TIPSTER – новые технологии обработки текстов (1991 – 1998). Управление
- 12. Проекты извлечения информации из текстов Программа TIDES (Translingual Information Detection, Extraction, and Summarization) – новая программа
- 13. Проекты извлечения информации из текстов Европа: Форум CLEF
- 14. Проекты извлечения информации из текстов Япония: Форум NTCIR
- 15. Проекты извлечения информации из текстов Россия: Инициатива РОМИП
- 16. Существующие метрики оценки систем типа IE Начало работам по метрикам оценки систем извлечения информации из текстов
- 17. Основные требования: Значения метрик должны быть максимальными для «хороших» систем и минимальными для «плохих», а их
- 18. Достоинства: Отвечают основному критерию, указанному выше и эффективно вычислимы, а также понятны эксперту. Недостатки: Не всегда
- 19. Предлагаемые метрики оценки систем типа IE Основные требования к системе метрик: Монотонность всех метрик и системы
- 20. Предлагаемые метрики оценки систем типа IE Параметры новой системы метрик Для существующих метрик оценки качества систем
- 21. Метрики оценки качества обработки объектов Оценка точности выделения объектов Правильно идентифицированным будем называть такой объект, который,
- 22. Метрики оценки качества обработки объектов Оценка точности выделения объектов Тогда, по аналогии, полностью неправильно идентифицированный объект
- 23. Метрики оценки качества обработки объектов Оценка точности выделения объектов Иначе обстоит дело с частично правильно идентифицированными
- 24. Метрики оценки качества обработки объектов Оценка точности выделения объектов где α(X) , ε(X) и δ(X) –
- 25. Метрики оценки качества обработки объектов Оценка точности выделения объектов С учетом введенных выше понятий
- 26. Метрики оценки качества обработки отношений Общие замечания Оценки точности выделения отношений, в отличие от объектов, в
- 27. Метрики оценки качества обработки отношений Оценка точности выделения отношений Правильно идентифицированным будем называть такое отношение, которое,
- 28. Метрики оценки качества обработки отношений Оценка точности выделения отношений Тогда полностью неправильно идентифицированное отношение можно фиксировать
- 29. Метрики оценки качества обработки отношений Оценка точности выделения отношений Для частично правильно идентифицированных отношений, как и
- 30. Метрики оценки качества обработки отношений Оценка точности выделения отношений – коэффициенты качества обработки всего отношения, его
- 31. Метрики оценки качества обработки отношений Оценка точности выделения отношений С учетом введенных выше понятий
- 32. Метрики оценки качества обработки объектов/отношений Оценка полноты выделения объектов/отношений В оценках полноты в классическом варианте участвуют
- 33. Интегральные оценки качества систем типа IE В предлагаемой системе метрик для точности и полноты введены по
- 34. Тестирование новой системы метрик Для тестирования новой системы метрик была проведена оценка качества процессора OntosMiner/Russian. Для
- 35. Тестирование новой системы метрик Для оценки результатов было решено использовать объекты типа Person, JobTitle/Title, Organization и
- 36. Тестирование новой системы метрик Классические оценки
- 37. Тестирование новой системы метрик Предлагаемые оценки (объекты)
- 38. Тестирование новой системы метрик Предлагаемые оценки (отношения)
- 39. Полученные результаты и дальнейшие исследования Анализ полученных результатов: Новые метрики более «чувствительны» к ошибкам в определении
- 41. Скачать презентацию