Содержание
- 2. Автоматическое составление обзорного реферата Одна из важнейших практических задач автоматической обработки текста Обзорный реферат это совокупность
- 3. Постановка задачи Разработка модели кластеризации предложений с учетом информации об отношениях между словами, описанной в тезаурусе
- 4. Исходные данные Набор новостных статей Статьи с единой темой Результаты графематического анализа Размеченные предложения Результаты морфологического
- 5. Описание метода кластеризации предложений - 1 Определение меры близости для каждой пары предложений Векторное представление предложения
- 6. Описание метода кластеризации предложений - 2 Мера близости по отношениям концептов Тысячи людей в Мексике, Панаме,
- 7. Описание метода кластеризации предложений - 3 Описание алгоритма агломеративной кластеризации Каждое предложение – отдельный кластер, Определение
- 8. Оценка кластеризации Ручная кластеризация Попарное сравнение Вычисление F-меры
- 9. Составление аннотации Определение наиболее важных кластеров Выбор кластеров с наибольшим количеством предложений Определение и извлечение центра
- 10. Программная реализация Используемые инструментальные средства: СУБД Microsoft Access Язык программирования Microsoft Visual Basic
- 11. Описание эксперимента Дано 10 наборов по 30 новостных статей в каждом Необходимо вычислить значения параметров наилучшей
- 12. Результаты эксперимента Улучшение Fmeasure на 7% при точности P > 0.7 Пример составленной аннотации Стэнфорд попытался
- 14. Скачать презентацию