Слайд 2Понятие онтологии
Онтология – конструкция для представления знаний в Интернете, представляющая собой множество

объектов, классифицированных в соответствии с некоторыми критериями, плюс описание свойств этих объектов. Онтология кодирует объекты и свойства в понятном для компьютера формате.
Слайд 3Применение онтологий
Информационный поиск (Information retrieval)
Обеспечение концептуального индексирования
Семантический Веб (Semantic Web)
Автоматизация «интеллектуальных» задач

обработки значения ресурсов сети
Слайд 4Методы создания
3 подхода к созданию онтологий
Автоматическое извлечение знаний
Использование экспертов
Использование сообщества
У каждого –

свои недостатки
Для получения наилучшего результата необходимо комбинировать подходы
Слайд 5Цель дипломной работы
Цель – разработка средств интеграции двух разнородных онтологий – русскоязычной

Wikipedia и базы знаний, составленной сотрудниками НИВЦ МГУ.
Слайд 6Задачи
Анализ существующих проектов
Выбор формата результирующей онтологии
Проектирование и кодирование средств автоматической интеграции
Выборочное тестирование

результирующей онтологии
Слайд 7Обзор аналогов
Наиболее близкий аналог – YAGO
Авторы – Fabian M. Suchanek, Gerhard Weikum
Автоматическое

получение знаний из WordNet и Wikipedia
1.7 миллиона сущностей
15 миллионов фактов
Язык описания онтологии – RDF/RDFS
Слайд 8Язык описания результата
RDF/RDFS – Resource Description Framework
Разработан World Wide Web Consortium
Создан специально

для обмена онтологиями через Internet
Синтаксис на основе XML
Слайд 9Средства интеграции
Язык разработки – Python 2.6.2
Сначала онтология НИВЦ конвертируется в RDF, затем

пополняется из XML-dump Wikipedia
Для пополнения используются категории и панели информации Wikipedia
Слайд 10Результат
Проведен обзор аналогов
Выбран стандарт RDF/XML в качестве языка описания результирующей онтологии
На языке

Python созданы средства интеграции онтологий
Слайд 11Направления дальнейшей работы
Улучшение эвристик для определения категорий сущностей
Тестирование новых эвристик
Оптимизация программы по

скорости выполнения