Андон Ф.И., Резниченко В.А.Онтологии – проблемы создания и примененияИнститут программных систем НАН Украины

Содержание

Слайд 2

Содержание

Базовые понятия
Способы придания смысла понятиям
управляемые словари
таксономии
тезаурусы
онтологии
Онтологии
концептуализация
спецификация
формализация
Инженерия онтологий
жизненный цикл
операции над онтологиями
выводы в онтологии
Языки

Содержание Базовые понятия Способы придания смысла понятиям управляемые словари таксономии тезаурусы онтологии
онтологий

Слайд 3

Базовые понятия

Суждение – форма мысли, в которой утверждается или отрицается что-либо относительно

Базовые понятия Суждение – форма мысли, в которой утверждается или отрицается что-либо
предметов и явлений окружающего мира, их свойств, связей и отношений и которая обладает свойством выражать либо истину или ложь.
Понятие (концепт) – целостная совокупность суждений, то есть мыслей, в которых что-либо утверждается об отличительных признаках исследуемого объекта, ядром которого являются суждения о наиболее общих и в то же время существенных признаках этого объекта. Объем (экстенсионал) понятия – класс обобщенных в понятии объектов. Содержание (интенсионал) понятия – совокупность (обычно существенных) признаков, по которым произведено обобщение и выделение объектов в данном понятии.
Термин – слово или словосочетание, точно и однозначно именующее понятие и его соотношение с другими понятиями.

Слайд 4

Веб и семантический веб

Веб и семантический веб

Слайд 5

Концептуальная модель предметной области

Концептуальная модель предметной области

Слайд 6

Инфологическая модель

Инфологическая модель

Слайд 7

Логическая модель данных

Логическая модель данных

Слайд 8

Фреймовая модель представления знаний

Фреймовая модель представления знаний

Слайд 9

Семантическая сеть

Семантическая сеть

Слайд 10

Тезаурус

Тезаурус

Слайд 11

Онтология

Онтология

Слайд 12

От словаря к онтологии

От словаря к онтологии

Слайд 13

Управляемый словарь (Controlled Vocabulary)

Управляемый словарь – это способ организации знаний с целью

Управляемый словарь (Controlled Vocabulary) Управляемый словарь – это способ организации знаний с
облегчения их представления и последующего поиска
Управляемый словарь – это список явно заданных тщательно отобранных терминов (слов, фраз или нотаций). Все термины должны иметь однозначное и неизбыточное толкование (определение).
Управляемые словари – это основа классификации.
В библиотечных ИС управляемый словарь представляет собой список тщательно отобранных слов и фраз, которые используются для разметки информационных единиц (слов, выражений, документов).
Управляемые словари фиксируют возможные варианты выбора значений
Управляемые словари уменьшают неопределенность и неоднозначность, присущую естественному языку

Слайд 14

Примеры управляемых словарей

Примеры управляемых словарей

Слайд 15

Пример управляемого словаря тематических разделов журнала «Доповiдi Нацiональної академiї наук України

Біологія
Біофізика
Біохімія
Екологія
Енергетика
Інформатика та

Пример управляемого словаря тематических разделов журнала «Доповiдi Нацiональної академiї наук України Біологія
кібернетика
Інформація
Математика
Матеріалознавство
Медицина
Механіка
Науки про Землю
Теплофізика
Фізика
Хімія

Слайд 16

Примеры использования словарей

Библиотечное дело - предметная индексация, предметные рубрики, каталоги, авторитетные файлы
Лингвистика

Примеры использования словарей Библиотечное дело - предметная индексация, предметные рубрики, каталоги, авторитетные
- разметка информационных единиц
Информационные системы – индексация
Программные системы – меню, ниспадающие и всплывающие списки
Тематические рубрики в журналах

Слайд 17

Таксономия

Таксоно́мия (от др.-греч. τάξις — строй, порядок и νόμος — закон) —

Таксономия Таксоно́мия (от др.-греч. τάξις — строй, порядок и νόμος — закон)
учение о принципах и практике классификации и систематизации.
Термин «таксономия» впервые был предложен в 1813 г. для классификации растений и животных и изначально применялся только в биологии.
Позже этот термин стал использоваться для обозначении общей теории классификации и систематизации сложных систем как в биологии, так и в других областях знаний: в лингвистике, географии, геологии и т.д.
Таксономия – это предметная классификация, которая группирует термины в виде управляемых словарей и упорядочивает их (словари) в виде иерархических структур.

Слайд 18

Биологическая иерархическая таксономия, ведущая к человеку:

Простая иерархическая таксономия «управляющего объекта»:

Биологическая иерархическая таксономия, ведущая к человеку: Простая иерархическая таксономия «управляющего объекта»:

Слайд 19

Таксономическая структура

Математически таксономией является древовидная структура классификаций определенного набора объектов.
Вверху этой

Таксономическая структура Математически таксономией является древовидная структура классификаций определенного набора объектов. Вверху
структуры — объединяющая единая классификация — корневой таксон — которая относится ко всем объектам данной таксономии.
Таксоны, находящиеся ниже корневого, являются более специфическими классификациями, которые относятся к подмножествам общего множества классифицируемых объектов.
Современная биологическая классификация, к примеру, представляет собой иерархическую систему, основание которой составляют отдельные организмы (индивиды), а вершину — один всеобъемлющий таксон; на различных уровнях иерархии между основанием и вершиной находятся таксоны, каждый из которых подчинён одному и только одному таксону более высокого ранга.

Слайд 20

Фрагмент таксономии УДК

Фрагмент таксономии УДК

Слайд 21

Иерархическая структура данных и таксономия

В иерархической структуре данных связь понятий означает единственное

Иерархическая структура данных и таксономия В иерархической структуре данных связь понятий означает
- наличие между ними взаимосвязи «один ко многим»
При этом каждое из понятий, как правило, является самостоятельным в том смысле, например, что «сотрудник» НЕ является ни «организацией» и ни «проектом».
В каждой организации работает множество сотрудников и имеется множество проектов, но каждый сотрудник работает в одной организации и каждый проект выполняется в одной организации.
Другим примером такой иерархии является структура папок в операционной системе компьютера.

Слайд 22

Суть таксономической иерархического отношения

Таксономические отношения также называются:
отношением «обобщения/специализации»,
«родовидовым» отношением
отношением «супертип/подтип»
отношением «суперкласс/подкласс»
В

Суть таксономической иерархического отношения Таксономические отношения также называются: отношением «обобщения/специализации», «родовидовым» отношением
англоязычной литературе также говорится об отношении «Is a»

Слайд 23

Тезаурус

Тезаурус (от греч. thesaurós — сокровище, сокровищница),
В широком смысле Тезаурус интерпретируются

Тезаурус Тезаурус (от греч. thesaurós — сокровище, сокровищница), В широком смысле Тезаурус
как описание системы знаний о действительности.
Тезаурус является расширением такономии в том смысле, что в тезаурусе помимо родо-видовых отношений могут существовать любые другие отношения, которые на множестве понятий формируют сложную сетевую структуру.
Тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания отдельных предметных областей.

Слайд 24

Тезаурус в лингвистике

С точки зрения лингвистики тезаурус - это множество смысловых единиц

Тезаурус в лингвистике С точки зрения лингвистики тезаурус - это множество смысловых
некоторого языка с заданной на нём системой семантических отношений. Тезаурус фактически определяет семантику языка (национального языка, языка конкретной науки или формализованного языка для автоматизированной системы управления).
Например, лингвистический, тезаурус содержит:
Морфологические и синтаксические свойства (часть речи, род, склонение, корень, словоформы в различных падежах, родах и числах)
Семантика (значение, синонимы, антонимы, гиперонимы, гипонимы)
Родственные слова
Происхождение
Фразеологизмы и устойчивые сочетания
Перевод на другие языки

Слайд 25

Пример тезауруса слова «замок» в Викисловаре

Пример тезауруса слова «замок» в Викисловаре

Слайд 26

Информационно-поисковые тезаурусы

В 70-х гг. 20 в. получили распространение информационно-поисковые тезаурусы В этих

Информационно-поисковые тезаурусы В 70-х гг. 20 в. получили распространение информационно-поисковые тезаурусы В
тезаурусах выделены специальные лексические единицы — дескрипторы, по которым можно осуществлять автоматический поиск документальной информации. С каждым словом такого тезауруса сопоставляется дескриптор (дескрипторная статья),
Дескрипторная статья может иметь следующую структуру:
заглавный дескриптор;
ключевые слова из класса эквивалентности;
дескрипторы, подчиняющие заглавный;
дескрипторы, подчиненные заглавному;
дескрипторы, ассоциированные с заглавным.
 Для дескрипторов явным образом указываются семантические отношения: род - вид, часть - целое, ассоциации (причина - следствие; сырье - продукт; процесс - объект; процесс – субъект; свойство – носитель свойства).

Слайд 27

ANSI/NISO Monolingual Thesaurus Standard

 ANSI/NISO Monolingual Thesaurus Standard (NISO - National Information Standards

ANSI/NISO Monolingual Thesaurus Standard ANSI/NISO Monolingual Thesaurus Standard (NISO - National Information
Organization) определяет тезаурус как
 «упорядоченный управляемый словарь, структурированный таким образом, что в нем между терминами четко определены и идентифицированы отношения эквивалентности, гомографии, иерархии и ассоциации с использованием стандартизированных индикаторов этих отношений… Первичная задача тезаурусов заключается в том, чтобы облегчить поиск документов и достигнуть согласованности в выполнении индексации письменных или другим способом полученных документов».  
Таким образом, согласно этого определения»в тезаурусах определяется четыре различных типа связей: эквивалентность, омонимия, иерархия, ассоциация

Слайд 29

Пример: тезаурус как связь двух таксономий

Пример: тезаурус как связь двух таксономий

Слайд 30

Пример фрагмента тезауруса для понятия «успеваемость»

Пример фрагмента тезауруса для понятия «успеваемость»

Слайд 31

Таксономии, тезаурусы и онтологии

Таксономии, тезаурусы и онтологии

Слайд 32

Тезаурусы и онтологии

Тезаурусы и онтологии

Слайд 33

Назначение словарей, таксономий, тезаурусов, онтологий

Это основа для выработки единой, согласованной, нормативной, однозначно

Назначение словарей, таксономий, тезаурусов, онтологий Это основа для выработки единой, согласованной, нормативной,
понимаемой, полной и непротиворечивой терминологии, используемой всеми, кто имеет отношение к ПО.
Это средства, предназначенные для классификации, структурирования, систематизации, моделирований и придания смысла понятиям и связям, относящимся к ПО.
Это средства для “исчерпывающего” описания информационной модели ПО, включая и ее семантику, самостоятельно, то есть не зависимо от задач (оперативных знаний), которые будут решаться с использованием этой модели.
Это основа для коммуникации между людьми, компьютерными агентами и людьми и компьютерными агентами.

Слайд 34

Определения онтологий

N. Guarino and P. Giaretta. Ontologies and Knowledge Bases: Towards a

Определения онтологий N. Guarino and P. Giaretta. Ontologies and Knowledge Bases: Towards
Terminological Clarification. In N. Mars, editor, Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing, pages 25–32. IOS Press, Amsterdam, 1995.
Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. Учебник. — СПб.: Питер, 2000. 382 с.
Онтология как философская дисциплина. (ὄντος — сущее, то, что существует и λόγος — учение, наука)
Онтология как неформальная концептуальная система.
Онтология как формальный взгляд на семантику.
Онтология как формальная, явная спецификация согласованной концептуализации.
Онтология как представление концептуальной системы через логическую теорию, характеризуемую: а) специальными формальными свойствами или б) только ее назначением.
Онтология как словарь, используемый логической теорией.
Онтология как (метауровневая) спецификация логической теории.

Слайд 35

Компоненты онтологий

Индивиды (объекты, элементы, экземпляры, термины)
Классы (множества, коллекции, типы, унарные отношения, понятия)
Атрибуты

Компоненты онтологий Индивиды (объекты, элементы, экземпляры, термины) Классы (множества, коллекции, типы, унарные
- аспекты, свойства, характеристики, особенности, параметры, которые могут быть присущими индивидам
Отношения (связи) – способ выражения взаимосвязи между индивидами
Аксиомы (ограничения, правила) – выражение суждений, которые имеют место в рассматриваемой предметной области
Правила вывода (умозаключение) – логическое действие, в результате которого из одного или нескольких известных и определенным образом связанных суждений получается новое суждение (дедукция, индукция, традукция, вывод по аналогии)
Функции (процессы, процедуры,…)

Слайд 36

Что такое концептуализация? – концептуализация в базах данных

ANSI/X3/SPARC Study Group on Data

Что такое концептуализация? – концептуализация в базах данных ANSI/X3/SPARC Study Group on
Base Management Systems: (1975), Interim Report. FDT, ACM SIGMOD bulletin. Volume 7, No. 2
ISO TC97/SC5/WG3. Concepts and terminology for the conceptual schema and the information base (edited by J.J. van Griethuysen) March 15, 1982, 150 p.

Слайд 37

Что такое концептуализация? – концептуализация в ИИ

M.R. Genesereth and N. J. Nilsson.

Что такое концептуализация? – концептуализация в ИИ M.R. Genesereth and N. J.
Logical Foundations of Artificial Intelligence. Morgan Kaufmann, Los Altos, CA, 1987.
«Основой формального представления знаний является концептуализация, представляющая собой множество объектов, понятий и других сущностей, которые, как предполагается, существуют в некоторой представляющей интерес предметной области, и имеющиеся между ними отношения. Концептуализация является абстрактным упрощенным взглядом на мир, который мы хотим представить для каких-то целей. Каждая база знаний, система, базирующаяся на знаниях, агент знаний прямо или косвенно используют концептуализацию».

Слайд 38

Используемый пример

наша предметная область состоит из множества лиц (Person);
среди них выделяются руководители

Используемый пример наша предметная область состоит из множества лиц (Person); среди них
(Manager) и исследователи (Researcher);
исследователи отчитываются (reports-to) перед руководителями;
исследователи могут сотрудничать (cooperates-with) между собой

Слайд 39

Формальное определение концептуализации - экстенсиональная реляционная структура

Определение 1. Экстенсиональная реляционная структура –

Формальное определение концептуализации - экстенсиональная реляционная структура Определение 1. Экстенсиональная реляционная структура
это кортеж (D,R), где:
• D – множество, называемое доменом (универсумом)
• R – множество отношений на D
Здесь R – обычные математические отношения различной арности, то есть множества кортежей элементов из D
 Пример
D = {P1, P2, .. }
R = {Person, Manager,Researcher, cooperates-with, reports-to}

Слайд 40

Формальное определение концептуализации – система, мир, состояние мира

Под системой мы будем подразумевать

Формальное определение концептуализации – система, мир, состояние мира Под системой мы будем
часть реального мира, которая представляет для нас интерес с точки зрения процесса моделирования, и которая, при заданном уровне детализации, воспринимается наблюдающим ее агентом (который обычно является внешним по отношению к самой системе) в виде совокупности «наблюдаемых переменных».
Определение 2. (мир и состояния мира). По отношению к конкретной моделируемой системе S, состоянием мира для S является уникальное присвоение значений наблюдаемым переменным, которые характеризуют систему. Мир – это линейно упорядоченное множество (linearly ordered set) состояний мира, которые отражают эволюцию системы во времени. Если для простоты абстрагироваться от времени, то мир совпадает с состоянием мира.

Слайд 41

Формальное определение концептуализации – интенсиональное отношение и концептуализация

Определение 3 (интенсиональное отношение или

Формальное определение концептуализации – интенсиональное отношение и концептуализация Определение 3 (интенсиональное отношение
концептуальное отношение). Пусть S является произвольной системой, D является произвольным множеством выделенных элементов S, а W – множество состояний мира для S (также называемыми мирами или возможными мирами). Интенсиональным отношением (или концептуальным отношением) ρn арности n на является всюду определенная функция ρn : W → из множества W в множество всех n-арных экстенсиональных отношений на D.
Определение 4. (интенсиональная реляционная структура или концептуализация). Интенсиональная реляционная структура (или концептуализация) – это тройка (D,W, ℜ) где: 
D – домен (универсум)
W – множество возможных миров
ℜ – множество интенсинальных (концептуальных) отношений

Слайд 42

Пример концептуализации

D = {Р1,Р2, ...} – универсум
W = {w1, w2, ...} –

Пример концептуализации D = {Р1,Р2, ...} – универсум W = {w1, w2,
множество возможных миров
ℜ = {PERSON, MANAGER, RESEARCHER, COOPERATES-WITH, REPORTS-TO} – множество концептуальных отношений
Если предположить, что унарные отношения не изменяются (являются постоянными во всех состояниях мира) и множество людей совпадает с универсумом, а бинарные отношения изменяются, то можно таким образом специфицировать интенсиональные отношения (как функции)
во всех мирах w из W: PERSON(w) = D
во всех мирах w из W: MANAGER(w) = {..., Р3, ...}
во всех мирах w из W: RESEARCHER(w) = {..., Р4, ..., Р5, ...}
REPORTS-TO(w1) = {..., (Р4, Р3), (Р5, Р3), , ...}
REPORTS-TO(w2) = {..., (Р4, Р3), (Р5, Р3, (Р17, Р3), ...}
REPORTS-TO(w3) = ...
COOPERATES-WITH(w1) = {..., (Р4, Р5), ...}
COOPERATES-WITH(w2) = ...

Слайд 43

Спецификация – экстенсиональная и интенсиональная

Экстенсиональная спецификация концептуализации заключается в перечислении всех экстенсионалов

Спецификация – экстенсиональная и интенсиональная Экстенсиональная спецификация концептуализации заключается в перечислении всех
(экстенсиональных отношений) каждого из концептуальных отношений для всех состояний возможных миров.
Интенсиональная спецификация – это выбор языка и ограничения его интерпретации интенсиональным способом путем определения в этом языке набора подходящих аксиом (правил, ограничений, смысловых постулатов). Например, мы могли бы сформулировать аксиомы, что:
reports-to является ассиметричным и нетранзитивным, а
cooperates-with – симметричным и иррефлексивным.
В этом случае онтология – это просто множество таких аксиом, то есть это логическая теория, предназначенная для представления только подразумеваемых моделей, соответствующих определенной концептуализации.

Слайд 44

Спецификация – подразумеваемая модель

Спецификация – подразумеваемая модель

Слайд 45

Мир, концептуализация, язык, интерпретация, онтологии

Мир, концептуализация, язык, интерпретация, онтологии

Слайд 46

Спецификация - Онтологическое сопоставление

Определение 5 (экстенсиональная структура первого порядка / модель).
Пусть

Спецификация - Онтологическое сопоставление Определение 5 (экстенсиональная структура первого порядка / модель).
L – логический язык первого порядка со словарем V и S = (D,R) – экстенсиональная реляционная структура.
Экстенсиональная структура первого порядка (также называемая моделью L), это кортеж M = (S, I), где I называется функцией экстенсиональной интепретации и представляет собой всюду определенную функцию I : V → D U R, которая отображает символы словаря V в D или R.
Определение 6 ( интенсиональная структура первого порядка / онтологическое сопоставление)
Пусть L – логический язык первого порядка со словарем V и С = (D,W, ℜ) – концептуализация.
Интенсиональная структура первого порядка (также называемая онтологическим сопоставлением) , это кортеж K = (C, I), где I называется функцией интенсиональной интепретации и представляет собой всюду определенную функцию I : V → D U ℜ, которая отображает символы словаря V в D или ℜ.

Слайд 47

Подразумеваемая модель и онтология

 Определение 7 (Подразумеваемая модель)
Пусть и С = (D,W, ℜ)

Подразумеваемая модель и онтология Определение 7 (Подразумеваемая модель) Пусть и С =
является концептуализацией, пусть L – логический язык первого порядка со словарем V и с онтологическим сопоставлением K = (C, I). Модель M = (S, I) с экстенсиональной реляционной структурой S = (D,R), называется подразумеваемой моделью языка L согласно K тогда и только тогда, когда:
Для всех символов-констант c ∈ V имеем I(c) = I(c)
Для любого состояния мира w ∈ W выполняется следующее: для каждого предикатного символа v ∈ V существует интенсиональное отношение ρ ∈ ℜ такое, что I(v) = ρ и I(v) = ρ(w)
Определение 8 (Онтология)
Пусть и С = (D,W, ℜ) является концептуализацией, пусть L – логический язык первого порядка со словарем V и с онтологическим сопоставлением K = (C, I). Онтология ОК – это логическая теория, состоящая из множества таких формул L, что получаемые при этом модели насколько это возможно приближаются к подразумеваемым моделям L согласно К.

Слайд 48

Пример онтологии

Таксономические правила, указывающие, что исследователи и руководители являются видовыми понятиями человека O1

Пример онтологии Таксономические правила, указывающие, что исследователи и руководители являются видовыми понятиями
= {Researcher(x) → Person(x), Manager(x) → Person(x)}
Введем правила, определяющие области допустимых значений для бинарных отношений O2 = O1 U {cooperates-with(x, y) → Person(x) & Person(y), reports-to(x, y) → Person(x) & Person(y)}
Отношение cooperates-with является симметричным отношением O3 = O2 U {cooperates-with(x, y) ↔ cooperates-with(y, x)}
Отношение reports-to является транзитивным O4 = O3 U {reports-to(x, y) & reports-to(y, z) → reports-to(x, z)}
Непересекаемость исследователей и руководителей
O5 = O4 U {Manager(x) → ¬Researcher(x)}

Слайд 49

Инженерия онтологий - определение

Инженерия программного обеспечения — приложение систематического, дисциплинарного, измеримого подхода

Инженерия онтологий - определение Инженерия программного обеспечения — приложение систематического, дисциплинарного, измеримого
к развитию, оперированию и обслуживанию программного обеспечения, а также исследованию этих подходов; то есть, приложение дисциплины инженерии к программному обеспечению.
Инженерия онтологий в компьютерных науках – это дисциплина, которая изучает методы, методологии и средства построения и использования онтологий.
Инженерия онтологий направлена на явное извлечение и представление знаний, содержащихся в предметных областях различного назначения.
Инженерия онтологий направлена на решение проблем интероперабельности, вызванных семантическими проблемами, то есть проблемами возможного неоднозначного понимания терминов той или иной предметной области.
Инженерия онтологий включает следующие аспекты:
жизненный цикл онтологий;
процесс разработки онтологий;
методы и методологии построения онтологий;
набор инструментов и языков для их построения и поддержки

Слайд 50

Классификация онтологий по содержимому

Сущности, связи, время, пространство, события
Составление расписаний, резервирование билетов,
управление производством,
компьютерные

Классификация онтологий по содержимому Сущности, связи, время, пространство, события Составление расписаний, резервирование
науки
Конкретные онтологии, например, онтология Института программных систем

Слайд 51

Инженерия онтологий – жизненный цикл

Стратегия:
Для каких целей создается онтология?
Какую область будет

Инженерия онтологий – жизненный цикл Стратегия: Для каких целей создается онтология? Какую
охватывать онтология?
Возможность повторного использования существующих онтологий
Кто и как будет использовать и поддерживать онтологию?
Анализ – это, в частности: - извлечение знаний (knowledge discovery); - интеллектуальный анализ данных (data mining)

Слайд 52

Инженерия онтологий – методология создания

Четкая спецификация ПО
Построение глоссария терминов (терминов понятий, атрибутов,

Инженерия онтологий – методология создания Четкая спецификация ПО Построение глоссария терминов (терминов
связей и пр.) с предоставлением их определений на естественном языке и указанием их синонимов, акронимов и других характеристик.
Выявление и четкое и достаточно глубокое определение понятий. Это основа для создания управляемых словарей.
Выявление и четкое определение множества свойств (атрибутов, характеристик), характеризующих каждое понятие. Обязательное выделение множества обязательных свойств и свойств, идентифицирующих понятия. Спецификация допустимых значений свойств и других ограничений на значения свойств.
Выявление и четкое определение родовидовых зависимостей (связей) между понятиями и, тем самым построение таксономий на множестве понятий. Определение таких свойств таксономических связей, как непересекаемость декомпозиции и полнота декомпозиции
Выявление и четкое определение других произвольных бинарных связей между понятиями с указанием к какому типу связей они относятся (эквивалентность, часть/целое, агрегация, ассоциация, причина-следствие и т.д.). Необходимо указать мощность окончаний связей (1:1, 1: М, М:N) и их факультативность (обязательная, факультативная).Тем самым строится тезаурус.
Выявление и четкое определение аксиом (правил, прикладных ограничений), характеризующих углубленную семантику понятий, атрибутов и связей. Тем самым строится онтология.
Построение экстенсионалов.

Слайд 53

Инженерия онтологий – операции

Сопоставление (matching)
Унификация (unification)
Уточнение (refinement)
Отображение (mapping)
Согласование

Инженерия онтологий – операции Сопоставление (matching) Унификация (unification) Уточнение (refinement) Отображение (mapping)
(alignment)
Интеграция (integration)
Наследование (inheritance)
Композиция (composition)
Слияние (merging)
Объединение, пересечение, разность (union, intersection, difference)

Слайд 54

Манипулирование онтологиями – операция сопоставления

http://www.ontologymatching.org/
Сопоставление онтологий (ontology matching) является перспективным направлением в

Манипулирование онтологиями – операция сопоставления http://www.ontologymatching.org/ Сопоставление онтологий (ontology matching) является перспективным
решении проблем семантической неоднородности. Сопоставление призвано решать задачи нахождения соответствия между семантически связанными сущностями двух онтологий. Такое сопоставление может использоваться для решения различных задач, например, слияние онтологий (ontology merging), получение ответов на запросы, трансляция данных, навигация по семантическому вебу. Таким образом, сопоставление онтологий позволяет осуществлять оперирование данными и знаниями, представленными в сопоставляемых онтологиях.
(matching = mapping = alignment - ???)

Слайд 55

Манипулирование онтологиями – операция унификации

Унификация (unification) – Онтология приводится к некоему каноническому

Манипулирование онтологиями – операция унификации Унификация (unification) – Онтология приводится к некоему
(эталонному) представлению. Для унификации должна задаваться исходная онтология, которая приводится к результирующей согласно заданной канонической онтологии. Задача унификации множества исходных онтологий становится актуальной при работе с гетерогенными онтологиями.

Слайд 56

Манипулирование онтологиями – операция уточнения

Уточнение (refinement). Под уточнением онтологий понимают такое сопоставление

Манипулирование онтологиями – операция уточнения Уточнение (refinement). Под уточнением онтологий понимают такое
онтологии A с другой онтологией B, что каждому понятию из онтологии A ставится в соответствие эквивалентное ему понятие в B. Примитивные понятия из онтологии A могут соответствовать непримитивным понятиям онтологии B.

А

В

Слайд 57

Манипулирование онтологиями – операция отображения

Отображение (mapping). Отображение одной онтологии в другую –

Манипулирование онтологиями – операция отображения Отображение (mapping). Отображение одной онтологии в другую
это функция преобразования одной онтологии в другую (способ перевода объектов одной онтологии в другую), либо сам результат такого преобразования. Часто это означает перевод между понятиями и отношениями. Отображение может быть частичным в том смысле, что не все понятия исходной онтологии отображаются в результирующую. В частности, это означает, что в исходной онтологии существует подонтология, для которой существует полное отображение.
В результате отображения получаем две онтологии и описания отображения.

Слайд 58

Пример отображения

Пример отображения

Слайд 59

Манипулирование онтологиями – операция согласования

Согласование (alignment) - это процесс отображения онтологий в

Манипулирование онтологиями – операция согласования Согласование (alignment) - это процесс отображения онтологий
обоих направлениях. Согласование, как и отображение, может быть лишь частичным. Спецификация согласования называется артикуляцией (articulation)
Согласование заключается в том, чтобы установить различные виды соответствий между двумя онтологиями, а затем сохранить исходные онтологии вместе с информацией о найденных соответствиях с тем, чтобы в дальнейшем использовать информацию о взаимосвязях онтологий.

Слайд 60

Манипулирование онтологиями – операция слияния

Слияние (merging) - это процесс создания одной согласованной

Манипулирование онтологиями – операция слияния Слияние (merging) - это процесс создания одной
онтологии из двух или более различных онтологий, относящихся к одной тематической предметной области. Слитая онтология включает информацию из ВСЕХ исходных онтологий с наименьшими возможными изменениями.
Слияние может не выполняться полностью, например, в связи с тем, что исходные онтологии могут быть несогласованными (противоречивыми).
Результирующая онтология может содержать новые понятия и отношения, которые служат для установления соответствия между терминами и отношениями исходных онтологий.

Слайд 61

Манипулирование онтологиями – операции интеграции и наследования

Интеграция (integration). Это процесс поиска одинаковых

Манипулирование онтологиями – операции интеграции и наследования Интеграция (integration). Это процесс поиска
частей (то есть установление соответствия) двух разных онтологий, A и B, при разработке новой онтологии C, которая позволяет выполнить перевод между онтологиями A и B, и, таким образом, позволяет взаимодействие между двумя системами, где одна использует онтологию A, а другая - онтологию B. Новая онтология C может заменить онтологии A и B или может использоваться в качестве промежуточной онтологии для перевода между двумя онтологиями. Интеграция может меняться от согласования к унификации. Отличие интеграции от слияния – merging (см. выше) :
Интеграция устанавливает соответствие, а слияние дает одну результирующую онтологию
Интеграция, как правило, действует над онтологиями различных доменов, а слияние – одного домена.

Наследование (inheritance). Означает, что онтология A наследует все из онтологии B. Она наследует все понятия, отношения и ограничения или аксиомы, и дополнительные знания, содержащиеся в онтологии, не внося при этом какой-либо несогласованности.

Слайд 62

Манипулирование онтологиями – операция композиции

Композиция (composition) двух графов G1 и G2, G=G1(G2)

Манипулирование онтологиями – операция композиции Композиция (composition) двух графов G1 и G2,
– это транзитивное замыкание двух графов, если рассматривать их как бинарные отношения.

Дед (Х, Y) = Отец(Отец(Х, Y))

Слайд 63

Манипулирование онтологиями – операции объединения, пересечения и разности

Операции объединения, пересечения и разности

Манипулирование онтологиями – операции объединения, пересечения и разности Операции объединения, пересечения и
онтологий. Это обычные теоретико-множественные операции, предполагающие, что онтология – это множество бинарных отношений.

Слайд 64

Вывод (рассуждения) в онтологиях (ontology reasoning)

Вывод (inference, reasoning) предполагает возможность выводить новые

Вывод (рассуждения) в онтологиях (ontology reasoning) Вывод (inference, reasoning) предполагает возможность выводить
неявно заданные данные (знания) из имеющихся явно заданных.
Решать проблему вывода в онтологии в достаточной степени полноты можно в том случае, когда онтология формализована.
Языком формализации онтологий является дескриптивная логика (DL), которая формализует такие два языка онтологий, как RDF и OWL.
Используется на большинстве этапов жизненного цикла онтологии.

Слайд 65

Способы задания вывода

Вывод можно задавать процедурно, например, указывая, что определяемое понятие является

Способы задания вывода Вывод можно задавать процедурно, например, указывая, что определяемое понятие
последовательностью операций над уже определенными понятиями. Например, можно указать, что понятие ДЕД является композицией (транзитивным замыканием) понятия ОТЕЦ.
ДЕД(X, Y) = (ОТЕЦ(ОТЕЦ(X, Y))
Вывод также можно задавать посредством правил вывода. Они могут быть логическими (дедуктивные, индуктивные и т.д.) или прикладными, то есть правилами типа “Если…то”, описывающие семантику предметной области. Например,
ЕСЛИ ОТЕЦ(x, y) & ОТЕЦ(y, z) ТО ДЕД(x, z)
ЕСЛИ СОТРУДНИЧАЕТ(x, y) ТО СОТРУДНИЧАЕТ(y, x)

Слайд 66

Вывод в RDF, OWL, DL

В основу RDF, OWL и DL положены такие

Вывод в RDF, OWL, DL В основу RDF, OWL и DL положены
понятия, как индивид, класс и свойство (свойство вбирает в себя такие традиционные понятия, как атрибут, бинарная связь (отношение), аксиома ). В связи с этим, если за основу описания онтологий берутся эти языки, важно иметь выводы, которые характеризуют эти три составляющие онтологии. Поэтому можно говорить о выводах на уровне
индивидов,
классов,
свойств,
аксиом

Слайд 67

Вывод на индивидах

Основная проблема вывода заключается в проверке, допустим ли индивид в

Вывод на индивидах Основная проблема вывода заключается в проверке, допустим ли индивид
ПО. Если предположить, что индивид может существовать только посредством его принадлежности тому или иному классу, то тогда вопрос существования индивида в ПО сводится к проверке его принадлежности классу. Класс, с точки зрения его экстенсионала может задаваться:
явным перечислением принадлежащих ему индивидов, то есть экстенсионально (в этом случае индивид имеется в ПО, если он явно задан приписан классу)
указанием характеристик, которым должен обладать индивид, чтобы являться экземпляром класса – интенсиональное определение класса.
указанием процедуры получения элементов данного класса из элементов других классов.
В связи с этим механизмы проверки принадлежности индивида классу могут быть разными.
Еще одной задачей вывода является установление, являются ли два индивида тождественными (эквивалентными) или нет. Для установления этого факта могут использоваться свойства классов, которым они принадлежат, а также их личные свойства. На приведенном ниже рисунке дается графическое представление правила, выраженное на конкретных индивидах: «лица, имеющие один и тот же e-mail, являются одним и тем же лицом», и два способа задания этого правила: в виде правила вывода и введением нового понятия, выводимого из существующих

Слайд 68

Вывод на классах

Основная задача вывода на классах – это, в общем случае,

Вывод на классах Основная задача вывода на классах – это, в общем
определение взаимоотношения классов между собой, и, в частности, является ли класс В подклассом класса А. Эта частная задача называется задачей обобщения-специализации классов (задача выявления родовидовых зависимостей на классах). По сути задача обобщения – это выявление факта, являются ли критерии принадлежности одному из классов частным случаем (специализацией, родом, выводимыми из) критериев принадлежности другому классу.
Если критерии принадлежности классам взаимовыводимы, то они эквивалентны.
Если класс принадлежит пустому классу, то его критерии противоречивы (невыполнимы).
Полный граф обобщения, построенный на всех класах онтологии называется таксономической иерархией классов.
Существует также задачи вывода на классах, связанные с установлением и формализацией другох видов взаимоотношения между классами (экземпляр-класс, часть-целое, агрегат-деталь)

Слайд 69

Вывод на свойствах

Так как бинарные отношения являются множествами, то можно говорить об

Вывод на свойствах Так как бинарные отношения являются множествами, то можно говорить
обощении/специализации свойств. Например,
свойство Иметь ребенка является обобщением свойств Иметь сына, Иметь дочь,
свойства Являться младшим (старшим, ведущим,…) научным сотрудником является специализацией свойства Являться научным сотрудником.
В связи с этим для свойств существуют такие же проблемы вывода, как и для классов (обобщение/специализация, эквивалентность, выполнимость, таксономия свойств).

Вывод на свойствах – это вывод новых свойств из существующих.
Так как свойства – это бинарные отношения, то в качестве вывода могут использоваться традиционные свойства бинарных отношений: рефлексивность, симметричность, транзитивность, а также их отрицания: иррефлексивность, ассиметричность и антитранзитивность.
Пример использования транзитивности свойства Предок (Ancestor):

Слайд 70

Вывод на аксиомах

Является ли онтология (система аксиом) полной?
Является ли онтология (система аксиом)

Вывод на аксиомах Является ли онтология (система аксиом) полной? Является ли онтология
непротиворечивой?
Является ли то или иное понятие (сущность, атрибут, связь) или подонтология выводимой из имеющейся?

Слайд 71

Жизненный цикл - этап развития

Сбор предложений по развитию (изменению)
Представление предложений по развитию

Жизненный цикл - этап развития Сбор предложений по развитию (изменению) Представление предложений
- чтобы реализовать требования по изменению онтологии, они должны быть представлены в подходящей форме и с требуемой степенью детализации (простые изменения, сложные изменения)
Семантика развития/изменений - изменение/развитие онтологии должно производиться с учетом выработанных на этапе анализа требований по ее целостности. Целостность, это, по-сути, аксиоматика онтологии.
Реализация изменений
Распространение изменений - измененяемая онтология может быть связана тем или иным образом (mapping, alligning) с другими онтологиями. Поэтому ее изменения должны быть распространены на другие связанные с ней онтологии.
Проверка – тестирование правильности проведенных изменений

Слайд 72

Ontology learning

OntoWeb Consortium. Deliverable 1.5: A survey of ontology learning methods and

Ontology learning OntoWeb Consortium. Deliverable 1.5: A survey of ontology learning methods
techniques. – 86 p.
Ontology learning (познание) (ontology extraction, ontology generation, or ontology acquisition) – это полуавтоматическое извлечение необходимых понятий и отношений между ними из соответствующих (неструктурированных, полуструктурированных и структурированных) источников с целью построения онтологии. Это сложное междисциплинарное направление исследований, которое использует знания из таких дисциплин, как обработка естественных языков, интеллектуальный анализ данных (data mining), машинное обучение и представление знаний.

Слайд 73

Источники для Ontology learning

Ontology learning на основании тестов – извлечение онтологий посредством

Источники для Ontology learning Ontology learning на основании тестов – извлечение онтологий
применения к текстам методов анализа естественных языков
Ontology learning на основании словарей – использование машиночитаемых словарей для извлечения из них понятий и связей между ними
Ontology learning на основании баз знаний - построение онтологий на основании сведений, имеющихся в базах знаний
Ontology learning из полуструктурированных источников – построение онтологий на основании источников, имеющих определенную структуру, например, схемы XML
Ontology learning из реляционных схем – построение онтологий на основании понятий и отношений между ними, извлеченных их баз данных

Слайд 74

«Слоеный пирог» Ontology learning

«Слоеный пирог» Ontology learning
Имя файла: Андон-Ф.И.,-Резниченко-В.А.Онтологии-–-проблемы-создания-и-примененияИнститут-программных-систем-НАН-Украины.pptx
Количество просмотров: 316
Количество скачиваний: 1