Слайд 2Онтологии для автоматической обработки текстов
Основные элементы онтологий
понятия онтологии,
отношения между понятиями
Автоматическая обработка текстов
Необходимо
установление отношений между понятиями онтологии и языковыми выражениями
Лингвистические (лексические) онтологии – онтологии, которые учитывают систему значений естественного языка
Слайд 3Лингвистические онтологии и проблемы лексической семантики
Каждое понятие лингвистической онтологии имеет совокупность
текстовых выражений, которое может это понятие выражать
Совокупность текстовых выражений одного понятия – онтологические синонимы
Проблемы описания
Близкие значения слов нужно дискретно подразделить,
Квазисинонимы нужно разбить на совокупность дискретных синонимических рядов – выделить онтологические синонимы
Слайд 4План презентации
Квазисинонимы и проблемы отражения квазисинонимов в лингвистических онтологиях
Пример из WordNet: квазисинонимы
со значением =сходство=
Принципы рассмотрения квазисинонимов в тезаурусе РуТез
Примеры анализа квазисинонимов
Слайд 5Представление квазисинонимов в лингвистических онтологиях
Квазисинонимы (частичные синонимы)
Слова с близкими значениями
Могут быть взаимозаменяемыми
в некоторых контекстах
Квазисинонимы могут различаться по многим параметрам:
Денотативный статус, стилистическая окраска,
Оценка, Коллокации, Валентности и др.
В разных контекстах могут употребляться в более широком или более узком смысле
Близкий ряд квазисинонимов на другом языке характеризуется своей собственно системой различий
Слайд 6Примеры квазисинонимов
ошибка, погрешность, недосмотр, просмотр, ляп, промах, оплошность, осечка, прокол, упущение, недочет,
а также ослышка, описка, опечатка, оговорка.
error, fault, omission, oversight, blunder, mistake, miss, screw-up, dereliction, defect
Драться, подраться, передраться, свалка, потасовка, побоище, мордобой, поножовщина
Слайд 7Квазисинонимы в предметных областях
кредитование, кредит, кредитная услуга,
кредитное обслуживание,кредитная операция,
выделение кредита,
выдача кредита,
выделение кредитных средств,
предоставление кредита
Каковы особенности отображения квазисинонимов в онтологии?
Слайд 8Рекомендации по созданию онтологий: различимость понятий
Нужно различать понятия и его названия: не
стоит заводить отдельные понятия для синонимов
Понятие-потомок должно отчетливо отличаться от понятия-родителя
Понятие должно быть отчетливо отличаться от понятий одного уровня
Это важно:
для описания отношений;
для формального вывода;
для перевод на другой язык
Слайд 9Квазисинонимы in WordNet
Основная единица – синсет
Совокупность синонимов
4 плохо отличимых синсета, описывающих сходство.
Каждый синсет – гипоним предыдущего:
sameness –(the quality of being alike)
similarity – (the quality of being similar)
likeness, alikeness, similitude –
(similarity in appearance or character or nature between persons or things)
resemblance –
(similarity in appearance or external or superficial details)
Слайд 10Тезаурус РуТез –
лингвистическая онтология
Понятие:
Имя понятия
Набор текстовых выражений
Отношения между понятиями
52 000
понятий,
156 000 текстовых выражений,
203 000 отношений (более 2 млн. с иерархией)
Переведен на английский язык:
130 тысяч слов и выражений
Приложения информационного поиска: формулировка запросов, автоматическое расширение запросов, автоматическая рубрикация, кластеризация, аннотирование
Слайд 11Понятия в тезаурусе РуТез: основные принципы
Различимые понятия
разный набор отношений с другими понятиями
тезаурус,
разный набор онтологических синонимов
Традиция информационно-поисковых тезаурусов - однозначное и понятное имя,
Онтологические синонимы должны быть эквивалентны относительно системы отношений с другими понятиями тезауруса
Слайд 12Имя понятия: примеры
- однозначное слово:
КАБЕЛЬ;
- однозначное словосочетание:
КАБИНЕТ РЕСТОРАНА,
КАБИНЕТ ВРАЧА
- неоднозначное слово
с пометой:
КАБАЧОК (ПЛОД);
- пара синонимов – текстовых входов понятия через запятую:
ИРРАЦИОНАЛЬНЫЙ, ЛОГИЧЕСКИ НЕОБЪЯСНИМЫЙ
Слайд 13Словосочетания - синтаксические синонимы многозначных слов
авангард3 = авангардное искусство
авангард4 = произведения авангарда
чай3
= настой чая
бородка2 = бородка ключа
болид1 = космический болид
болид2 = гоночный болид
блок1 = подъемный блок
экспедиция2 = отдел экспедиции
…
Слайд 14Основные принципы работы с квазисинонимами
Искать различия между квазисинонимами, которые не исчезают в
зависимости от контекста их употребления
Искать различия между квазисинонимами, которые приводят к формированию разных рядов онтологических синонимов или к разным отношениям с другими понятиями
Фиксировать найденные различия вводом понятий с однозначными именами
Слайд 15Процедура ввода понятий для квазисинонимов (similarity)-1
0 шаг: ввод обобщенного понятия для квазисинонимов
SIMILARITY
1
шаг: найти признаки, по которым могут отличаться понятия
Сходство по внешнему виду - similarity in appearance
2 шаг: сформулировать имя понятия
Должно быть однозначным,
Лучше реально употребляющееся словосочетание
SIMILARITY IN APPEARANCE
34700 страниц в GOOGLE
Слайд 16Процедура ввода понятий для квазисинонимов-2
Шаг 3. Найти разнообразные онтологические синонимы для этого
понятия
resemblance in appearance,
similarity of appearance,
external resemblance
Шаг 4. Многозначные слова, употребляемые в разных контекстах то в более общем смысле, то в более узком – поставить онтологическими синонимами к двум понятиям
resemblance
likeness
Слайд 18Памятник, монумент (НОСС)
- в память о конкретном человеке обычно ставится памятник, о группе
людей – и памятник, и монумент, о событии – монумент; идеи воплощаются в монументах;
- у монументов есть способность увековечивать подвиг живых людей;
- по форме сооружения памятник часто представляет собой изображение увековечиваемого объекта;
- монумент обычно больше по размерам;
- пропагандистская роль больше свойственна монументам.
Онтологические синонимы или нужно заводить отдельные понятия?
Слайд 19Памятник, монумент-анализ примеров
Указанные в словаре различия не являются обязательными
В память о конкретном
человеке может быть установлен монумент;
В память события может быть установлен памятник;
Памятник может быть поставлен идее и т.п.
Авторы словаря указывают, что различия «нейтрализуются при повторной, сокращенной номинации того же сооружения».
Нет ни одного четко различающего свойства.
Памятник и монумент – онтологические синонимы
Слайд 20Водитель, шофер (НОСС)
НОСС: «шофер управляет только автомобилем или автобусом, водитель и другими
транспортными средствами»
Вагоновожатый, судоводитель являются водителями, но не шоферами
Два понятия
ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА,
ВОДИТЕЛЬ АВТОМОБИЛЯ
Почему водитель и шофер ощущаются как синонимы?
Слайд 21Сеть понятий: водитель, шофер
ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА
(водитель)
ТРАНСПОРТНЫЙ
РАБОТНИК
СУДОВОДИТЕЛЬ
ВАГОНОВОЖАТЫЙ
(водитель трамвая)
ВОДИТЕЛЬ АВТОМОБИЛЯ
(водитель)
ПРОФЕССИОНАЛЬНЫЙ ВОДИТЕЛЬ
(шофер)
ТАКСИСТ
(шофер такси)
ЛИЧНЫЙ ВОДИТЕЛЬ
(личный шофер)