Лукашевич Н.В Квазисинонимы в лингвистических онтологиях Near-synonyms in linguistic ontologies

Содержание

Слайд 2

Онтологии для автоматической обработки текстов

Основные элементы онтологий
понятия онтологии,
отношения между понятиями
Автоматическая обработка текстов
Необходимо

Онтологии для автоматической обработки текстов Основные элементы онтологий понятия онтологии, отношения между
установление отношений между понятиями онтологии и языковыми выражениями
Лингвистические (лексические) онтологии – онтологии, которые учитывают систему значений естественного языка

Слайд 3

Лингвистические онтологии и проблемы лексической семантики

Каждое понятие лингвистической онтологии имеет совокупность

Лингвистические онтологии и проблемы лексической семантики Каждое понятие лингвистической онтологии имеет совокупность
текстовых выражений, которое может это понятие выражать
Совокупность текстовых выражений одного понятия – онтологические синонимы
Проблемы описания
Близкие значения слов нужно дискретно подразделить,
Квазисинонимы нужно разбить на совокупность дискретных синонимических рядов – выделить онтологические синонимы

Слайд 4

План презентации

Квазисинонимы и проблемы отражения квазисинонимов в лингвистических онтологиях
Пример из WordNet: квазисинонимы

План презентации Квазисинонимы и проблемы отражения квазисинонимов в лингвистических онтологиях Пример из
со значением =сходство=
Принципы рассмотрения квазисинонимов в тезаурусе РуТез
Примеры анализа квазисинонимов

Слайд 5

Представление квазисинонимов в лингвистических онтологиях

Квазисинонимы (частичные синонимы)
Слова с близкими значениями
Могут быть взаимозаменяемыми

Представление квазисинонимов в лингвистических онтологиях Квазисинонимы (частичные синонимы) Слова с близкими значениями
в некоторых контекстах
Квазисинонимы могут различаться по многим параметрам:
Денотативный статус, стилистическая окраска,
Оценка, Коллокации, Валентности и др.
В разных контекстах могут употребляться в более широком или более узком смысле
Близкий ряд квазисинонимов на другом языке характеризуется своей собственно системой различий

Слайд 6

Примеры квазисинонимов

ошибка, погрешность, недосмотр, просмотр, ляп, промах, оплошность, осечка, прокол, упущение, недочет,

Примеры квазисинонимов ошибка, погрешность, недосмотр, просмотр, ляп, промах, оплошность, осечка, прокол, упущение,
а также ослышка, описка, опечатка, оговорка.
error, fault, omission, oversight, blunder, mistake, miss, screw-up, dereliction, defect
Драться, подраться, передраться, свалка, потасовка, побоище, мордобой, поножовщина

Слайд 7

Квазисинонимы в предметных областях

кредитование, кредит, кредитная услуга,
кредитное обслуживание,кредитная операция,
выделение кредита,

Квазисинонимы в предметных областях кредитование, кредит, кредитная услуга, кредитное обслуживание,кредитная операция, выделение
выдача кредита,
выделение кредитных средств,
предоставление кредита
Каковы особенности отображения квазисинонимов в онтологии?

Слайд 8

Рекомендации по созданию онтологий: различимость понятий

Нужно различать понятия и его названия: не

Рекомендации по созданию онтологий: различимость понятий Нужно различать понятия и его названия:
стоит заводить отдельные понятия для синонимов
Понятие-потомок должно отчетливо отличаться от понятия-родителя
Понятие должно быть отчетливо отличаться от понятий одного уровня
Это важно:
для описания отношений;
для формального вывода;
для перевод на другой язык

Слайд 9

Квазисинонимы in WordNet

Основная единица – синсет
Совокупность синонимов
4 плохо отличимых синсета, описывающих сходство.

Квазисинонимы in WordNet Основная единица – синсет Совокупность синонимов 4 плохо отличимых
Каждый синсет – гипоним предыдущего:
sameness –(the quality of being alike)
similarity – (the quality of being similar)
likeness, alikeness, similitude – (similarity in appearance or character or nature between persons or things)
resemblance – (similarity in appearance or external or superficial details)

Слайд 10

Тезаурус РуТез – лингвистическая онтология

Понятие:
Имя понятия
Набор текстовых выражений
Отношения между понятиями
52 000

Тезаурус РуТез – лингвистическая онтология Понятие: Имя понятия Набор текстовых выражений Отношения
понятий, 156 000 текстовых выражений, 203 000 отношений (более 2 млн. с иерархией)
Переведен на английский язык: 130 тысяч слов и выражений
Приложения информационного поиска: формулировка запросов, автоматическое расширение запросов, автоматическая рубрикация, кластеризация, аннотирование

Слайд 11

Понятия в тезаурусе РуТез: основные принципы

Различимые понятия
разный набор отношений с другими понятиями

Понятия в тезаурусе РуТез: основные принципы Различимые понятия разный набор отношений с
тезаурус,
разный набор онтологических синонимов
Традиция информационно-поисковых тезаурусов - однозначное и понятное имя,
Онтологические синонимы должны быть эквивалентны относительно системы отношений с другими понятиями тезауруса

Слайд 12

Имя понятия: примеры

- однозначное слово:
КАБЕЛЬ;
- однозначное словосочетание:
КАБИНЕТ РЕСТОРАНА,
КАБИНЕТ ВРАЧА
- неоднозначное слово

Имя понятия: примеры - однозначное слово: КАБЕЛЬ; - однозначное словосочетание: КАБИНЕТ РЕСТОРАНА,
с пометой:
КАБАЧОК (ПЛОД);
- пара синонимов – текстовых входов понятия через запятую:
ИРРАЦИОНАЛЬНЫЙ, ЛОГИЧЕСКИ НЕОБЪЯСНИМЫЙ

Слайд 13

Словосочетания - синтаксические синонимы многозначных слов

авангард3 = авангардное искусство
авангард4 = произведения авангарда
чай3

Словосочетания - синтаксические синонимы многозначных слов авангард3 = авангардное искусство авангард4 =
= настой чая
бородка2 = бородка ключа
болид1 = космический болид
болид2 = гоночный болид
блок1 = подъемный блок
экспедиция2 = отдел экспедиции

Слайд 14

Основные принципы работы с квазисинонимами

Искать различия между квазисинонимами, которые не исчезают в

Основные принципы работы с квазисинонимами Искать различия между квазисинонимами, которые не исчезают
зависимости от контекста их употребления
Искать различия между квазисинонимами, которые приводят к формированию разных рядов онтологических синонимов или к разным отношениям с другими понятиями
Фиксировать найденные различия вводом понятий с однозначными именами

Слайд 15

Процедура ввода понятий для квазисинонимов (similarity)-1

0 шаг: ввод обобщенного понятия для квазисинонимов
SIMILARITY
1

Процедура ввода понятий для квазисинонимов (similarity)-1 0 шаг: ввод обобщенного понятия для
шаг: найти признаки, по которым могут отличаться понятия
Сходство по внешнему виду - similarity in appearance
2 шаг: сформулировать имя понятия
Должно быть однозначным,
Лучше реально употребляющееся словосочетание
SIMILARITY IN APPEARANCE
34700 страниц в GOOGLE

Слайд 16

Процедура ввода понятий для квазисинонимов-2

Шаг 3. Найти разнообразные онтологические синонимы для этого

Процедура ввода понятий для квазисинонимов-2 Шаг 3. Найти разнообразные онтологические синонимы для
понятия
resemblance in appearance,
similarity of appearance,
external resemblance
Шаг 4. Многозначные слова, употребляемые в разных контекстах то в более общем смысле, то в более узком – поставить онтологическими синонимами к двум понятиям
resemblance
likeness

Слайд 18

Памятник, монумент (НОСС)

- в память о конкретном человеке обычно ставится памятник, о группе

Памятник, монумент (НОСС) - в память о конкретном человеке обычно ставится памятник,
людей – и памятник, и монумент, о событии – монумент; идеи воплощаются в монументах;
- у монументов есть способность увековечивать подвиг живых людей;
- по форме сооружения памятник часто представляет собой изображение увековечиваемого объекта;
- монумент обычно больше по размерам;
- пропагандистская роль больше свойственна монументам.
Онтологические синонимы или нужно заводить отдельные понятия?

Слайд 19

Памятник, монумент-анализ примеров

Указанные в словаре различия не являются обязательными
В память о конкретном

Памятник, монумент-анализ примеров Указанные в словаре различия не являются обязательными В память
человеке может быть установлен монумент;
В память события может быть установлен памятник;
Памятник может быть поставлен идее и т.п.
Авторы словаря указывают, что различия «нейтрализуются при повторной, сокращенной номинации того же сооружения».
Нет ни одного четко различающего свойства.
Памятник и монумент – онтологические синонимы

Слайд 20

Водитель, шофер (НОСС)

НОСС: «шофер управляет только автомобилем или автобусом, водитель и другими

Водитель, шофер (НОСС) НОСС: «шофер управляет только автомобилем или автобусом, водитель и
транспортными средствами»
Вагоновожатый, судоводитель являются водителями, но не шоферами
Два понятия
ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА,
ВОДИТЕЛЬ АВТОМОБИЛЯ
Почему водитель и шофер ощущаются как синонимы?

Слайд 21

Сеть понятий: водитель, шофер

ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА (водитель)

ТРАНСПОРТНЫЙ
РАБОТНИК

СУДОВОДИТЕЛЬ

ВАГОНОВОЖАТЫЙ
(водитель трамвая)

ВОДИТЕЛЬ АВТОМОБИЛЯ (водитель)

ПРОФЕССИОНАЛЬНЫЙ ВОДИТЕЛЬ (шофер)

ТАКСИСТ (шофер такси)

ЛИЧНЫЙ ВОДИТЕЛЬ (личный шофер)

Сеть понятий: водитель, шофер ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА (водитель) ТРАНСПОРТНЫЙ РАБОТНИК СУДОВОДИТЕЛЬ ВАГОНОВОЖАТЫЙ
Имя файла: Лукашевич-Н.В-Квазисинонимы-в-лингвистических-онтологиях-Near-synonyms-in-linguistic-ontologies.pptx
Количество просмотров: 167
Количество скачиваний: 0