Multilingual Ontology Matching based on Wiktionary Data Accessible via SPARQL Endpoint

Содержание

Слайд 2

Содержание

Ontology matching
Викисловарь
SPARQL
Отображение онтологий на разных языках

Содержание Ontology matching Викисловарь SPARQL Отображение онтологий на разных языках

Слайд 3

Multilingual Ontology matching

RDF / XML файл 1 RDF / XML файл

Multilingual Ontology matching RDF / XML файл 1 RDF / XML файл 2
2

Слайд 4

Постановка задачи

Выполнить отображение онтологий на разных языках (англ., фр.)
Перевести с помощью:
Google Translate

Постановка задачи Выполнить отображение онтологий на разных языках (англ., фр.) Перевести с
API
Викисловарь (машинно-читаемый словарь)

Сравнить качество перевода

Слайд 5

Викисловари

Викисловарь – многофункциональный многоязычный
словарь и тезаурус

Грамматический
Толковый
Этимологический
Переводной

Викисловари Викисловарь – многофункциональный многоязычный словарь и тезаурус Грамматический Толковый Этимологический Переводной

Слайд 6

Развитие Викисловарей

Восемь самых больших Викисловарей (2003-2010)

Первым появился English Wiktionary в декабре 2002

Развитие Викисловарей Восемь самых больших Викисловарей (2003-2010) Первым появился English Wiktionary в
г.
Проект Русский Викисловарь запущен в мае 2004 г.

Слайд 7

10 крупнейших* (из 170) Викисловарей

* По данным на октябрь 2011

10 крупнейших* (из 170) Викисловарей * По данным на октябрь 2011

Слайд 8

Английский Викисловарь: Число словарных статей по языкам (Многоязычность)
Словарные статьи о словах 433 языков.
Переводы

Английский Викисловарь: Число словарных статей по языкам (Многоязычность) Словарные статьи о словах
английских слов – на 235 языков.
Дамп словаря от 18 июня 2011 г.

Слайд 9

Машинно-читаемый словарь на основе Английского Викисловаря: Раздел переводов

Машинно-читаемый словарь на основе Английского Викисловаря: Раздел переводов

Слайд 10

Словарная статья (фрагмент)

Словарная статья (фрагмент)

Слайд 11

SPARQL

SPARQL Protocol and RDF Query Language
RDF язык запросов:
Тройка, триплет (?X Отношение ?Y)
Конъюнкция

SPARQL SPARQL Protocol and RDF Query Language RDF язык запросов: Тройка, триплет
(A ; B.)
SELECT ?x WHERE { ?A Relation1 ?x ; ?x Relation2 ?B . }
Дизъюнкция (A. B.)
SELECT ?x WHERE { ?A Relation1 ?x . ?x Relation2 ?B . }
Дополнительные шаблоны для уточнения поиска.

Слайд 12

Платформа D2RQ

D2RQ представляет реляционную БД (не RDF) как виртуальный RDF граф
Создать файл

Платформа D2RQ D2RQ представляет реляционную БД (не RDF) как виртуальный RDF граф
отображения (MySQL - RDF)
Запустить MySQL и сервер-D2RQ
Запустить запросы SPARQL
Инструкции: D2RQ и данные Викисловаря
http://code.google.com/p/wikokit/wiki/d2rqMappingSPARQL

Слайд 13

Wik-tion-ary MRD data-base

Wiktionary MRD database

Wik-tion-ary MRD data-base Wiktionary MRD database

Слайд 14

SELECT ?langId ?pageId ?langPosId ?meaningId
?wikiTextIdDef ?definition WHERE {   ?lang wikpa:lang_code "en";   wikpa:lang_id

SELECT ?langId ?pageId ?langPosId ?meaningId ?wikiTextIdDef ?definition WHERE { ?lang wikpa:lang_code "en";
?langId.   ?page wikpa:page_page_title "dog";   wikpa:page_id ?pageId.   ?lang_pos wikpa:lang_pos_page_id ?pageId;   wikpa:lang_pos_lang_id ?langId;   wikpa:lang_pos_id ?langPosId.   ?meaning wikpa:meaning_id ?meaningId;    wikpa:meaning_lang_pos_id ?langPosId;    wikpa:meaning_wiki_text_id ?wikiTextIdDef.   ?wiki_text wikpa:wiki_text_id ?wikiTextIdDef;    wikpa:wiki_text_text ?definition. }

Получить толкование из Викисловаря по слову и языку
(SPARQL запрос)

Слайд 15

Ответ-SPARQL (список толкований слова “dog” из Английского Викисловаря)

Ответ-SPARQL (список толкований слова “dog” из Английского Викисловаря)

Слайд 17

Эксперимент

Тестовые данные (OAEI)
Онтология на англ. и на фр.
На фр. языке: 85 классов,

Эксперимент Тестовые данные (OAEI) Онтология на англ. и на фр. На фр.
97 атрибутов = 182
Идеальное отображение - 97 элементов

Слайд 18

Результаты

SPARQL запросы к Викисловарю
Список толкования по слову и языку
Список синонимов
Перевод слова (с английского

Результаты SPARQL запросы к Викисловарю Список толкования по слову и языку Список
на один из языков)
http://code.google.com/p/wikokit/wiki/d2rqMappingSPARQL
Пример приложения на Java
создаёт SPARQL запросы и получает данные от D2RQ сервера

Слайд 19

Спасибо за внимание!

Сайт проекта:
http:// code.google.com/p/wikokit/

Спасибо за внимание! Сайт проекта: http:// code.google.com/p/wikokit/

Слайд 20

Машинно-читаемый Викисловарь (MRD): Синонимы

*Английский Викисловарь, дамп от 18 июня 2011 г.
** Парадигматические

Машинно-читаемый Викисловарь (MRD): Синонимы *Английский Викисловарь, дамп от 18 июня 2011 г.
(семантические) отношения – синонимы, антонимы, гиперонимы…
Имя файла: Multilingual-Ontology-Matching-based-on-Wiktionary-Data-Accessible-via-SPARQL-Endpoint.pptx
Количество просмотров: 130
Количество скачиваний: 0