Использование машинного перевода в системах поиска русскоязычной информации

Содержание

Слайд 2

Информационная служба RUSSIAinfo создана в университете Хельсинки по инициативе и при поддержке

Информационная служба RUSSIAinfo создана в университете Хельсинки по инициативе и при поддержке
Министерства Просвещения Финляндии

RUSSIAinfo предлагает доступ к электронным ресурсам по
России для академического международного круга
пользователей

Метаданные: на английским и на финском

Ресурсы: 32% на английском языке, 12% на финском языке, 55% на русском языке, 11% на других языках

Реферативная база данных

Поиск: на английским и на финском

Слайд 3

Для пользователей, не владеющих русским языком, RUSSIAinfo предлагает возможность машинного перевода текстов

Для пользователей, не владеющих русским языком, RUSSIAinfo предлагает возможность машинного перевода текстов
с русского на английский (лицензия от ПРОМТ)

В настоящий момент предлагается три способа использования машинного перевода: перевод текста, перевод URL, и автоматический перевод результата поиска

Качество перевода: самое высокое достигается при переводе текстов по экономической тематике (специальные словари)

Сотрудничество с компанией ПРОМТ позволит нам также повысить качество перевода текстов по другим тематикам

Цель подключения МП – повышения коэффициента полноты поисковой системы: русскоязычные ссылки не отбрасываются пользователем

Слайд 4

Машинный перевод: черновой вариант перевода

Быстрый перевод текста с целью понять смысл

Полное соответствие

Машинный перевод: черновой вариант перевода Быстрый перевод текста с целью понять смысл
идеологии WWW: пользователь привык быстро «просматривать» веб-страницы и немедленно получать информацию

Лингвистическая база, программная база. Общелексические и специальные словари.

Позволит решить одну из основных проблем многоязычного поиска информации: перевод поисковых выражений (фраз)

Слайд 5

От чего зависит точность перевода?

Грамотность исходного текста: Грамматика, правописание

Наличие слов в переносном

От чего зависит точность перевода? Грамотность исходного текста: Грамматика, правописание Наличие слов
значении, неологизмов, аббревиатур

Слайд 6

Улучшение качества перевода специализированных текстов

Подключение специализированных словарей (Созданных ПРОМТ / Созданных пользователем)

Улучшение качества перевода специализированных текстов Подключение специализированных словарей (Созданных ПРОМТ / Созданных

Создание списка зарезервированных слов

Пример: Перевод документации по теме стоматология
1. С использованием созданного компанией ПРОМТ специализированного словаря
2. С использованием общелексического словаря

Слайд 7

Example: The layer of material beneath tooth enamel is the dentine. It

Example: The layer of material beneath tooth enamel is the dentine. It
too is composed of hydroxyapatite to the extent of about 70 per cent, the remainder is collagen and water. The dentine matrix is perforated by a number of tiny canals which radiate from the pulp cavity to the surface. These are the dentine tubules.

Слайд 8

Создание специализированных словарей для RUSSIAinfo

Российские государственные учреждения:

Создание специализированных словарей для RUSSIAinfo Российские государственные учреждения:

Слайд 9

Схема поиска информации с подключением машинного перевода:

пользователь

БД (англ.)

перевод документов х

n

x

результат поиска
……
Релевантный результат(англ.

Схема поиска информации с подключением машинного перевода: пользователь БД (англ.) перевод документов
фин.)
……
Релевантный результат(англ. фин.)
Релевантный результат(русский)
…..
Релевантный результат(русский)

поисковая команда (англ.)

найдено документов n+x

Слайд 10

Обратный перевод - с английского на русский - позволит направлять поиск в

Обратный перевод - с английского на русский - позволит направлять поиск в
русские поисковые системы путем перевода поисковых команд (Cross Language Information Retrieval)

Перевод метаданных полученных результатов позволит повысить не только коэффициент полноты, но и коэффициент точности системы

Слайд 11

Схема поиска информации с подключением машинного перевода;
интеграция русских баз данных (обратный

Схема поиска информации с подключением машинного перевода; интеграция русских баз данных (обратный
перевод):

пользователь

Поисковая команда (англ.)

БД(англ.)

n

x

найдено документов n+x+y

перевод документов х + y

перевод поисковой команды

результат поиска
Релевантный результат(англ. фин.)

Релевантный результат(англ. фин.)

Релевантный результат(русский)
Релевантный результат(русский)

Релевантный результат(русский)
Релевантный результат(русский)
Релевантный результат(русский)

y

БД(рус.)

перевод метаданных

Слайд 12

Планы на будущее:
Создание двуязычных (многоязычных ?) тезаурусов для поиска информации

Создание систем

Планы на будущее: Создание двуязычных (многоязычных ?) тезаурусов для поиска информации Создание
репрезентации поисковых команд и документов, не зависящих от входного/выходного языков для многоязычного поиска информации
Имя файла: Использование-машинного-перевода-в-системах-поиска-русскоязычной-информации.pptx
Количество просмотров: 203
Количество скачиваний: 0