Лексико-синтаксические шаблоны в задачах автоматической обработки текста

Содержание

Слайд 2

СОДЕРЖАНИЕ ДОКЛАДА

Задача формального описания лексических и морфосинтаксических особенностей текстовых единиц.
Результаты сравнительного анализа

СОДЕРЖАНИЕ ДОКЛАДА Задача формального описания лексических и морфосинтаксических особенностей текстовых единиц. Результаты
средств описания (НКРЯ, Alex, RCO).
Концепция лексико-синтаксического шаблона языковых конструкций.
Основные возможности языка записи лексико-синтаксических шаблонов (далее LSPL).

Слайд 3

ЗАДАЧА ОПИСАНИЯ ЯЗЫКОВЫХ КОНСТРУКЦИЙ

Изучение терминологических и дискурсивных особенностей НТ прозы

Потребность формализовать

ЗАДАЧА ОПИСАНИЯ ЯЗЫКОВЫХ КОНСТРУКЦИЙ Изучение терминологических и дискурсивных особенностей НТ прозы Потребность
характерные конструкции
(Под T будем понимать D, Далее докажем P, Допустим, что S)

Определение множества лексем, грамматических форм,
синтаксических условий

Фиксирование в виде декларативной структуры −
лексико-синтаксического шаблона языковой конструкции

NGACC [«мы»] «будем называть»TINS

Слайд 4

СРЕДСТВА ОПИСАНИЯ ЕДИНИЦ ТЕКСТА ДЛЯ ПОИСКА ФРАГМЕНТОВ В ТЕКСТАХ НА РУССКОМ ЯЗЫКЕ

СРЕДСТВА ОПИСАНИЯ ЕДИНИЦ ТЕКСТА ДЛЯ ПОИСКА ФРАГМЕНТОВ В ТЕКСТАХ НА РУССКОМ ЯЗЫКЕ

Единицы текста: словоформы, последовательности слов, словосочетания
Национальный корпус русского языка (НКРЯ)
ограниченность корпуса; лингвистическая разметка
поиск последовательности слов по их грамматическим и лексико-семантическим характеристикам
Система Alex
лексические шаблоны для узкоспециализированных текстов
средства описания словосочетаний, без указания грамматических признаков
RCO Pattern Extractor/система GATE
правила и шаблоны для извлечения из текста специфических объектов
формальный язык в стиле ЯП (атрибутно-объектная модель текста)

Слайд 5

СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ОПИСАНИЕ ЛЕКСИКО-ГРАММАТИЧЕСКИХ ОСОБЕННОСТЕЙ

Лексико-графические единицы

Морфо-синтаксические условия

СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ОПИСАНИЕ ЛЕКСИКО-ГРАММАТИЧЕСКИХ ОСОБЕННОСТЕЙ Лексико-графические единицы Морфо-синтаксические условия

Слайд 6

СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ

Логические операции

Запись конструкций

СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ Логические операции Запись конструкций

Слайд 7

Разработка формального языка для:
записи специфических языковых конструкций для их представления в

Разработка формального языка для: записи специфических языковых конструкций для их представления в
системе автоматической обработки НТТ;
записи запросов на поиск конструкций для системы поддержки лингвистических исследований.
Лексико-синтаксический шаблон – структурный образец языковой конструкции, отображающий ее лексические и поверхностно-синтаксические свойства.
Принцип отбора выразительных средств:
гибкая и интуитивно понятная запись основных лексических и поверхностно-синтаксических свойств конструкций.

ЛЕКСИКО-СИНТАКСИЧЕСКИЙ ШАБЛОН

Слайд 8

ЯЗЫК LSPL-ШАБЛОНОВ: ОСНОВНЫЕ ВОЗМОЖНОСТИ

Элемент-слово включает:
часть речи (A, N, V, Pa и т.д.) –

ЯЗЫК LSPL-ШАБЛОНОВ: ОСНОВНЫЕ ВОЗМОЖНОСТИ Элемент-слово включает: часть речи (A, N, V, Pa
A
индекс – A1 A2 N
лексема (< >) – A<важный>
уточнение грамматических характеристик (имя=значение) – A<важный; case=nom, gen=fem>
Грамматическое согласование элементов шаблона:
A<тяжелый> N
A<тяжелый> N 
Слово тяжелый и следующее за ним существительное согласованы в роде, числе и падеже: тяжелым вечером, тяжелых камней, тяжелое тело

Слайд 9

ЯЗЫК LSPL-ШАБЛОНОВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ

AP = A(A) | Pa(Pa)
AS= { AP } N<стол,c=nom> [“в”] (N)

ЯЗЫК LSPL-ШАБЛОНОВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ AP = A(A) | Pa(Pa) AS= { AP

Элемент-слово
Имя шаблона
Экземпляр шаблона
Условия согласования

Альтернативы |
Повторение {}
Опциональное вхождение []
Параметры шаблона

Элемент-слово
Имя шаблона
Экземпляр шаблона
Условия согласования

Альтернативы |
Повторение {}
Опциональное вхождение []

Слайд 10

ДОПОЛНИТЕЛЬНЫЕ ПРИМЕРЫ

Однородные члены в виде именных групп:
SNG = AN1 {“,” AN2}<1>

ДОПОЛНИТЕЛЬНЫЕ ПРИМЕРЫ Однородные члены в виде именных групп: SNG = AN1 {“,”
[“и” AN3] (AN1)
Дама сдавала в багаж диван, чемодан, саквояж, картину, корзину, картонку и маленькую собачонку
Шаблон типичной для деловой и НТ прозы конструкции:
NP = AN1 {AN2} (AN1)
Характерная конструкция определения новых терминов:
DT = NP1 ["мы"] "назовем" NP2
Указанную операцию назовем операцией поиска примеров

Слайд 11

ЯЗЫК LSPL-ШАБЛОНОВ: СРАВНИТЕЛЬНЫЙ ПРИМЕР

Прилагательное и существительное
в именительном падеже единственного числа

Язык LSPL:

ЯЗЫК LSPL-ШАБЛОНОВ: СРАВНИТЕЛЬНЫЙ ПРИМЕР Прилагательное и существительное в именительном падеже единственного числа
A N
Язык RCO Pattern Extractor:
{Morph.SpeechPart=“Noun”, Morph.Case=“Nominative”,
Morph.Number=“Singular”}
{Morph.SpeechPart=“Adjective”, Morph.Case=“Nominative”,
Morph.Number=“Singular”}
Имя файла: Лексико-синтаксические-шаблоны-в-задачах-автоматической-обработки-текста.pptx
Количество просмотров: 150
Количество скачиваний: 0