РАСПОЗНАВАНИЕ ГРАММАТИЧЕСКОЙ ИНФОРМАЦИИ В ПРОЦЕССЕ ФОРМИРОВАНИЯ ЛИНГВИСТИЧЕСКИХ ЗНАНИЙ Академия управления при Президенте Р

Содержание

Слайд 2

Задача оперативного формирования специализированных баз знаний

Специализированные базы знаний:
- ограниченные некоторой предметной

Задача оперативного формирования специализированных баз знаний Специализированные базы знаний: - ограниченные некоторой
областью
- полученные на основе обработки определенного вида электронных ресурсов – материалов форумов, блогов …
Особенность – индивидуализированные языки участников диалогов:
использование ненормативной и эрративной ненормативной лексики (языков в стиле эрратива)
В таких условиях использование статичных лингвистических знаний (универсального грамматического словаря) затрудняется

Слайд 3

1. Словарь окончаний - 1

f1-f7 (f1,…, f7) – склонение существительных женского рода;

1. Словарь окончаний - 1 f1-f7 (f1,…, f7) – склонение существительных женского

m1–m12 (m1,…, m12) - склонение существительных мужского рода;
n1- n8 (n1,…, n8) - склонение существительных среднего рода;
a1–a7 (a1,…, a7) – адъективное склонение;
c1–c12 (c1,…, c12) – спряжение

Слайд 4

2. Алгоритм выявления коррелятивных пар

i:= 1;
j:= i+1;
если ai = s-P,

2. Алгоритм выявления коррелятивных пар i:= 1; j:= i+1; если ai =
шаг 4; иначе шаг 5;
если s =I(aj), шаг 8; иначе - шаг 11;
выделение предполагаемой основы I(ai, aj) и окончаний F(ai) и F(aj);
если ⎟I(ai, aj)⎟ ≥ 2; ⎟F(ai),⎟F(aj)⎟ ≤ 3, шаг 7; иначе – шаг 11;
если для F(ai) получено множество парадигм P(ai), шаг 8; иначе - шаг 11;
если для F(aj) получено множество парадигм P(aj), шаг 9; иначе - шаг 11;
если Pi ∩Pj ≠∅, шаг 10; иначе шаг 11;
ai:=s-P; удалить элемент aj;
j:=j+1;
если j ≤ n, шаг 3; иначе шаг 13;
i:= i+1;
если j ≤ n, шаг 2; иначе КОНЕЦ работы алгоритма.

a1, …, an - массив словоформ
I(ai, aj) – предполагаемая общая основа;
F(ai) и F(aj) – предполагаемые окончания словоформ
P(ai) и P(aj) – множества парадигм словоизменения
s-P – общая основа s, снабженная множеством общих типов парадигм P

Слайд 5

3. Преобразование

ai = стола,
aj = столов,
P(ai) ={f1-f4, m1–m7, n1-n4}
P(aj)

3. Преобразование ai = стола, aj = столов, P(ai) ={f1-f4, m1–m7, n1-n4}
= {m1-m3};
P(ai) ∩ P(aj) ={m1, m3, m3}

Слайд 6

4. Выявление согласования

a(f1-f4)→1.113
окончание –а, используемое в типах женского склонения f1-f4, заменяется

4. Выявление согласования a(f1-f4)→1.113 окончание –а, используемое в типах женского склонения f1-f4,
значениями «существительное», «именительный падеж», «единственное число», «женский род» (карта, книга);
а(m1, m6)→1.211/120
окончание –а, используемое в типах мужского склонения m1, m6, заменяется значениями «родительный падеж», «единственное число», «мужской род» (дома, мастера, сторожа) или значениями «именительный падеж», «множественное число» (домá, мастерá, сторожá)
Правила согласования:
3.120.X1 и 1.120.X2
большие дома, новые книги
3.51.X1 и 1.511.X2
большим домом, новым столом

Слайд 7

5. Алгоритм распознавания значений управления

морфологический анализ (кодирование значений согласования);
выявление и свертывание

5. Алгоритм распознавания значений управления морфологический анализ (кодирование значений согласования); выявление и
синтагм, основанных на согласовании;
выделение в оставшихся словосочетаниях гипотетических синтагм;
верификация гипотетических синтагм и пополнение списка новыми элементами;
обработка списка синтагм (кодирование значений управления).

Слайд 8

5. Алгоритм распознавания значений управления

Писатель подарил ученикам новую книгу с дарственной надписью

1.111.ПИСАТЕЛ-

5. Алгоритм распознавания значений управления Писатель подарил ученикам новую книгу с дарственной
2.111.ПОДАРИ- 1.320.УЧЕНИК- 3.413.НОВ- 1.413.КНИГ- С  3.513.ДАРСТВЕНН-1.513.НАДПИС-

ПОДАРИ- 3.УЧЕНИК- 4.КНИГ- С5.НАДПИС-

1.111.ПИСАТЕЛ- 2.111.ПОДАРИ,
3.413.НОВ- 1.413.КНИГ,
3.513.ДАРСТВЕНН-1.513.НАДПИС-;

ПОДАРИ- 3.УЧЕНИК-,
ПОДАРИ- 4.КНИГ-,
ПОДАРИ- С5.НАДПИС-,
УЧЕНИК- 4.КНИГ-,
КНИГ- С5.НАДПИС-

ПОДАРИ- 4.КНИГ-,
КНИГ- С5.НАДПИС-

Слайд 9

РАСПОЗНАВАНИЕ ГРАММАТИЧЕСКОЙ ИНФОРМАЦИИ В ПРОЦЕССЕ ФОРМИРОВАНИЯ ЛИНГВИСТИЧЕСКИХ ЗНАНИЙ

Академия управления
при Президенте Республики

РАСПОЗНАВАНИЕ ГРАММАТИЧЕСКОЙ ИНФОРМАЦИИ В ПРОЦЕССЕ ФОРМИРОВАНИЯ ЛИНГВИСТИЧЕСКИХ ЗНАНИЙ Академия управления при Президенте
Беларусь
Шибут М.С., Яковишин В.С.

Спасибо за внимание
(+375 17) 220-48-46
m_shi@tut.by

Слайд 10

7. Типы управления прилагательного

7. Типы управления прилагательного

Слайд 11

7. Типы управления существительного

7. Типы управления существительного

Слайд 12

7. Типы управления глагола

7. Типы управления глагола

Слайд 13

7. Типы управления глагола-2

7. Типы управления глагола-2
Имя файла: РАСПОЗНАВАНИЕ-ГРАММАТИЧЕСКОЙ-ИНФОРМАЦИИ-В-ПРОЦЕССЕ-ФОРМИРОВАНИЯ-ЛИНГВИСТИЧЕСКИХ-ЗНАНИЙ-Академия-управления-при-Президенте-Р.pptx
Количество просмотров: 112
Количество скачиваний: 1