Цифор/Tsifor байт-код для любого языка из номера основы слова и номера грамматической формы

Содержание

Слайд 2

Главные идеи

расчёска-лакуна

блендинг

декомпозиция

Главные идеи расчёска-лакуна блендинг декомпозиция

Слайд 3

ЧМИ требует идентификаторы

на столе
под столом
к столу

3486-24
3486-25
3486-26

бнар

комод

проект «Вофал»

ЧМИ требует идентификаторы на столе под столом к столу 3486-24 3486-25 3486-26 бнар комод проект «Вофал»

Слайд 4

Ком (comb) – расчёска

Бнар – идентификатор основы слова
Комод – идентификатор расчёски

Ком (comb) – расчёска Бнар – идентификатор основы слова Комод – идентификатор расчёски

Слайд 5

Даша ела кашу

974-22 5089-31 1834-17

тефорвать

цифорвать

Даша ела кашу 974-22 5089-31 1834-17 тефорвать цифорвать

Слайд 6

Зубцовая классификация языков

0 1 2 3 4 5

катализатор предлог префикс трансфикс

Зубцовая классификация языков 0 1 2 3 4 5 катализатор предлог префикс
постфикс послелог

изолирующие, аналитические и синтетические языки:
нет зубцов, 1-ые и 5-ые, 2-ые и 4-ые

расческа

номер зубца

Слайд 7

Лакунная классификация языков

01-лакунный (перед 1-м зубцом)
12-лакунный (между 1-м и 2-м, «свой» +

Лакунная классификация языков 01-лакунный (перед 1-м зубцом) 12-лакунный (между 1-м и 2-м,
«к сыну» = «к своему сыну»: в изолирующих, аналитических и синтетических языках с левым ветвлением, в т.ч. в английском и в русском)
23-лакунный (между 2-м зубцом и основой: в инкорпорирующих с левым ветвлением, например, эскимосских)
34-лакунный (между основой и 4-м зубцом: в инкорпорирующих с правым ветвлением)
45-лакунный (между 4-м и 5-м: в изолирующих, аналитических и синтетических языках с правым ветвлением)
56-лакунной (обозначение условно, после 5-го)

0 1 2 3 4 5

катализатор предлог префикс трансфикс постфикс послелог

Слайд 8

Однородные зубцы

1й корень

2

1

2й корень

1

2

2

1

1

2

Однородные зубцы 1й корень 2 1 2й корень 1 2 2 1 1 2

Слайд 9

Отношения основ

глагол

существ

наречие

чичар

зачар

козачар

козачар

чичар

зачар

глагольная с существительными > с наречиями,
именная с существительными > с

Отношения основ глагол существ наречие чичар зачар козачар козачар чичар зачар глагольная
прил. > с числительными
группа прилагательного с существительными («горд братом, чужд разврата, скуп в движениях») > группа прилагательного
с наречиями

Слайд 10

Родственные и козачарные зубцы

чичар

зачар

козачар

козачар

Родственные и козачарные зубцы чичар зачар козачар козачар

Слайд 11

Чукотский: инкорпорация

га-вэтъат-арма-қора-ма
(с бодливым сильным оленем)

Чукотский: инкорпорация га-вэтъат-арма-қора-ма (с бодливым сильным оленем)

Слайд 12

Кавказские: между, мимо, сверху

Кавказские: между, мимо, сверху

Слайд 13

Немецкий: зубец vs. основа

Er hörte gestern Abend dem Redner eine halbe Stunde lang zu
(Вчера вечером

Немецкий: зубец vs. основа Er hörte gestern Abend dem Redner eine halbe
он слушал полчаса выступающего)
Er hat dem Redner eine halbe Stunde lang zugehört
(Он слушал полчаса выступающего)
Hörst du zu? Hast du zugehört?

Слайд 14

You walk. Do you walk? Сто быков. Быков сто

Перечень лакунностей групп

Группы с

You walk. Do you walk? Сто быков. Быков сто Перечень лакунностей групп
несколькими лакунностями: в английском вопросительном и повествовательном предложениях, в русском языке в точном и приблизительном выражении количества и т.д.

глагольная с существительными
глагольная с наречиями
именная с существительными
именная с прилагательными
именная с числительными
группа прилагательного с существительными
группа прилагательного с наречиями

Слайд 15

бнар

нус

комод

присутствует нус

нуб

тип

тип

нувар

нувар

нувар

Блендинг: граммемы и константы

(«молоко&творительный пять литр» → «пятью литрами молока»)

бнар нус комод присутствует нус нуб тип тип нувар нувар нувар Блендинг:

Слайд 16

Нувар

1-й зубец («десять человек» в русском, в индонезийском),
2-й зубец (приставки СИ

Нувар 1-й зубец («десять человек» в русском, в индонезийском), 2-й зубец (приставки
и МЭК вроде «гига» и «гиби»),
5-й зубец («человек десять» в русском, в суахили) и т.д.

Нувар состоит из не более двух нузнов (которые будем отличать от грамматической категории «число», которой числительное в некоторых языках обладает)

Слайд 17

Бнар, нус, нувар, нуб

«тройка сотней» → полковое
«семи целых трех пятых» → наращивание

«вторые

Бнар, нус, нувар, нуб «тройка сотней» → полковое «семи целых трех пятых»
три четверти,
пятая тройка сотней,
семь целых три пятых»

Слайд 18

Классификация грамматических категорий

лугр (изменяемые и кодируемые в цифоре: время, залог, вид, эвиденциальность,

Классификация грамматических категорий лугр (изменяемые и кодируемые в цифоре: время, залог, вид,
наклонение, адмиратив, краткая/полная форма, отрицание, модальность, число)

вогр (неизменяемые и хранящиеся в ОС: спряжение, склонение, именной класс)

ныгр (изменяемые, но некодируемые, а вычисляемые по положению в клаузе: «первый, промежуточный, последний» групповой флексии сущ. в тюркских и осетинском)

Слайд 19

Декомпозиция на граммемы

0 1 2 3 4 5

катализатор предлог префикс трансфикс

Декомпозиция на граммемы 0 1 2 3 4 5 катализатор предлог префикс
постфикс послелог

0-й в австралийских изменяется по всем глагольным категориям (несет вместо глагола),
1-й в полинезийских – по «собственное-нарицательное», в ирландском – по числам и лицам,
4-й в русском от склонения и бита отрицания («вижу смысл» – «не вижу смысла», «есть смысл» – «нету смысла»)

Супплетив – основа, тефорвированная
не из одного бнара, а из бнара и инида

Слайд 20

Пул(pull) – начальная форма расчёски

Комод – идентификатор расчёски
Пулид – идентификатор начальной
формы

Пул(pull) – начальная форма расчёски Комод – идентификатор расчёски Пулид – идентификатор начальной формы расчёски
расчёски

Слайд 21

завогры
(падеж, число, род сущ. в прил., прич., притяж. местоим.)

мавогры
(число, лицо, род

завогры (падеж, число, род сущ. в прил., прич., притяж. местоим.) мавогры (число,
актанта в им.п. в гл.: число и лицо в наст. и буд.вр., число и род – в прош.вр.)

(«не» глагола в актанты: «вижу смысл – не вижу смысла», «есть смысл – нету смысла)
залугры

чивогры

чилугры

малугры

мачар чичар зачар

Слайд 22

Форма Бэкуса-Наура

ГЛАБУР ::= гланость #глаг {ЗОНТ} [ГЛАБУР] [Ин]
[Сн] [Пн] [Ип]

Форма Бэкуса-Наура ГЛАБУР ::= гланость #глаг {ЗОНТ} [ГЛАБУР] [Ин] [Сн] [Пн] [Ип]
[Сп] [Пп].
ЗОНТ ::= суность #сущ {ЗОНТ} [ГЛАБУР] [Ин]
[Объем] [Иллю] [#нус] [Ип] [Сп] [Пп].
Ип ::= приность #прил {ЗОНТ} [ГЛАБУР] [Ин].
Сп ::= приность #прил {ЗОНТ} [ГЛАБУР] [Ин].
Пп ::= приность #прил {ЗОНТ} [ГЛАБУР] [Ин].
Ин ::= наность #нач [#зач].
Сн ::= наность #нач [#зач].
Пн ::= наность #нач [#зач].
Объем ::= [нуб нувар].
Иллю ::= [нуб нувар].

«глагол-существительное-прилагательное-наречие»

Слайд 23

Резюме

Резюме

Слайд 24

Дает

единое устройство языков с т.з. инженера (vs. философствований Хомски)
перевод нейросетью атомарного субстрата

Дает единое устройство языков с т.з. инженера (vs. философствований Хомски) перевод нейросетью
(vs. “ааааааааааааа” → осмысленный перевод)
уменьшение и ускорение
(хранение корпусов, поиск)
описание семантически сегментированных изображений

Слайд 25

Докладчик ищет
безвозмездную помощь
программистов
и
лингвистов

Докладчик ищет безвозмездную помощь программистов и лингвистов