Лингвистические основы информатикиЧасть 1

Содержание

Слайд 2

ТЕМАТИЧЕСКИЙ ПЛАН

Введение. Лингвистические модели в современных информационных технологиях.
 Раздел 1. Лингвистические модели и

ТЕМАТИЧЕСКИЙ ПЛАН Введение. Лингвистические модели в современных информационных технологиях. Раздел 1. Лингвистические
методы формализации текста.
Язык как система. Уровни описания языка.
Синтаксическая структура предложения и способы ее формализации.
Автоматизация словарных работ и статистический анализ текста.
Раздел 2. Логико-семантические модели текста
Основные понятия и проблемы семантики.
Языки представления знаний.
Семантическое описание лексики. Семантические словари.

Слайд 3

Л И Т Е Р А Т У Р А
(к части 1)
Основная:
1.   

Л И Т Е Р А Т У Р А (к части
Лингвистический энциклопедический словарь. – М., 1990; М., 2000
Беляева Л. Н. Лингвистические автоматы в современных информационных технологиях. – СПб.:Изд-во РГПУ, 2001.
Баранов А. Н. Введение в прикладную лингвистику. – М., 2001
Г.Г. Белоногов, Ю.П. Калинин, А.А. Хорошилов. Компьютерная лингвистика и перспективные информационные технологии - М.: Русский мир, 2004.
Антопольский А. Б. Лингвистическое обеспечение электронных библиотек". - М., 2003. - 302 с
Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы. – М: Издательский центр «Академия», 2006
Дополнительная:
Левицкий Ю.А. Основы теории синтаксиса. – М.: URSS. 2005.

Слайд 4

Введение. Лингвистические модели в современных информационных технологиях.

Автоматический перевод – исторически

Введение. Лингвистические модели в современных информационных технологиях. Автоматический перевод – исторически первая
первая "лингвистическая" технология.
Лингвистические модели в документальных информационных системах.
Орфографические и грамматические корректоры.
Лингвистические модели в системах распознавания письменных текстов и устной речи.
Системы понимания (смыслового анализа и синтеза) текста.

Слайд 5

# 1. Автоматический перевод – исторически первая лингвистическая" технология.

1.1. Этапы развития
1.2. Основные

# 1. Автоматический перевод – исторически первая лингвистическая" технология. 1.1. Этапы развития
проблемы
1.3. Методы и процедуры

Слайд 6

1.1. Этапы развития
Начало:
1946: А. Бут & У. Уивер – формулировка задачи –

1.1. Этапы развития Начало: 1946: А. Бут & У. Уивер – формулировка
перевод как дешифровка текста
1952: Первая конференция по АП. Возможен ли АП?
1954: Начало работы - Джорджтаунский эксперимент.
1954: Начало работ в СССР. - ИПМ; О. С. Кулагина
Конец 50-х – 60-е гг.: Осознание трудностей и
проблем; разочарование и отступление.
70-е – 80-е гг: «Правильная осада».
С начала 90-х: Период коммерческих систем:
ProMT Translation Office - фирма ProMT;
Сократ – фирма «Арсенал»;
карманные переводчики: “Partner” - «Эктако»,
“Pocket ProMT”; “СократСЕ”; “СловоЕд”
Прогноз:
2010-е гг: литературный перевод деловых текстов.

Уоррен Уивер
(директор отделения естественных наук Рокфеллеровского фонда):
"Глядя на статью на русском языке, я говорю себе: в действительности статья написана по английски. но зашифрована какими-то непонятнымии знаками"

Слайд 7

1.2. Основные проблемы АП
Недостаточная полнота и точность описания языка в традиционной лингвистике
Основная

1.2. Основные проблемы АП Недостаточная полнота и точность описания языка в традиционной
причина – традиционная лингвистика ориентирована на человека, владеющего (родным) языком.
«Простой» пример - словоизменение:
Абзац – абзаца
Конец - конца
Стрелец - стрельца
Читать - читаю
Спать -сплю
Быть – будь – будящий – буденный
… - сидящий … - облученный
Слово – часть речи = ?
А. А. Зализняк. Грамматический словарь русского языка. –
М.: 1977 (Около 100 000 слов).

Слайд 8

Лексическая многозначность
Он открыл дверь своим ключом (1)
Дай мне ключ 12 на 18

Лексическая многозначность Он открыл дверь своим ключом (1) Дай мне ключ 12
(2)
Он сумел подобрать ключ к шифру (3)
Ключ данных; ключевое поле (4) (= key)
Музыкальный ключ (= klef)
В овраге бьют ключи (= source, spring)
предлог - I (отговорка) pretext, pretence; (повод) ground
предлог - II грам, preposition
предложение - I offer, suggestion
предложение - II грам, sentence;
(часть сложного предложения) clause
Омонимия частей речи:
Light – 1) сущ.: = свет, лампа;
2) прил.: = светлый, легкий;
3) глаг.: = освещать, зажигать;

Слайд 9

Невозможность пословного перевода:
He is reading.
One has to wash his face every morning.
Неоднозначность

Невозможность пословного перевода: He is reading. One has to wash his face
значения грамматических форм
Пример – многозначность русского творительного падежа:
Письмо написано ребенком. («агентивность»)
Он ел икру ложкой. («инструментальность»)
Он ел икру дорОгой. («локативность»)
Он ел икру утром. («темпоральность»)
Он ел икру пудами. («квантитативность»)
Различие грамматического строя разных языков
- невозможность однозначного перевода однотипных грамматических конструкций:
Stone bridge ? [ A + N ]
Carriage return ? [ N + NGen]
Power struggle ? [ N + P + NAcc]

Слайд 10

Трудности перевода предлогов:
Самолет прибывает в 12:10.
Я не работаю в среду.
В июле очень

Трудности перевода предлогов: Самолет прибывает в 12:10. Я не работаю в среду.
жарко.
Вы должны следовать за проводником.

The plain arrives at 12:10

I don’t work on Wednesday

It is very hot in July

You have to follow your guide / conductor (нет предлога)
NB: в путешествии – guide;
в вагоне – conductor;
в культуре и науке – champion.

Ср. также под предлогом:
- under preposition (грам.)
- under / on the pretext of (используя как повод)

Слайд 11

Трудности перевода предлогов:
Самолет прибывает в 12:10.
Я не работаю в среду.
В июле очень

Трудности перевода предлогов: Самолет прибывает в 12:10. Я не работаю в среду.
жарко.
Вы должны следовать за проводником.

The plain arrives at 12:10

I don’t work on Wednesday

It is very hot in July

You have to follow your guide / conductor (нет предлога)
NB: в путешествии – guide;
в вагоне – conductor;
в культуре и науке – champion.

Ср. также под предлогом:
- under preposition (грам.)
- under / on the pretext of (используя как повод)

Слайд 12


Шутки специалистов:
Дух силен, да плоть слаба.

Водка крепкая, а мясо протухло.

The spirit

Шутки специалистов: Дух силен, да плоть слаба. … Водка крепкая, а мясо
is strong, but the flesh is weak

То же с английского на русский:
The plain flew over the hill. (= над)
The dog jumped over the fence. (= через)

Слайд 13

1.3. Методы и процедуры АП

1) Основные методы:
Словарная поддержка; методы быстрого поиска в

1.3. Методы и процедуры АП 1) Основные методы: Словарная поддержка; методы быстрого
словаре;
(проблема создания больших словарей – 100 тыс. – 1 млн.)
Формальные грамматики
(Совокупность точных правил, описывающих способы построения и грамматического разбора предложений и
словосочетаний)
Прецедентно-статистический
(example-based, case-based) анализ
TMS – Translation Memory System

Слайд 14

2) Процедуры АП:

От письменного текста к словоформам
Определение возможных грамматических характеристик словоформы
Грамматический

2) Процедуры АП: От письменного текста к словоформам Определение возможных грамматических характеристик
разбор – определение возможных синтаксических связей. [+ Прецедентный анализ]
Выбор переводного эквивалента словоформы - с учетом синтаксического контекста
[Построение смыслового представления; разрешение лексических и синтаксических неоднозначностей]
Перевод синтаксических связей на выходной язык
Морфологический синтез
Линеаризация

Слайд 15

# 2. Документальные ИПС

Лингвистические проблемы:
Отождествление разных грамматических форм слова: формат – формата

# 2. Документальные ИПС Лингвистические проблемы: Отождествление разных грамматических форм слова: формат
- *формам
Поисковая эквивалентность связанных по смыслу слов:
Word -> текстовый процессор; стрела ->подъемный кран; жесткий диск -> компьютер
(словари-тезаурусы)
Смысловые связи между словами в тексте:
базы данных ? ? на базе данных моделей…

Расплодившиеся гусеницы уничтожили листву яблонь. Для борьбы с ними были использованы установленные на тракторе распылители пестицидов

Слайд 16

Пример - для п.п. 2) и 3):
Деятельность английских разведчиков в немецких колониях

Пример - для п.п. 2) и 3): Деятельность английских разведчиков в немецких
во время 1-ой мировой войны.
Деятельность немецких разведчиков в английских колониях во время 1-ой мировой войны.
Британский шпионаж в германских владениях в 1915 -16 г.г.

Слайд 17

# 3. Орфографические и грамматические корректоры
Орфографический контроль: словарь основ + моделирование словоизменения

# 3. Орфографические и грамматические корректоры Орфографический контроль: словарь основ + моделирование

Отсутствие орфографических замечаний не гарантирует от ошибок правописания:
Целю организации является…
Пуск осуществляется красКой кнопкой.
Частый детектив.
Он не /может/ решитЬся на это.
NB: Опасность команды «Заменить все»:
Все купившИЕ путевкИ…
Каждый купившИЙ путевкУ…

Слайд 18

Возможности грамматического корректора:
пока ограничены!
формальные проверки (лексические повторы, скобки…)
проверка согласования (именные группы, подлежащее

Возможности грамматического корректора: пока ограничены! формальные проверки (лексические повторы, скобки…) проверка согласования
- сказуемое)
проверка управления (ограниченно - предлоги и др.)
узус
придает большое внимание:
Замечание корректора: "Нарушение лексической сочетаемости. Смешение двух устойчивых выражений "придавать значение" "уделять внимание".
Перспективы…

Слайд 19

# 4. Распознавание письменного текста и устной речи
OCR (Optical Character recognition)

# 4. Распознавание письменного текста и устной речи OCR (Optical Character recognition)
от графического файла к текстовому.
Коммерческие системы:
- широкие возможности, высокое качество распознавания.
FineReader (фирма ABBYY);
Cuneiform (фирма Cognitive Technologies)

Слайд 20

SR (Speech Recognition), TTS (Text To Speech) - распознавание устной речи)
Применение:
голосовой ввод

SR (Speech Recognition), TTS (Text To Speech) - распознавание устной речи) Применение:
текста;
"контакт -центры";
протоколирование официальных заседаний;
медицина; следствие и судопроизводство;
военное дело и криминалистика;
Voice Commander
Коммерческие системы:
Dragon («Горыныч» – неудача русификации);
ViaVoice (фирма IBM).
Основные ограничения: чтение отдельными словами;
необходимость настройки на конкретного пользователя.

Слайд 21

Пример коммерческого применения: "Контакт-центры":
службы продажи билетов;
справочные службы;
службы технической поддержки
Исходный пункт – IVR-технологии

Пример коммерческого применения: "Контакт-центры": службы продажи билетов; справочные службы; службы технической поддержки
(Interactive Voice Response)
Следующий шаг – технологии Open Speech

Слайд 22

Функциональность и характеристики:
Разработчик TTS - Nuance (ScanSoft);
интегратор в технологии контакт-центров "под

Функциональность и характеристики: Разработчик TTS - Nuance (ScanSoft); интегратор в технологии контакт-центров
ключ" – Avaya
точность распознавания речи (заявленная) – 98%;
способность к самообучению в процессе работы;
определение начала и конца реплики собеседника;
умение отличать паузы от завершения фразы;
адекватная реакция на перебивание собеседником голосового сообщения системы;
отсеивание посторонних шумов;
"живой отклик" (responsiveness);
распознавание на нескольких языках.

Слайд 23

Лингвистическое содержание технологий распознавания:
Этап распознавания отдельных элементов (буквы в OCR, звуки или

Лингвистическое содержание технологий распознавания: Этап распознавания отдельных элементов (буквы в OCR, звуки
целые слова в SR)
Лингвистические фильтры:
орфографический;
грамматический;
семантический;
Прецедентно-статистический.

Слайд 24

# 5. Системы понимания (смыслового анализа и синтеза) текста.
Что значит «понимать текст»?
-

# 5. Системы понимания (смыслового анализа и синтеза) текста. Что значит «понимать
уметь отвечать на вопросы по тексту (ср. пример в #2)
В пустую комнату вошла высокая женщина, за руку которой держался маленький мальчик.
Сколько человек находится в этой комнате?
Диалоговые системы, имитирующие понимание:
ELIZA - диалог с потенциальным пациентом от лица психоаналитика [Weizenbaum 1977];
A.L.I.C.E. – см. в Интернет;
конкурс Лёйбнера - проводится Университетом острова Флиндерс (Южная Австралия):
http:/www.loebner.net/Prizef/loebner-prize.html
Если эксперт считает, что его собеседник некоторую часть времени «ведет себя как человек», а не как машина, то конкурсная оценка возможностей тестируемой системы возрастает.

Слайд 25

Современная инженерная постановка задачи:
Informftion Extraction
Глобальные задачи:
Автоматизированная справочная система с речевым

Современная инженерная постановка задачи: Informftion Extraction Глобальные задачи: Автоматизированная справочная система с
интерфейсом («Служба 09»; «врач-консультант»; «юрист-консультант»; «шеф-повар-консультант» и т.п. ).
«Универсум знаний (оракул)» - интерактивная энциклопедия.

Слайд 26

Справочная служба - основные процедуры:
Получить вопрос, убедиться, что он понятен системе (взаимодействие

Справочная служба - основные процедуры: Получить вопрос, убедиться, что он понятен системе
с подсистемами 2, 3 и 4), если необходимо –
уточнить вопрос в диалоге с пользователем
Преобразование речевого вопроса в текстовую строку
(SR-технология)
Определить релевантную БД (?? – глубокий смысловой анализ)
Построить по тексту вопроса SQL-запрос (смысловой анализ –
имеются экспериментальные системы)
Выполнить запрос (технология реляционных СУБД)
Преобразовать ответ СУБД из табличной в текстовую форму
(смысловой синтез - имеются экспериментальные системы)
Преобразовать текстовую строку ответа в звуковую речь (звуковой синтез - технологии приближаются к коммерческому уровню)

Слайд 27

Т е м а 3. Автоматизация словарных работ и статистический анализ текста.

Типы

Т е м а 3. Автоматизация словарных работ и статистический анализ текста.
словарей
Частотные словари, их создание и использование.
2.1. Основные направления использования
2.2. Технология создания частотного словаря средствами стандартных офисных технологий

Слайд 28

#1. Типы словарей
1.1. По типу лексических единиц
Лингвистические словари: объект описания – слово
(орфографические,

#1. Типы словарей 1.1. По типу лексических единиц Лингвистические словари: объект описания
толковые, переводные,…)
Энциклопедические словари: объект описания – понятие
(ср. БСЭ, Политехнический словарь, )
1.2. По социальной функции
Описательные
(синонимов, толковые, переводные,…)
Нормативные
(орфографические, «Вместе или раздельно», словари рекомендуемых терминов)

Слайд 29

1.3. По адресату
Человекоориентированные
- общего назначения;
- для определенных социальных групп
Машиноориентированные

1.3. По адресату Человекоориентированные - общего назначения; - для определенных социальных групп
= словарь, ориентированный на использование программами
- обычно *.DLL - библиотека
(NB: НЕ то же, что «словарь на машинном носителе»!)

Слайд 30

1.4. По широте охвата лексики
Общеязыковые
Специализированные
(словари имен, блатной лексики, словарь туриста,
словарь Пушкина,

1.4. По широте охвата лексики Общеязыковые Специализированные (словари имен, блатной лексики, словарь
словарь глагольного управления,…)
1.5. По числу языков
Одно-, двух-, многоязыковые
1.6. По способу упорядочения
Алфавитные (прямой и обратный порядок; упорядочение по концам слова - ср. грамматический словарь Зализняка)
Частотные
Идеографические
(Русский семантический словарь, Толковый словарь русских глаголов)

Слайд 31

1.7. По типу описываемых языковых явлений
Орфографические (правописание)
Фонетические (произношение и ударение)
Грамматические (словоизменение и

1.7. По типу описываемых языковых явлений Орфографические (правописание) Фонетические (произношение и ударение)
грамматические характеристики словоформы)
Частотные
- общеязыковые;
- для определенного стиля речи: научный, публицистический, разговорный, поэтический;
- для определенной предметной области (научной дисциплины);
- авторские, персонажей,…
Исторические и этимологические (происхождение слов и развитие значений слова)
Смысловые соответствия (межязыковые – переводные словари и внутриязыковые – толковые и энциклопедические словари)

Слайд 32

Словари сочетаемости
- словари глагольного управления,
- словари лексических функций (определяют способы

Словари сочетаемости - словари глагольного управления, - словари лексических функций (определяют способы
нестандартного выражения заданного смысла для слова X):
Magn(X) - ‘в большой степени X’
X – молчание, Magn(X) – гробовое;
X – обыск, Magn(X) – тщательный;
X – дурак, Magn(X) – круглый;
X – негодяй, Magn(X) – отъявленный;
X – брюнетка, Magn(X) – …?;
Real(X) - ‘X осуществляется, происходит’
X – победа, Real(X) – одержать;
X – поражение, Real(X) – потерпеть;
X – трагедия, Real(X) – пережить;
X – потрясение, Real(X) – …?;

Слайд 33

# 2. Частотные словари, их создание и использование.
2.1. Основные направления использования
Изучение особенностей

# 2. Частотные словари, их создание и использование. 2.1. Основные направления использования
разных языковых стилей и языка социальных групп: (разговорный, литературный, профессиональный стили; подростковый жаргон, …)
Изучение авторского языка и стиля ( «язык Достоевского», «язык Солженицына» и т.д.)
Выявление наиболее употребительной лексики ("русский как иностранный")
Выявление основного содержания большого текста (технологии типа Text Mining)
Ранжирование документов при поиске в Интернет (!)
Изучение сочетаемости слов и терминов
Разделение лексики на общеязыковую и специальную

Слайд 34

2.2. Технология создания частотного словаря средствами стандартных офисных технологий
Преобразование текста в словник
Нормализация

2.2. Технология создания частотного словаря средствами стандартных офисных технологий Преобразование текста в
словоформ (метод сверток)
Импорт словника в таблицу БД Access
Создание частотного словаря (запрос Access с группировкой по словам - сверткам)
Оценка точности грамматической нормализации методом сверток
Анализ влияния грамматической нормализации на частотное ранжирование лексики
Разделение лексики на предметную и общеязыковую
Выделение понятий, выраженных двух- и трехсловными словосочетаниями.
Сравнение «ручной» и «частотной аннотаций». Подготовка отчета.

Слайд 35

Преобразование текста в словник
Удаление ненужных символов -
использование режима Подстановочные знаки -

Преобразование текста в словник Удаление ненужных символов - использование режима Подстановочные знаки
поиск и замена по шаблону (использование регулярных выражений); заменить на пустую строку или пробел):
? – любой одиночный символ (к?т)
* – любое число любых символов (к*т)
[ио] – любой из указанных символов (к[ио]т)
[A-z] – любой символ в указанном диапазоне
^# – любая цифра

Преобразование в формат «все словоформы в 1 столбец» -
замена пробелов символом «конец абзаца»

Слайд 37

Нормализация словоформ (метод сверток)
Алгоритм построения свертки:  
в свертку включаются три первые буквы

Нормализация словоформ (метод сверток) Алгоритм построения свертки: в свертку включаются три первые
слова;
в свертку включаются остальные согласные буквы слова;
при свертывании отбрасываются конечные буквы в, г, м, х
(если они входят в окончания существительных и прилагательных)
Макрос ДобавитьСвертки2
Примеры:

Слайд 38

Оценка точности грамматической нормализации методом сверток

Всего просмотрено слов (существительных и прилагательных) –

Оценка точности грамматической нормализации методом сверток Всего просмотрено слов (существительных и прилагательных)
M
Из них имеют не совпавшие свертки – N
Точность отождествления = N/M
В примере: N=1, M=3; точность = 1/3 (~30%)

Ошибки:
богослОВ, женИХ, запАХ, систЕМУ
конЬ – кон; потОМУ – пот; косОМУ – косА - косой;
сотОМУ – сотЫ
нерегулярность словоизменения:

Слайд 39

Анализ влияния грамматической нормализации на частотное ранжирование лексики:

Анализ влияния грамматической нормализации на частотное ранжирование лексики:

Слайд 41

Разделение лексики на предметную и общеязыковую

Выделение понятий, выраженных двух- и трехсловными словосочетаниями.

Разделение лексики на предметную и общеязыковую Выделение понятий, выраженных двух- и трехсловными словосочетаниями.

Слайд 43

Т е м а 1. Язык как система. Уровни описания языка.

Функциональное описание языка

Т е м а 1. Язык как система. Уровни описания языка. Функциональное
(функциональные стили)
Внутрисистемное описание языка

Слайд 44

Функциональное описание языка (функциональные стили)
1.1. Деловая речь (функция деловой коммуникации)
1.2. Поэтическая

Функциональное описание языка (функциональные стили) 1.1. Деловая речь (функция деловой коммуникации) 1.2.
речь (функция построения
художественного образа)
1.3. Другие функции языка:
Выражение эмоций (Смысл не важен – важна интонация…)
Ритуал (напр., церковная служба)
Символизация принадлежности к социальной группе
[Разговорная речь –комплексный феномен]

Слайд 45

# 1. Функциональное описание языка

Погруженность языка в культуру.
(Почему вдруг появилась масса англицизмов?)
Что

# 1. Функциональное описание языка Погруженность языка в культуру. (Почему вдруг появилась
есть культура?
П. Сорокин: Совокупность значений, ценностей и норм, которыми владеют взаимодействующие лица, и совокупность носителей , которые объективируют, социализируют и раскрывают эти компоненты.

Слайд 46

Основные компоненты культуры:
понятия и знания, упорядочивающие социальный опыт (когнитивная и технологическая подсистема);
идеалы,

Основные компоненты культуры: понятия и знания, упорядочивающие социальный опыт (когнитивная и технологическая
ценности (подсистема мотивации);
нормы и образцы (подсистема регуляции поведения);
материальная среда (орудия и продукты человеческой деятельности - артефакты, обеспечивающие физическое существование социума);
эстетическая среда (подсистема гармонизации социальной жизни) .

Слайд 47

Проявления культуры в языке:
Откуда взялись выражения:
Много воды утекло.
Ваше время истекло.
Бить склянки.

Клепсидра в

Проявления культуры в языке: Откуда взялись выражения: Много воды утекло. Ваше время
суде.
Песочные часы.

Культура как диалог культурных феноменов
В.Высоцкий:
Наконец-то нам дали приказ наступать,
Отбирать наши пяди и крохи,
Но мы помним, как Солнце отправилось вспять
И едва не зашло на востоке.

«Чужой земли не хотим, но и своей земли ни пяди не отдадим.»
Сталин (?)

Еще примеры:
магазин "Старик Хоттабыч";
"Итого!…"

Слайд 48

В зависимости от того, где и для какой цели используется язык,
Меняются лексика,

В зависимости от того, где и для какой цели используется язык, Меняются
формы языковых выражений и их характеристики.
С этой точки зрения можно различать функциональные стили
речи

Слайд 49

Важность правильной оценки коммуникативного намерения говорящего / пишущего:
На школьном уроке.
Учитель: В каком

Важность правильной оценки коммуникативного намерения говорящего / пишущего: На школьном уроке. Учитель:
году родился Пушкин?
Ученик:

Мне бы Ваши заботы, господин учитель!

На улице.
- Не знаете ли Вы, который час?

- Знаю.

Слайд 50

1.1. Деловая речь (функция деловой коммуникации)
А.П. Ершов: «Феномен деловой прозы» (1978 г.):

1.1. Деловая речь (функция деловой коммуникации) А.П. Ершов: «Феномен деловой прозы» (1978
“деловая проза –это языковый носитель производственных отношений”.
Основные характеристики.
Точность и однозначность выражения;
Стандартность, единообразие способов выражения мысли – каждое понятие должно выражаться всегда одним и тем же способом, употребление синонимов не приветствуется;
Неметафоричность – использование слов (терминов) только в их прямом и буквальном смысле;
Смысл слова (термина) должен быть определен и известен до его употребления в тексте – ср. энциклопедические словари;
Максимальная смысловая полнота; отсутствие намеков и недоговоренностей; апелляция только к профессиональным знаниям читателя, но не к воображению, не к ассоциациям;
Логическая последовательность, непротиворечивость.

Слайд 51

Примеры деловой прозы
УК РФ, ст. 219:
“1. Нарушение правил пожарной безопасности, совершенное лицом,

Примеры деловой прозы УК РФ, ст. 219: “1. Нарушение правил пожарной безопасности,
на котором лежала обязанность по их соблюдению, если это повлекло по неосторожности причинение тяжкого или средней тяжести вреда здоровью человека, -
наказывается штрафом в размере от 100 до 200 МРОТ…
2. То же деяние, повлекшее по неосторожности смерть человека или иные тяжкие последствия –
наказывается ограничением свободы на срок до 5 лет или лишением свободы на срок до 10 лет…”

Слайд 52

СНИП «Жилые здания»:
2.9. Жилые комнаты общежитий следует проектировать из расчета заселения не

СНИП «Жилые здания»: 2.9. Жилые комнаты общежитий следует проектировать из расчета заселения
более трех человек при площади не менее 6,0 кв. м. на каждого проживающего. Комнаты должны быть непроходными, шириной не менее 2.2 м., их следует оборудовать встроенными шкафами площадью не менее 0.5 кв. м. на каждого проживающего.

Слайд 53

Научно-технический текст:
Увеличение напряжения текучести может быть объяснено за счет вакансий, которые имеют

Научно-технический текст: Увеличение напряжения текучести может быть объяснено за счет вакансий, которые
заметную подвижность при –72оC.
Образование илистого осадка зависит от размера частиц, полученных механическим способом, количества металла в амальгаме и чистоты растворов.

Слайд 54

Деловая проза – это профессиональные подъязыки - со своей лексикой, своими характерными

Деловая проза – это профессиональные подъязыки - со своей лексикой, своими характерными
оборотами речи и грамматическими конструкциями.
Например:
юридический: причинение …средней тяжести вреда…
военный: открыть огонь на поражение
морской: на флоте
математический: для…необходимо и достаточно…
приказ по вузу: зачислить на 1-ый курс (а не принять)
И т. д.
Чем ответственнее сфера деятельности, тем более стандартизован язык.
Чем беднее словарный состав делового текста – тем лучше текст!
Кто не владеет профессиональным языком – тот не профессионал!

Слайд 55

1.2. Поэтическая речь (функция построения
художественного образа)
Поэтическая речь = художественное слово

1.2. Поэтическая речь (функция построения художественного образа) Поэтическая речь = художественное слово
«в чистом виде»
Основные характеристики:
Многовариантность выражения одного и того же смысла.
Так думал молодой повеса, Ребенок был резов, но мил
Летя в пыли на почтовых, …
Всевышней волею Зевеса Чтоб не измучилось дитя
Наследник всех своих родных. …
Друзья Людмилы и Руслана!
С героем моего романа
Без предисловий, сей же час
Позвольте познакомить вас:
Онегин, добрый мой приятель,

Слайд 56

Смысловая неполнота как принцип – говорится всегда больше, чем сказано; обращение не

Смысловая неполнота как принцип – говорится всегда больше, чем сказано; обращение не
только к культурно-энциклопедическому контексту, но и к эмоциональной сфере;
Метафорическое использование слова:
Поэты ходят пятками по лезвию ножа
И режут в кровь свои босые души. [В. Высоцкий]
Смысл слова может создаваться или изменяться контекстом его употребления:
Пинь-пинь-пинь –тарарахнул зензивер
[В. Хлебников]
Плывет в тоске необъяснимой
Среди кирпичного надсада
Ночной кораблик негасимый
Из Александровского сада. [И. Бродский]
Ожегов: надсада = чрезмерное усилие; ж.р. (+ орфографическ. сл.)

Слайд 57

Логическая непоследовательность – вплоть до абсурдности буквального смысла и прямого логического противоречия.
Речка

Логическая непоследовательность – вплоть до абсурдности буквального смысла и прямого логического противоречия.
движется и не движется,

Песня слышится и не слышится

Слайд 58

Поэзия не ставит целью информировать, описывать положение дел – даже если кажется,

Поэзия не ставит целью информировать, описывать положение дел – даже если кажется,
что о чем-то сообщает:
Ночь. Улица. Фонарь. Аптека.
Бессмысленный и тусклый свет.
(О чем? О плохом освещении улиц?…)

Живи еще хоть четверть века –
Все будет так. Исхода нет.
(От внешнего к внутреннему…)

Еще:
В тот год осенняя погода
Стояла долго на дворе,
Зимы ждала, ждала природа,
Снег выпал только в январе.
(NB: Роман в стихах – но отнюдь не метеосводка!)

Слайд 59

О чем твои стихи? Не знаю брат.
Ты их прочти, коли придет охота.
Стихи

О чем твои стихи? Не знаю брат. Ты их прочти, коли придет
живые сами говорят,
И не о чем-то говорят, а что-то.
[С. Маршак]
И еще о том же:
Быть знаменитым некрасиво,
Не это поднимает ввысь.
Не надо заводить архива,
Над рукописями трястись.
Цель творчества – самоотдача,
А не шумиха, не успех.
Позорно, ничего не знача,
Быть притчей на устах у всех.
(Пока звучит почти как речь на съезде писателей.
Но дальше: )

Слайд 60

Но надо жить без самозванства,
Так жить, чтобы в конце концов
Привлечь

Но надо жить без самозванства, Так жить, чтобы в конце концов Привлечь
к себе любовь пространства,
Услышать будущего зов.
И надо оставлять пробелы
В судьбе, а не среди бумаг,
Места и главы жизни целой
Отчеркивая на полях.

Другие по живому следу
Пройдут твой путь за пядью пядь,
Но пораженья от победы
Ты сам не должен отличать.
И должен ни единой долькой
Не отступаться от лица,
Но быть живым, живым и только,
Живым и только до конца. [Б. Пастернак, 1956.]

Слайд 61

В чем назначение поэзии (и искусства вообще)?
А. Блок:
“Цель поэзии – внести гармонию

В чем назначение поэзии (и искусства вообще)? А. Блок: “Цель поэзии –
в мир.”
Что может и что не может быть объектом информационных
технологий?

Слайд 62

# 2. Внутрисистемное описание языка
2.1. Язык как текст и как порождающая система.
2.2.

# 2. Внутрисистемное описание языка 2.1. Язык как текст и как порождающая
Уровни описания языка:
Фонетический
Морфологический
Синтаксический
Семантический

Слайд 63

2.1. Язык как текст и как порождающая система
Что такое «язык»?
Два возможных ответа:

2.1. Язык как текст и как порождающая система Что такое «язык»? Два
Текст VS Словарь
Как непосредственная данность – вся совокупность текстов, написанных (произнесенных) на данном языке – “корпус текстов”
Задача дешифровки:
от текстов к единицам и правилам построения;
(шумерские глиняные таблички; иероглифические книги майя;
От последовательности символов к смыслу
Реконструкция звуковой формы (?)

Слайд 64

Язык как система правил, описывающих способ порождения текста:
список элементов (слов) и их

Язык как система правил, описывающих способ порождения текста: список элементов (слов) и
классификация – с точки зрения сочетаемости в тексте (словарь);
способы их соединения в тексте (грамматика);
[способы их соотнесения с действительностью (семантика)]
Два типа отношений в языке –
синтагматические и парадигматические
красный - шар
синий - куб
медный - стержень
мягкий - карандаш
… …

Слайд 65

2.2. Уровни описания языка
2.2.1. Фонетический уровень
Фонетика – раздел языкознания, изучающий звуковые

2.2. Уровни описания языка 2.2.1. Фонетический уровень Фонетика – раздел языкознания, изучающий
единицы
языка, их сочетаемость в потоке речи и их позиционные изменения.(РГА)
Единицы – фонемы (звуки) / буквы
Классификация (парадигматика):
согласные
звонкие – глухие;
твердые – мягкие;

гласные (АеёИОУЫЭюя)

Слайд 66

Два звука считаются разными в данном языке, если замена одного
другим может

Два звука считаются разными в данном языке, если замена одного другим может
вызвать изменение смысла.
Примеры:
кот – год; пот – бот; (глухой - звонкий)
мэрский – мерзкий; забор – собор - запор (твердый - мягкий)
Кто счастлив, тот смеется,
Кто хочет, тот доБьётся,
Кто ищет, тот всегда найдет.
(Дунаевский, Лебедев-Кумач)
Кто хочет, тот доПьётся…
(Венедикт Ерофеев. Москва – Петушки.)

Слайд 67

Отношения (синтагматика) - линейное следование фонем в слове.
Возможность разных звукосочетаний и их

Отношения (синтагматика) - линейное следование фонем в слове. Возможность разных звукосочетаний и
характерность в языке:
3 гласных (длинношеее, радиоузел, змееопасный,…);
4 согласных (вздрогнуть, встряхнуть, президентский,…);
5 согласных (бодрствовать, контрпример, фландрский,…).
Характерные для разных языков звукосочетания:
Русский: город, корова, пароход, беда, …
Польский: Ястржембский, Збигнев Цибульский, Щецин,…
Английский: Джонсон, Кеннеди, Доусон, Черчилль…
Маяковский: "Вор нагл драл с лип жасмин"
Китайский: дао, Мао, Цзы, Цин, Мяо…
На русский текст объемом ~ 10 п.л.:
АО, ИУ – по 1 слову (наоборот, социум)
УИ – 2 слова (конструировать, градуировать)
ЯО - 0 слов;
ИЕ - 1600 раз, РО- 2244 раза!
NB: Важно для технологий SR и OCR! (Набор SMS-сообщений)

Слайд 68

Задачи моделирования:
Распознавание устной речи и письменного текста (SR и OCR);
Звуковая дешифровка

Задачи моделирования: Распознавание устной речи и письменного текста (SR и OCR); Звуковая дешифровка древних языков
древних языков

Слайд 69

2.2.2. Морфологический уровень
Морфология – раздел языкознания, изучающий словообразование и словоизменение, а также

2.2.2. Морфологический уровень Морфология – раздел языкознания, изучающий словообразование и словоизменение, а
способы выражения грамматических признаков в пределах словоформы.
Словоформа – слово, взятое в определенной
морфо-грамматической форме.
Слово – совокупность всех своих словоформ:
дом, дома, дому, домом, доме, дома(столы), домов, домами, домах.
Единицы – морфемы (= морфы) (Бодуэн де Куртенэ, 1881)
«Морфема – минимальная значимая часть словоформы»

Слайд 70

Классификация морфем - по месту в слове и функции:
корень (основное предметное

Классификация морфем - по месту в слове и функции: корень (основное предметное
значение слова);
основные словообразовательные аффиксы
(приставка, суффикс);
прочие словообразовательные аффиксы -
интерфиксы (соединительные гласные -о-, -е-, -и-):
пароход, овцебык, дозиметр,…
префиксоиды:
анти-, полу-, много-, высоко-, двух-, кило-, милли-, авто-, авиа-, гео-, вибро-, метео-, гидро-, теле-,…
суффиксоиды:
-метр, -скоп, -трон, -мобиль, -стат, --фон, -граф, - лиз, -навт, -лог, -логия, -фил,…
словоизменительные аффиксы -
окончания:
домами, красных, читают, работать,…
постфлексии:
давайте, смеется, какой-то,…

Слайд 71

Семантика морфем
А) Словоизменительные
Основная смысловыражающая функция – указывают на
существование смысловой связи между

Семантика морфем А) Словоизменительные Основная смысловыражающая функция – указывают на существование смысловой
словами.
Предметная семантика грамматических категорий
- иногда есть, иногда нет.
число: столы, книги, войны,…;
НО вилы, брюки, носилки,…
род: мама, девочка, баран,…;
НО - щука, сом, гусеница, врач, день - ночь,
стул - табуретка,…;
побежал – побежала…
падеж: послал другу (адресат);
НО горные породы разрушаются водой
vs горные породы разрушаются весной
время: время действия относительно момента речи,
либо время одного действия относительно другого в тексте:
Так думал молодой повеса, летя в пыли на почтовых, …

Слайд 72

Б) Словообразовательные
Можно выделить типовые значения:
уменьшительные и увеличительные:
ларчик, хлебец, книжечка, медвежонок, котище,…

Б) Словообразовательные Можно выделить типовые значения: уменьшительные и увеличительные: ларчик, хлебец, книжечка,
принадлежность лица профессии, месту, виду деятельности и т. п.:
летчик, певец, писатель, европеец, картежник,…
характеристика по форме и материалу:
металлический, стеклянный, конический
НО:
ср. суффиксы -ов- и –н- :
крокодиловые сапоги…;
научный, яблочный, компьютерный,…;
отделочные материалы.

Слайд 73

Отношения: (синтагматика) - линейное следование морфем в
слове (сочетаемость морфем).
Для окончаний –

Отношения: (синтагматика) - линейное следование морфем в слове (сочетаемость морфем). Для окончаний

описание сочетаемости с основой
через отнесение к флективному классу (~ 1000).
РГА: «К 1-му склонению относятся существительные муж. р.
с нулевой флексией в им. п. ед. ч. и сред. и муж. р. на –о, -е, -ё»
стол, дом, договор, сахар, купец, …
Список возможных окончаний (муж. р., «твердое склонение»):
И.: (=0)
Р.: -а (-у)
Д.: -у
В.: как И. или Р.
Т.: -ом
П.: -е(-у)
Мн. ч.: -ы(-а), -ов, -ам, -ами, -ах.

Слайд 74

Однако сочетаемость, например, основы и суффикса нормировать много труднее:
ротор – роторНый, НО

Однако сочетаемость, например, основы и суффикса нормировать много труднее: ротор – роторНый,
шар – шарОВой;
куб – кубИЧЕСКий НО зуб - зубНой; кубОВая краска
контур – контурНый, НО шнур – шнурОВой;

Слайд 75

Задачи моделирования:
Отличить словоформу от случайного набора букв/звуков
(обнаружение ошибок правописания, OCR- и

Задачи моделирования: Отличить словоформу от случайного набора букв/звуков (обнаружение ошибок правописания, OCR-
SR-технологии).
Отождествление (по смыслу) разных форм
одного и того же слова (ДИПС).
Отождествление основного предметного смысла (корня) в разных словах: ротор – роторный – двухроторный, … (ДИПС).
НО: лев, левый, королевский. ("Борис, ты не прав, ты лев!")
войска ?

савойская капуста

Слайд 76

Определение по основе и окончанию грамматических характеристик словоформы для автоматического грамматического разбора

Определение по основе и окончанию грамматических характеристик словоформы для автоматического грамматического разбора
предложения (АП, грамматические корректоры и фильтры в системах распознавания речи,
анализ смысла текста):
дому – дат. п. ед. ч.; дома – род. п. ед. ч., им. и вин. п. мн. ч.
Определение смысла слова по смыслу составляющих его морфов: дом, бездомный, домовладелец, домовой, домосед,…;
НО: аванс(-?)цена, полу(-?)чили, шок(-о?)лад, кол(-?)лекция,…

Слайд 77

Т е м а 2. Синтаксическая структура предложения и способы ее формализации.

Синтаксис

Т е м а 2. Синтаксическая структура предложения и способы ее формализации.
простого предложения
Межсегментные связи Слайд 71
Анафорические связи
Синтаксическая омонимия
Представление синтаксической структуры в алгоритмах и программах
Формальные свойства синтаксической структуры

Слайд 78

# 1. Синтаксис простого предложения
Синтаксическая связь – смысловая связь между словами,
выраженная

# 1. Синтаксис простого предложения Синтаксическая связь – смысловая связь между словами,
грамматическими средствами.
Синтаксис – учение о грамматически допустимых способах
соединения слов и предложений.
Единицы – слова и устойчивые словосочетания (фразеологизмы).
Отношения – синтаксические связи.
NB: не обязательно следование в тексте!

Слайд 79

1.1. Виды синтаксической связи.
Синтаксические связи:
Сочинительные - Соч
Подчинительные:
согласование - С
полное
неполное
управление - У
УП

1.1. Виды синтаксической связи. Синтаксические связи: Сочинительные - Соч Подчинительные: согласование -
– Управление от Предлога
(УС) – Управление с Согласованием
(связь сказуемое - подлежащее)
сильное – слабое
беспредложное – предложное
примыкание - П

Слайд 80

Сочинительная связь –
связь между словами, имеющими одну и ту же грамматическую

Сочинительная связь – связь между словами, имеющими одну и ту же грамматическую
и/или смысловую функцию в предложении (однородные члены предложения),
либо между грамматически равноценными предложениями.
Ср.: Передайте конверт тайно и в нужные руки.
Имеет обязательное грамматическое выражение посредством:
сочинительных союзов;
знаков препинания (, ;)
Ср.: Красный, синий и зеленый шары.
Большой желтый медный шар. – нет показателей сочинения!

Слайд 81

Подчинительная связь –
связь, при которой одно слово ("зависимое", "слуга")
уточняет, конкретизирует смысл,

Подчинительная связь – связь, при которой одно слово ("зависимое", "слуга") уточняет, конкретизирует
выраженный другим словом ("главное", "хозяин").
Может связывать отдельные слова, либо предложения.
Обнаруживается носителем языка (человеком, понимающим текст) путем постановки уточняющего вопроса от главного слова к подчиненному.
Ср.: Белеет
что? - парус
какой? - одинокий
в чем? - в тумане
чего? - моря
каком? - голубом.
Компьютерная программа (алгоритм) обнаруживает синтаксические связи, учитывая всю совокупность грамматических показателей, – в частности, учитывая порядок слов, расстояние между словами и их грамматические формы.

Слайд 82

Подчинительные связи делятся по степени обязательности на сильные и слабые.
Связь считается сильной,

Подчинительные связи делятся по степени обязательности на сильные и слабые. Связь считается
если при отсутствии подчиненного слова носитель языка воспринимает словосочетание/предложение как незавершенное: стать специалистом; обработка информации; можно продать; продать рукопись.
Связь считается слабой, если при отсутствии подчиненного слова
носитель языка воспринимает словосочетание/предложение как завершенное: новый дом; дом отца; дом у дороги; дом построен, дом для престарелых.
Чаще всего это различие применяется к связям управления.
Градации: от абсолютной обязательности (предлоги, фазовые и модальные глаголы, переходные глаголы)
до полной необязательности (прилагательное + существительное, конструкции с предлогом для и др.)

Слайд 83

Согласование –
подчинительная связь, при которой грамматическая форма зависимого слова уподобляется грамматической

Согласование – подчинительная связь, при которой грамматическая форма зависимого слова уподобляется грамматической
форме главного слова.
Тест: при изменении формы главного слова меняется и форма подчиненного.
Характерно для флективных языков (ср. русский и английский).
Полное согласование – совпадение всех грамматических признаков, характеризующих одновременно оба слова:
утомленное солнце – род, число, падеж;
белеет парус – число;
белел парус – число, род (белела лодка);
Неполное согласование – совпадение лишь части грамматических
признаков, характеризующих оба слова:
город Москва; врач Петрова;
синий и красный шары (только число!)

Слайд 84

Управление –
подчинительная связь, при которой для выражения определенного смыслового отношения главное

Управление – подчинительная связь, при которой для выражения определенного смыслового отношения главное
слово требует постановки зависимого слова в определенную падежную форму и/или определенного предложного оформления (ср. русский и англ.)
Тест: при изменении формы главного слова форма подчиненного.
не меняется.
Утомленные солнцем VS утомленное солнце
Ср. также:
приближающийся к солнцу; удаляющийся от солнца;
обязанный солнцу; лишенный солнца; помещенный на солнце
– для выражения разных смысловых отношений, как правило, должны использоваться разные падежно-предложные формы.

Слайд 85

Список падежных форм, которые могут быть подчинены данному слову, называют его (синтаксической)

Список падежных форм, которые могут быть подчинены данному слову, называют его (синтаксической)
моделью управления.
Исчерпывающее описание модели управления можно дать только для предлогов:
К - дат. (к вам и квас)
ДЛЯ - род.
НА - вин., предл. (на улицу, на улице)
С - род., вин., твор. (с крыши, с версту, с другом )
NB: выбор предлогов и падежей трудная сторона грамматики !
Актуально для глаголов и отглагольных существительных (обычно перечисляются только сильноуправляемые позиции):
СООБЩАТЬ (кто: [им.]; кому: [дат.]; что: [вин.]/о чем:[предл.];)
ГРОЗИТЬ ( кто: [им.]; кому: [дат.]; чем: [твор.]; )
Не актуально для существительных с предметным значением (сильноуправляемые позиции отсутствуют):
КНИГА – (- жалоб, - для детей, - с иллюстрациями, - в переплете).

Слайд 86

Для знаменательных слов модель управления определяется прежде всего смыслом управляющего слова.
Поэтому

Для знаменательных слов модель управления определяется прежде всего смыслом управляющего слова. Поэтому
преобладает точка зрения, что для них модель управления – явление скорее семантического уровня.

Слайд 87

Примыкание –
подчинительная связь, при которой зависимое слово обычно
не изменяемо и

Примыкание – подчинительная связь, при которой зависимое слово обычно не изменяемо и
установление связи обусловлено лишь взаимным расположением (расстояние и порядок) и/или смыслом связываемых слов.
Присоединяемые части речи:
наречия (говорить медленно)
частицы (Он не спит)
неизменяемые глагольные формы - инфинитив, деепричастие: (любил рисовать; спал стоя)
неизменяемые прилагательные, компаративы (костюм хаки; стал умнее)

Слайд 88

Различают контактное и дистантное (падежное) примыкание.
Контактное выражается расположением слов (расположение значимо):
(а) Они

Различают контактное и дистантное (падежное) примыкание. Контактное выражается расположением слов (расположение значимо):
вместе заявили о невозможности работать.
Они заявили о невозможности работать вместе.
(б) Он быстро научился решать эти задачи.
Он научился быстро решать эти задачи.
Дистантное выражается лишь смыслом связываемых слов – может быть реализовано на большом расстоянии и при разном порядке слов:
Он приедет из Москвы с двумя сотрудниками поездом «Русская тройка» завтра вечером.

Слайд 89

1.2. Табличное представление синтаксических связей
Белеет парус одинокий в тумане моря голубом.

1.2. Табличное представление синтаксических связей Белеет парус одинокий в тумане моря голубом.

Слайд 90

1.3. Средства выражения синтаксической связи
Морфологические показатели (род, число, падеж, лицо)
Служебные слова (союзы,

1.3. Средства выражения синтаксической связи Морфологические показатели (род, число, падеж, лицо) Служебные
предлоги)
Знаки препинания (наличие и отсутствие)
Расстояние
Порядок слов
NB: Разная значимость их в разных языках!
Разные стили мышления!

Слайд 91

# 2. Межсегментные связи
2.1. Виды сегментов и способы установления синтаксических связей между

# 2. Межсегментные связи 2.1. Виды сегментов и способы установления синтаксических связей
ними
Сегмент – любой компонент предложения, для которого правила пунктуации предусматривают фиксацию их границ при помощи знаков препинания. [Т. Ю. Кобзарева]
2.1.1. Виды сегментов:
Простые предложения в составе сложных
связь сочинения;
связь подчинения;
Обособленные обороты (неполные предложения)
причастные;
деепричастные;
вводные обороты;
Обособленные члены предложения
Т е м а 2. Синтаксическая структура предложения

Слайд 92

2.1.2. Синтаксические связи между сегментами
1a) Простые предложения в составе сложносочиненного:
Сочинительной связью соединяются

2.1.2. Синтаксические связи между сегментами 1a) Простые предложения в составе сложносочиненного: Сочинительной
главные слова (сказуемые) простых предложений
Каждое последующее предложение подчиняется предыдущему

Слайд 93

Пример:
Не продается вдохновенье, но можно рукопись продать.

Назад

Пример: Не продается вдохновенье, но можно рукопись продать. Назад

Слайд 94

1b) Простые предложения в составе сложноподчиненного.
1b-1) Подчинительный союз (союзное слово) является членом

1b) Простые предложения в составе сложноподчиненного. 1b-1) Подчинительный союз (союзное слово) является
придаточного предложения:

А это синица, которая часто ворует пшеницу…

Устанавливаемые синтаксические связи.
Союзное слово подчиняется одному из слов в придаточном (обычно сказуемому): ворует –кто?? которая
Придаточное предложение (его главное слово) подчиняется определяемому слову главного:
синица –какая?? ворует (которая)
Если союзное слово является анафором, устанавливается анафорическая связь между союзным словом и определяемым главного: которая = синица

Слайд 95

Примеры:
Кирджали представлен был паше, который присудил его быть посажену на кол.
Кто

Примеры: Кирджали представлен был паше, который присудил его быть посажену на кол.
жил и мыслил, тот не может в душе не презирать людей.
Легко на сердце от песни веселой, она скучать не дает никогда.
Пока не требует поэта к священной жертве Аполлон, в заботах суетного света он малодушно погружен.
Высокой страсти не имея для звуков жизни не щадить, не мог он ямба от хорея, как мы ни бились, отличить.

Слайд 97

1b-2) Подчинительный союз (союзное слово) НЕ является членом придаточного предложения
Все знают, что

1b-2) Подчинительный союз (союзное слово) НЕ является членом придаточного предложения Все знают,
Волга впадает в Каспийское море
Устанавливаемые синтаксические связи.
Придаточное предложение (его главное слово) подчиняется присоединяющему союзу:
что –(_?)? впадает
Подчинительный союз (представляя все придаточное) подчиняется определяемому слову в главном предложении:
знают –что?? что (Волга впадает…)
Сравнить:
Мы не знали, что он привез. ( случай 1b-1 )
Мы не знали, что он привез письмо. ( случай 1b-2 )

Слайд 98

Пример: Я это потому пишу, что сам давно уж не грешу.
(потому указательное

Пример: Я это потому пишу, что сам давно уж не грешу. (потому
местоимение, сигнал о продолжении…)

Слайд 99

2a) Причастные обороты (связь типа согласования):
Дверь, ведущая на второй этаж, оказалась заперта.
Устанавливаемые

2a) Причастные обороты (связь типа согласования): Дверь, ведущая на второй этаж, оказалась
синтаксические связи.
Все слова причастного оборота прямо или косвенно подчинены причастию: ведущая –на что?? этаж
Причастие подчиняется связью МС_С определяемому слову главного: Дверь –какая?? ведущая
2b) Деепричастные обороты (связь типа примыкания):
Служив отлично-благородно, долгами жил его отец.
Устанавливаемые синтаксические связи.
Все слова деепричастного оборота прямо или косвенно подчинены деепричастию.
Деепричастие подчиняется связью МС_П сказуемому главного предложения: жил –как?? служив

Слайд 100

2c) Вводные обороты и вставные конструкции (связь типа примыкания):
По всем приметам, будет

2c) Вводные обороты и вставные конструкции (связь типа примыкания): По всем приметам,
жаркое лето.
Устанавливаемые синтаксические связи.
Вводный оборот подчиняется (формально) сказуемому главного
предложения.
3) Обособленные члены предложения:
А он, мятежный, ищет бури…
Устанавливаемые синтаксические связи.
Подчинение не отличается от подчинения не обособленных.

Слайд 101

# 3. Анафорические связи
1) Анафор – служебное слово, не имеющее самостоятельного значения

# 3. Анафорические связи 1) Анафор – служебное слово, не имеющее самостоятельного
и отсылающее к полнозначному слову или выражению. (Значение ‘отсылка к предыдущему имени’ входит в смысл анафорического элемента.)
Анафоры: личные (он, они, …) и указательные (это, этот,…) местоимения; союзные слова (который, поэтому, так, …).
2) Антецедент – полнозначное (знаменательное) слово или целое предложение, замещаемые анафором.
Отношение замещения: анафор можно заменить антецедентом без изменения смысла текста.

Отношение между языковыми выражениями, состоящее в том, что в смысл одного выражения входит отсылка к другому. (ЛЭС)

Слайд 102

А) Вербальная анафора – замещается отдельное слово
(существительное).
синица, которая…
Грамматически – связь типа (неполного)

А) Вербальная анафора – замещается отдельное слово (существительное). синица, которая… Грамматически –
согласования – в роде и числе.
Представление: направленной связью с пометой Анаф.
Б) Сентенциальная анафора – замещается целое предложение.
Волга впадает в Каспийское море. Это известно каждому.
…когда же черт возьмет тебя. Так думал молодой повеса…
Согласование отсутствует, связь явно не фиксируется.

Катафорическая связь:
Ясно одно: я должен уехать.

Слайд 103

# 4. Синтаксическая омонимия

Виды синтаксической омонимии:
Реальная – формальная
Локальная - глобальная
Омонимия адреса -

# 4. Синтаксическая омонимия Виды синтаксической омонимии: Реальная – формальная Локальная -
содержания
Омонимия разных видов связи:
Омонимия подчинительных и сочинительных
связей
Омонимия анафорических связей
Омонимия межсегментных связей

Явление, состоящее в том, что синтаксические связи в предложении могут быть установлены или грамматически описаны несколькими альтернативными способами.
Влечет за собой, как правило, и смысловую неоднозначность.

Слайд 104

Л.Н. Иорданская:
"Под синтаксически омонимией (неоднозначностью) фразы понимается возможность приписать фразе более чем

Л.Н. Иорданская: "Под синтаксически омонимией (неоднозначностью) фразы понимается возможность приписать фразе более
одну правильную синтаксическую структуру. Естественно, эта возможность зависит от того, как определена правильная синтаксическая структура и, в частности, от того, как проведена граница между синтаксической и семантическогй характеристиками фразы."

Человек стрелял из ружья vs Человек стрелял из окна

Лесник присматривает за не особенно аккуратными туристами.
"выделяющая" интерпретация;
"квалифицирующая" интерпретация.

Слайд 105

Реальная – формальная омонимия

Он из туманной привез плоды.

Германии


учености

Реальная:

Реальная – формальная омонимия Он из туманной привез плоды. Германии учености Реальная:
Наблюдения над языком маленьких детей.

Слайд 106


Формальная: Обнаруживается, если устанавливать синтаксические связи без учета смысловых характеристик слов

Формальная: Обнаруживается, если устанавливать синтаксические связи без учета смысловых характеристик слов и
и / или контекста целого предложения

Возьмите деревянный брусок с отверстием диаметром 30 мм.
Возьмите деревянный брусок с отверстием весом 300 г.

лед.

Лифты для высотных зданий со скоростью 30 м/мин.

"Временная" омонимия – возникает и разрешается по ходу анализа:
Мальчишек радостный народ коньками звучно режет

парень в голубой рубашке с зелеными глазами
парень в голубой рубашке с зелеными рукавами

Слайд 107

Еще примеры:
Простой солдат вызвал суматоху.
Маркизу нельзя есть руками.
нельзя --(кому?)--> маркизу
есть

Еще примеры: Простой солдат вызвал суматоху. Маркизу нельзя есть руками. нельзя --(кому?)-->
–(кого? что?)--> маркизу

Слайд 108

Локальная – глобальная омонимия


Локальная: Выбор одной из альтернативных связей для

Локальная – глобальная омонимия Локальная: Выбор одной из альтернативных связей для данного
данного слова не влияет на установление связей между другими словами предложения

Слайд 109


Глобальная: Выбор одной из альтернативных связей для одного слова влечет изменение

Глобальная: Выбор одной из альтернативных связей для одного слова влечет изменение связей
связей между другими словами предложения
(1) Автобус догнал трамвай

(2) Он видел их семью своими глазами
а) Он видел б) Он видел
кого? семью кого? их
чью? их чем? своими глазами
чем? своими глазами сколькими? семью

Простой солдат вызвал суматоху.
а) вызвал б) вызвал
кто? солдат что? простой
какой? простой кого? солдат
что? суматоху что? суматоху

Слайд 110

Омонимия адреса - омонимия формы


Омонимия адреса: Альтернативные связи по разному
определяют

Омонимия адреса - омонимия формы Омонимия адреса: Альтернативные связи по разному определяют
хозяина для данного слова
Black power struggle
Fred saw the plane flying over Zurich
Fred saw the mountains flying over Zurich
Я опять хочу [поехать] в Париж.

Слайд 111


Омонимия формы: Альтернатива состоит в разном определении вида связи для данной

Омонимия формы: Альтернатива состоит в разном определении вида связи для данной пары
пары «слуга – хозяин»
Перевод Тютчева.
Платформа, нагруженная рабочими.
Борец с пережитками.
Выступление адвоката Иванова
адвокат [чей?] – Иванова (управление)
адвокат [имеет фамилию?] – Иванов (согласование)
Благодаря этому инженеру удалось избежать брака.
Казню и милую.
(Примеры Л.Н. Иорданской)

Слайд 112

Омонимия разных видов связи:


Омонимия сочинительных связей:
Вошли два человека в шляпах и

Омонимия разных видов связи: Омонимия сочинительных связей: Вошли два человека в шляпах
пальто.
Вошли два человека в шляпах и мальчик.
Омонимия анафорических связей:
Девочка уронила карандаш на пол и сломала его.
Взрослые огорчены тем, что дети читают не то, что им
хочется.
…Магомеда Халилова…
Танки генерала Шаманова расстреляли семерых членов его семьи, а еще соседку и ее двоих детей.

Слайд 113


Омонимия межсегментных связей:
Кто-то застрелил служанку актрисы, которая стояла на балконе.
Необходим контроль

Омонимия межсегментных связей: Кто-то застрелил служанку актрисы, которая стояла на балконе. Необходим
за крупными расходами граждан,
которые толкают сегодня вверх стоимость жилья.
Более сложный пример (3 варианта сочинения):
Он постоянно видел отца, красящего забор соседа, старый
дом и сарай.

отец – сосед – дом – сарай;

отец – дом – сарай;

забор – дом – сарай.

Слайд 114

Омонимия семантической интерпретации синтаксической связи:
Таблица стандартных размеров:
'Таблица имеет (характеристика) стандартный размер'
'Таблица

Омонимия семантической интерпретации синтаксической связи: Таблица стандартных размеров: 'Таблица имеет (характеристика) стандартный
содержит сведения о стандартных размерах'

книга сестры:
' книга, принадлежит сестре'
' книга написана сестрой'

Слайд 115

# 4. Формализация синтаксической структуры предложения

4.1. Синтаксическая структура как математический объект
Математические объекты:
Граф

# 4. Формализация синтаксической структуры предложения 4.1. Синтаксическая структура как математический объект
– множество элементов, между некоторыми из которых установлены связи.
Ориентированный граф – если связи имеют направление.
Ориентированное дерево – если связи образуют иерархию подчинения.
Синтаксический граф =
Дерево синтаксических зависисимостей.

Слайд 116

Дерево синтаксических зависисимостей:

Белеет

в

голубом

парус

одинокий

тумане

моря

Дерево синтаксических зависисимостей: Белеет в голубом парус одинокий тумане моря

Слайд 117

Математические понятия:
Множество: { A, B, C, D, E, F,…}
Упорядоченная пара элементов (стрелка,

Математические понятия: Множество: { A, B, C, D, E, F,…} Упорядоченная пара
соединяющая пару элементов): ( A, B )

Ориентированный граф – универсальный способ представления:
{ (A, B), (C, D), (E, F),…}

Представление дерева синтаксических зависимостей как множества упорядоченных пар:
{ (белеет, парус), (парус, одинокий), (белеет, в), (в, тумане),
( тумане, моря), ( тумане, голубом) }

Слайд 118

Другие способы представления дерева синтаксических зависимостей.
а) Сокращенная скобочная запись:
После каждого главного слова

Другие способы представления дерева синтаксических зависимостей. а) Сокращенная скобочная запись: После каждого
перечисляются в скобках все непосредственно ему подчиненные.

Белеет (парус, в)

Белеет (парус (одинокий), в (тумане) )

Белеет (парус (одинокий), в (тумане (моря, голубом) ) )

Слайд 119

б) Матрица инцидентности (матрица связей):

Таблица связей

б) Матрица инцидентности (матрица связей): Таблица связей

Слайд 120

4.2. Представление синтаксических связей в виде таблиц. Дополнительные замечания.
Сводный список синтаксических помет

4.2. Представление синтаксических связей в виде таблиц. Дополнительные замечания. Сводный список синтаксических
(для русского языка):
С - согласование
У - управление
УС - управление с согласованием
П - примыкание
Соч - сочинение
МССоч – межсегментное сочинение
МС_П – межсегментное подчинение
Анаф - анафорическая связь

Слайд 121

2) Локальная омонимия и анафора.

2) Локальная омонимия и анафора.

Слайд 122

3) Омонимия содержания и глобальная омонимия.

3) Омонимия содержания и глобальная омонимия.

Слайд 123

3) Представление сочинительных связей.

3) Представление сочинительных связей.

Слайд 124

Он из Германии туманной привез учености плоды.

4.2. Условие проективности для синтаксических структур
а)

Он из Германии туманной привез учености плоды. 4.2. Условие проективности для синтаксических
Стрелки связей в синтаксическом графе не должны пересекаться.
б) Дополнительное условие: стрелки не должны накрывать главное слово предложения.
Пример непроективного предложения:

Слайд 125

Общая схема:
а) Основное условие:

D1 A C B D2
б) Дополнительное условие:

B1

Общая схема: а) Основное условие: D1 A C B D2 б) Дополнительное условие: B1 A B2
A B2

Слайд 126

Примеры непроективных конструкций:
(1) Я памятник себе воздвиг нерукотворный.

И перья страуса склоненные в

Примеры непроективных конструкций: (1) Я памятник себе воздвиг нерукотворный. И перья страуса
моем качаются мозгу.
И каждый вечер в час назначенный
(Иль это только снится мне?)
Девичий стан, шелками схваченный,
В туманном движется окне.

Слайд 127

Непроективность межсегментных связей:
(4а) Событие обещает быть впечатляющим,
к которому городские власти провели

Непроективность межсегментных связей: (4а) Событие обещает быть впечатляющим, к которому городские власти
большую предварительную подготовку.

Событие обещает быть …, к которому … провели …

Имя файла: Лингвистические-основы-информатикиЧасть-1.pptx
Количество просмотров: 277
Количество скачиваний: 0