Содержание
- 2. ТЕМАТИЧЕСКИЙ ПЛАН Введение. Лингвистические модели в современных информационных технологиях. Раздел 1. Лингвистические модели и методы формализации
- 3. Л И Т Е Р А Т У Р А (к части 1) Основная: 1. Лингвистический
- 4. Введение. Лингвистические модели в современных информационных технологиях. Автоматический перевод – исторически первая "лингвистическая" технология. Лингвистические модели
- 5. # 1. Автоматический перевод – исторически первая лингвистическая" технология. 1.1. Этапы развития 1.2. Основные проблемы 1.3.
- 6. 1.1. Этапы развития Начало: 1946: А. Бут & У. Уивер – формулировка задачи – перевод как
- 7. 1.2. Основные проблемы АП Недостаточная полнота и точность описания языка в традиционной лингвистике Основная причина –
- 8. Лексическая многозначность Он открыл дверь своим ключом (1) Дай мне ключ 12 на 18 (2) Он
- 9. Невозможность пословного перевода: He is reading. One has to wash his face every morning. Неоднозначность значения
- 10. Трудности перевода предлогов: Самолет прибывает в 12:10. Я не работаю в среду. В июле очень жарко.
- 11. Трудности перевода предлогов: Самолет прибывает в 12:10. Я не работаю в среду. В июле очень жарко.
- 12. Шутки специалистов: Дух силен, да плоть слаба. … Водка крепкая, а мясо протухло. The spirit is
- 13. 1.3. Методы и процедуры АП 1) Основные методы: Словарная поддержка; методы быстрого поиска в словаре; (проблема
- 14. 2) Процедуры АП: От письменного текста к словоформам Определение возможных грамматических характеристик словоформы Грамматический разбор –
- 15. # 2. Документальные ИПС Лингвистические проблемы: Отождествление разных грамматических форм слова: формат – формата - *формам
- 16. Пример - для п.п. 2) и 3): Деятельность английских разведчиков в немецких колониях во время 1-ой
- 17. # 3. Орфографические и грамматические корректоры Орфографический контроль: словарь основ + моделирование словоизменения Отсутствие орфографических замечаний
- 18. Возможности грамматического корректора: пока ограничены! формальные проверки (лексические повторы, скобки…) проверка согласования (именные группы, подлежащее -
- 19. # 4. Распознавание письменного текста и устной речи OCR (Optical Character recognition) – от графического файла
- 20. SR (Speech Recognition), TTS (Text To Speech) - распознавание устной речи) Применение: голосовой ввод текста; "контакт
- 21. Пример коммерческого применения: "Контакт-центры": службы продажи билетов; справочные службы; службы технической поддержки Исходный пункт – IVR-технологии
- 22. Функциональность и характеристики: Разработчик TTS - Nuance (ScanSoft); интегратор в технологии контакт-центров "под ключ" – Avaya
- 23. Лингвистическое содержание технологий распознавания: Этап распознавания отдельных элементов (буквы в OCR, звуки или целые слова в
- 24. # 5. Системы понимания (смыслового анализа и синтеза) текста. Что значит «понимать текст»? - уметь отвечать
- 25. Современная инженерная постановка задачи: Informftion Extraction Глобальные задачи: Автоматизированная справочная система с речевым интерфейсом («Служба 09»;
- 26. Справочная служба - основные процедуры: Получить вопрос, убедиться, что он понятен системе (взаимодействие с подсистемами 2,
- 27. Т е м а 3. Автоматизация словарных работ и статистический анализ текста. Типы словарей Частотные словари,
- 28. #1. Типы словарей 1.1. По типу лексических единиц Лингвистические словари: объект описания – слово (орфографические, толковые,
- 29. 1.3. По адресату Человекоориентированные - общего назначения; - для определенных социальных групп Машиноориентированные = словарь, ориентированный
- 30. 1.4. По широте охвата лексики Общеязыковые Специализированные (словари имен, блатной лексики, словарь туриста, словарь Пушкина, словарь
- 31. 1.7. По типу описываемых языковых явлений Орфографические (правописание) Фонетические (произношение и ударение) Грамматические (словоизменение и грамматические
- 32. Словари сочетаемости - словари глагольного управления, - словари лексических функций (определяют способы нестандартного выражения заданного смысла
- 33. # 2. Частотные словари, их создание и использование. 2.1. Основные направления использования Изучение особенностей разных языковых
- 34. 2.2. Технология создания частотного словаря средствами стандартных офисных технологий Преобразование текста в словник Нормализация словоформ (метод
- 35. Преобразование текста в словник Удаление ненужных символов - использование режима Подстановочные знаки - поиск и замена
- 37. Нормализация словоформ (метод сверток) Алгоритм построения свертки: в свертку включаются три первые буквы слова; в свертку
- 38. Оценка точности грамматической нормализации методом сверток Всего просмотрено слов (существительных и прилагательных) – M Из них
- 39. Анализ влияния грамматической нормализации на частотное ранжирование лексики:
- 41. Разделение лексики на предметную и общеязыковую Выделение понятий, выраженных двух- и трехсловными словосочетаниями.
- 43. Т е м а 1. Язык как система. Уровни описания языка. Функциональное описание языка (функциональные стили)
- 44. Функциональное описание языка (функциональные стили) 1.1. Деловая речь (функция деловой коммуникации) 1.2. Поэтическая речь (функция построения
- 45. # 1. Функциональное описание языка Погруженность языка в культуру. (Почему вдруг появилась масса англицизмов?) Что есть
- 46. Основные компоненты культуры: понятия и знания, упорядочивающие социальный опыт (когнитивная и технологическая подсистема); идеалы, ценности (подсистема
- 47. Проявления культуры в языке: Откуда взялись выражения: Много воды утекло. Ваше время истекло. Бить склянки. Клепсидра
- 48. В зависимости от того, где и для какой цели используется язык, Меняются лексика, формы языковых выражений
- 49. Важность правильной оценки коммуникативного намерения говорящего / пишущего: На школьном уроке. Учитель: В каком году родился
- 50. 1.1. Деловая речь (функция деловой коммуникации) А.П. Ершов: «Феномен деловой прозы» (1978 г.): “деловая проза –это
- 51. Примеры деловой прозы УК РФ, ст. 219: “1. Нарушение правил пожарной безопасности, совершенное лицом, на котором
- 52. СНИП «Жилые здания»: 2.9. Жилые комнаты общежитий следует проектировать из расчета заселения не более трех человек
- 53. Научно-технический текст: Увеличение напряжения текучести может быть объяснено за счет вакансий, которые имеют заметную подвижность при
- 54. Деловая проза – это профессиональные подъязыки - со своей лексикой, своими характерными оборотами речи и грамматическими
- 55. 1.2. Поэтическая речь (функция построения художественного образа) Поэтическая речь = художественное слово «в чистом виде» Основные
- 56. Смысловая неполнота как принцип – говорится всегда больше, чем сказано; обращение не только к культурно-энциклопедическому контексту,
- 57. Логическая непоследовательность – вплоть до абсурдности буквального смысла и прямого логического противоречия. Речка движется и не
- 58. Поэзия не ставит целью информировать, описывать положение дел – даже если кажется, что о чем-то сообщает:
- 59. О чем твои стихи? Не знаю брат. Ты их прочти, коли придет охота. Стихи живые сами
- 60. Но надо жить без самозванства, Так жить, чтобы в конце концов Привлечь к себе любовь пространства,
- 61. В чем назначение поэзии (и искусства вообще)? А. Блок: “Цель поэзии – внести гармонию в мир.”
- 62. # 2. Внутрисистемное описание языка 2.1. Язык как текст и как порождающая система. 2.2. Уровни описания
- 63. 2.1. Язык как текст и как порождающая система Что такое «язык»? Два возможных ответа: Текст VS
- 64. Язык как система правил, описывающих способ порождения текста: список элементов (слов) и их классификация – с
- 65. 2.2. Уровни описания языка 2.2.1. Фонетический уровень Фонетика – раздел языкознания, изучающий звуковые единицы языка, их
- 66. Два звука считаются разными в данном языке, если замена одного другим может вызвать изменение смысла. Примеры:
- 67. Отношения (синтагматика) - линейное следование фонем в слове. Возможность разных звукосочетаний и их характерность в языке:
- 68. Задачи моделирования: Распознавание устной речи и письменного текста (SR и OCR); Звуковая дешифровка древних языков
- 69. 2.2.2. Морфологический уровень Морфология – раздел языкознания, изучающий словообразование и словоизменение, а также способы выражения грамматических
- 70. Классификация морфем - по месту в слове и функции: корень (основное предметное значение слова); основные словообразовательные
- 71. Семантика морфем А) Словоизменительные Основная смысловыражающая функция – указывают на существование смысловой связи между словами. Предметная
- 72. Б) Словообразовательные Можно выделить типовые значения: уменьшительные и увеличительные: ларчик, хлебец, книжечка, медвежонок, котище,… принадлежность лица
- 73. Отношения: (синтагматика) - линейное следование морфем в слове (сочетаемость морфем). Для окончаний – описание сочетаемости с
- 74. Однако сочетаемость, например, основы и суффикса нормировать много труднее: ротор – роторНый, НО шар – шарОВой;
- 75. Задачи моделирования: Отличить словоформу от случайного набора букв/звуков (обнаружение ошибок правописания, OCR- и SR-технологии). Отождествление (по
- 76. Определение по основе и окончанию грамматических характеристик словоформы для автоматического грамматического разбора предложения (АП, грамматические корректоры
- 77. Т е м а 2. Синтаксическая структура предложения и способы ее формализации. Синтаксис простого предложения Межсегментные
- 78. # 1. Синтаксис простого предложения Синтаксическая связь – смысловая связь между словами, выраженная грамматическими средствами. Синтаксис
- 79. 1.1. Виды синтаксической связи. Синтаксические связи: Сочинительные - Соч Подчинительные: согласование - С полное неполное управление
- 80. Сочинительная связь – связь между словами, имеющими одну и ту же грамматическую и/или смысловую функцию в
- 81. Подчинительная связь – связь, при которой одно слово ("зависимое", "слуга") уточняет, конкретизирует смысл, выраженный другим словом
- 82. Подчинительные связи делятся по степени обязательности на сильные и слабые. Связь считается сильной, если при отсутствии
- 83. Согласование – подчинительная связь, при которой грамматическая форма зависимого слова уподобляется грамматической форме главного слова. Тест:
- 84. Управление – подчинительная связь, при которой для выражения определенного смыслового отношения главное слово требует постановки зависимого
- 85. Список падежных форм, которые могут быть подчинены данному слову, называют его (синтаксической) моделью управления. Исчерпывающее описание
- 86. Для знаменательных слов модель управления определяется прежде всего смыслом управляющего слова. Поэтому преобладает точка зрения, что
- 87. Примыкание – подчинительная связь, при которой зависимое слово обычно не изменяемо и установление связи обусловлено лишь
- 88. Различают контактное и дистантное (падежное) примыкание. Контактное выражается расположением слов (расположение значимо): (а) Они вместе заявили
- 89. 1.2. Табличное представление синтаксических связей Белеет парус одинокий в тумане моря голубом.
- 90. 1.3. Средства выражения синтаксической связи Морфологические показатели (род, число, падеж, лицо) Служебные слова (союзы, предлоги) Знаки
- 91. # 2. Межсегментные связи 2.1. Виды сегментов и способы установления синтаксических связей между ними Сегмент –
- 92. 2.1.2. Синтаксические связи между сегментами 1a) Простые предложения в составе сложносочиненного: Сочинительной связью соединяются главные слова
- 93. Пример: Не продается вдохновенье, но можно рукопись продать. Назад
- 94. 1b) Простые предложения в составе сложноподчиненного. 1b-1) Подчинительный союз (союзное слово) является членом придаточного предложения: А
- 95. Примеры: Кирджали представлен был паше, который присудил его быть посажену на кол. Кто жил и мыслил,
- 97. 1b-2) Подчинительный союз (союзное слово) НЕ является членом придаточного предложения Все знают, что Волга впадает в
- 98. Пример: Я это потому пишу, что сам давно уж не грешу. (потому указательное местоимение, сигнал о
- 99. 2a) Причастные обороты (связь типа согласования): Дверь, ведущая на второй этаж, оказалась заперта. Устанавливаемые синтаксические связи.
- 100. 2c) Вводные обороты и вставные конструкции (связь типа примыкания): По всем приметам, будет жаркое лето. Устанавливаемые
- 101. # 3. Анафорические связи 1) Анафор – служебное слово, не имеющее самостоятельного значения и отсылающее к
- 102. А) Вербальная анафора – замещается отдельное слово (существительное). синица, которая… Грамматически – связь типа (неполного) согласования
- 103. # 4. Синтаксическая омонимия Виды синтаксической омонимии: Реальная – формальная Локальная - глобальная Омонимия адреса -
- 104. Л.Н. Иорданская: "Под синтаксически омонимией (неоднозначностью) фразы понимается возможность приписать фразе более чем одну правильную синтаксическую
- 105. Реальная – формальная омонимия Он из туманной привез плоды. Германии учености Реальная: Наблюдения над языком маленьких
- 106. Формальная: Обнаруживается, если устанавливать синтаксические связи без учета смысловых характеристик слов и / или контекста целого
- 107. Еще примеры: Простой солдат вызвал суматоху. Маркизу нельзя есть руками. нельзя --(кому?)--> маркизу есть –(кого? что?)-->
- 108. Локальная – глобальная омонимия Локальная: Выбор одной из альтернативных связей для данного слова не влияет на
- 109. Глобальная: Выбор одной из альтернативных связей для одного слова влечет изменение связей между другими словами предложения
- 110. Омонимия адреса - омонимия формы Омонимия адреса: Альтернативные связи по разному определяют хозяина для данного слова
- 111. Омонимия формы: Альтернатива состоит в разном определении вида связи для данной пары «слуга – хозяин» Перевод
- 112. Омонимия разных видов связи: Омонимия сочинительных связей: Вошли два человека в шляпах и пальто. Вошли два
- 113. Омонимия межсегментных связей: Кто-то застрелил служанку актрисы, которая стояла на балконе. Необходим контроль за крупными расходами
- 114. Омонимия семантической интерпретации синтаксической связи: Таблица стандартных размеров: 'Таблица имеет (характеристика) стандартный размер' 'Таблица содержит сведения
- 115. # 4. Формализация синтаксической структуры предложения 4.1. Синтаксическая структура как математический объект Математические объекты: Граф –
- 116. Дерево синтаксических зависисимостей: Белеет в голубом парус одинокий тумане моря
- 117. Математические понятия: Множество: { A, B, C, D, E, F,…} Упорядоченная пара элементов (стрелка, соединяющая пару
- 118. Другие способы представления дерева синтаксических зависимостей. а) Сокращенная скобочная запись: После каждого главного слова перечисляются в
- 119. б) Матрица инцидентности (матрица связей): Таблица связей
- 120. 4.2. Представление синтаксических связей в виде таблиц. Дополнительные замечания. Сводный список синтаксических помет (для русского языка):
- 121. 2) Локальная омонимия и анафора.
- 122. 3) Омонимия содержания и глобальная омонимия.
- 123. 3) Представление сочинительных связей.
- 124. Он из Германии туманной привез учености плоды. 4.2. Условие проективности для синтаксических структур а) Стрелки связей
- 125. Общая схема: а) Основное условие: D1 A C B D2 б) Дополнительное условие: B1 A B2
- 126. Примеры непроективных конструкций: (1) Я памятник себе воздвиг нерукотворный. И перья страуса склоненные в моем качаются
- 127. Непроективность межсегментных связей: (4а) Событие обещает быть впечатляющим, к которому городские власти провели большую предварительную подготовку.
- 129. Скачать презентацию