Слайд 2NLP: истоки
возникло в конце 60-х гг.
развивалось в рамках дисциплины «искусственный интеллект».
![NLP: истоки возникло в конце 60-х гг. развивалось в рамках дисциплины «искусственный](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-1.jpg)
АОЕЯ — разработка методов, технологий и конкретных систем, обеспечивающих общение человека с ЭВМ на естественном или ограниченном естественном языке.
Слайд 3Проблема организации взаимодействия с компьютерными
Решение этой проблемы коммуникации шло по двум основным
![Проблема организации взаимодействия с компьютерными Решение этой проблемы коммуникации шло по двум](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-2.jpg)
путям.
1 - адаптация языков программирования и операционных систем к конечному пользователю.
2 - разработка систем взаимодействия с ЭВМ на естественном языке или каком-то его ограниченном варианте.
Слайд 4NLP и ЛИНГВИСТИКА
Фонология (звуки речи)
Морфология (структура и форма слов ЕЯ)
Синтаксис
![NLP и ЛИНГВИСТИКА Фонология (звуки речи) Морфология (структура и форма слов ЕЯ)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-3.jpg)
(структура и функции предложений)
Семантика (смысл языковых высказываний)
Прагматика (значение высказываний)
Социолингвистика Психолингвистика
Лексикография (описание лексикона ЕЯ)
Прикладная лингвистика
Слайд 5NLP: МАТЕМАТИКА и ИНФОРМАТИКА
Математическая лингвистика
Квантитативная лингвистика (изучение языка/речи количественными методами)
Теория формальных
![NLP: МАТЕМАТИКА и ИНФОРМАТИКА Математическая лингвистика Квантитативная лингвистика (изучение языка/речи количественными методами)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-4.jpg)
языков и грамматик – возникла из порождающих грамматик Н.Хомского (50-е гг.), для анализа синтаксических структур ЕЯ
Теория алгоритмов
Информатика ( Computer Science )
Слайд 6NLP и ИСКУССТВЕННЫЙ ИНТЕЛЕКТ
Междисциплинарный характер области ИИ: составная часть Computer Science ,
![NLP и ИСКУССТВЕННЫЙ ИНТЕЛЕКТ Междисциплинарный характер области ИИ: составная часть Computer Science](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-5.jpg)
пересечение (по задачам и методам) с АОТ
Задача ИИ – компьютерное моделирование интеллектуальных функций
Первая известная программа ИИ по обработке ЕЯ – Система Т. Винограда (70-е годы);
Пример диалога : Pick up a big red block. (человек) OK (машина) Is there a large block behind a pyramid? Yes, Three of them. Grasp the pyramid. I don’t understand, which pyramid you mean
Слайд 7ОСОБЕННОСТИ ЕЯ
ЕЯ – сложная система знаков, возникшая для обмена информацией в
![ОСОБЕННОСТИ ЕЯ ЕЯ – сложная система знаков, возникшая для обмена информацией в](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-6.jpg)
процессе человеческой деятельности и постоянно изменяющаяся вместе с ней
Две стороны знака: означаемое – означающее
Сложности ЕЯ
комбинаторная система яз. знаков
многоуровневость системы ЕЯ
каждый уровень (подсистема) – правила сочетания знаков
взаимосвязь уровней
Разнообразие языков и языковые универсалии
Слайд 8ОСОБЕННОСТИ ЕЯ: УРОВНИ
Фонологический: звуки ( фонемы )/ буквы – незначащие единицы
![ОСОБЕННОСТИ ЕЯ: УРОВНИ Фонологический: звуки ( фонемы )/ буквы – незначащие единицы](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-7.jpg)
, средство различения др. единиц
Морфологический – слова ( словоформы )
подуровень морфем
Синтаксический – предложения (фразы) ЕЯ
подуровень словосочетаний
надуровень сверхфразовых единств ( ≈ абзацев) – предложений, объединяющихся по смыслу
⇒ возможность построить практически бесконечное число высказываний (смыслов)
Слайд 9ДОПОЛНИТЕЛЬНЫЕ УРОВНИ ЕЯ:
Семантический : набор элементарных единиц – сем
Лексический :
![ДОПОЛНИТЕЛЬНЫЕ УРОВНИ ЕЯ: Семантический : набор элементарных единиц – сем Лексический :](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-8.jpg)
множество лексем (лексикон)
Дискурсивный (уровень связного текста): схематические структуры текстов (патентные формулы, деловые письма и т.п.)
Слайд 10⇒ невозможность единожды создать лингв. процессор
Сложность системы ЕЯ
Взаимосвязь всех уровней
![⇒ невозможность единожды создать лингв. процессор Сложность системы ЕЯ Взаимосвязь всех уровней](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-9.jpg)
Нестандартная сочетаемость (синтактика) единиц ЕЯ на всех уровнях
Большая системность (число уровней)
Асиметрия связи единиц и выражаемых ими смыслов: полисемия, синонимия, омонимия
Слайд 11Сложность ЕЯ ⇒МОДУЛЬНОСТЬ ЛИНГВ. ПРОЦЕСОРОВ
Графематический анализ
Морфологический анализ
Постморфологический анализ: разрешение
![Сложность ЕЯ ⇒МОДУЛЬНОСТЬ ЛИНГВ. ПРОЦЕСОРОВ Графематический анализ Морфологический анализ Постморфологический анализ: разрешение](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-10.jpg)
морфологической омонимии
Предсинтаксис: сегментация текста на предложения
Синтаксический анализ предложений
Семантический и прагматический анализ
Слайд 12Архитектура систем NLP
блок анализа речевого сообщения пользователя,
блок интерпретации сообщения,
блок порождения
![Архитектура систем NLP блок анализа речевого сообщения пользователя, блок интерпретации сообщения, блок](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-11.jpg)
смысла ответа,
блок синтеза поверхностной структуры высказывания,
диалоговый компонент
Слайд 13Блок анализа
морфологический анализ словоформ
синтаксический и семантический анализ предложений.
![Блок анализа морфологический анализ словоформ синтаксический и семантический анализ предложений.](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-12.jpg)
Слайд 14Блок порождения смысла
определение информации, которую следует передать пользователю,
предполагаемое членение информации на
![Блок порождения смысла определение информации, которую следует передать пользователю, предполагаемое членение информации](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-13.jpg)
«порции», соответствующие предложению;
определение последовательности «порций» смысла;
построение семантического представления отдельных предложений
Слайд 15Блок синтеза поверхностной структуры высказывания
упаковка семантического представления высказывания в синтаксические структуры предложения.
![Блок синтеза поверхностной структуры высказывания упаковка семантического представления высказывания в синтаксические структуры](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-14.jpg)
Здесь играют существенную роль категории коммуникативной организации смысла высказывания — тема, рема, данное, новое
Слайд 17Современные речевые технологии
Распознавание речи
Синтез речи по тексту
Выделение ключевых слов в слитной
![Современные речевые технологии Распознавание речи Синтез речи по тексту Выделение ключевых слов в слитной речи](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-16.jpg)
речи
Слайд 18ПРИКЛАДНЫЕ ЗАДАЧИ NLP
Определение языка сообщений
Идентификация диктора
Определение эмоционального и физического состояния
![ПРИКЛАДНЫЕ ЗАДАЧИ NLP Определение языка сообщений Идентификация диктора Определение эмоционального и физического](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-17.jpg)
человека по его голосу.
Шумоочистка
Разделение дикторов
Music Spotting
Слайд 20Siri
англ. Speech Interpretation and Recognition Interface
персональный помощник и вопросно-ответная система, адаптированная для
![Siri англ. Speech Interpretation and Recognition Interface персональный помощник и вопросно-ответная система,](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/1137963/slide-19.jpg)
iPhone OS.
использует обработку естественной речи, чтобы отвечать на вопросы и давать рекомендации
приспосабливается к каждому пользователю индивидуально, изучая его предпочтения в течение долгого времени.