Содержание
- 2. Что такое распознавание речи? Распознавание речи – это многоуровневая задача распознавания образов, в которой акустические сигналы
- 3. Структура стандартной системы распознавания речи
- 4. Необработанная речь Обычно, поток звуковых данных, записанный с высокой дискретизацией (20 КГц при записи с микрофона
- 5. Анализ сигнала Поступающий сигнал должен быть изначально трансформирован и сжат, для облегчения последующей обработки. Есть различные
- 6. Речевые кадры Результатом анализа сигнала является последовательность речевых кадров. Обычно, каждый речевой кадр – это результат
- 7. Речевые кадры
- 8. Акустические модели Для анализа состава речевых кадров требуется набор акустических моделей. Рассмотрим две наиболее распространенные из
- 9. Шаблонная модель В качестве акустической модели выступает каким-либо образом сохраненный пример распознаваемой структурной единицы (слова, команды).
- 10. Модель состояний Каждое слово моделируется как последовательность состояний указывающих набор звуков, которые возможно услышать в данном
- 11. Акустический анализ Состоит в сопоставлении различных акустических моделей к каждому кадру речи и выдает матрицу сопоставления
- 12. Корректировка времени Используется для обработки временной вариативности, возникающей при произношении слов (например, “растягивание” или “съедание” звуков).
- 13. Последовательность слов В результате работы, система распознавания речи выдает последовательность (или несколько возможных последовательностей) слов, которая,
- 15. Скачать презентацию