Содержание
- 2. План лекции Задачи Sequence to Sequence Архитектура энкодер-декодер Механизм внимания Tips & Tricks Разбор примера Machine
- 3. RNN Recap
- 4. RNN Recap len(input) != len(output)
- 5. Задачи Sequence to Sequence Распознавание речи (spectrum -> text) Синтез речи (text -> waveform) Рукописный ввод
- 6. Speech recognition
- 7. Speech Synthesis
- 8. Рукописный ввод
- 9. Задача перевода Rosetta Stone ---> Параллельный корпус, найден в 1799 г. Позволил расшифровать египетские иероглифы
- 11. Чатботы
- 12. RNN Sequence-to-sequence model Google, Sutskever et al. 2014 Encoder Decoder https://arxiv.org/pdf/1409.3215.pdf
- 13. RNN Sequence-to-sequence model Cho et al. 2014 Encoder (same) Decoder https://www.aclweb.org/anthology/D14-1179
- 14. RNN Sequence-to-sequence model Улучшения: Deep Encoder Deep Decoder LSTM Layer 1 LSTM Layer 2 LSTM Layer
- 15. RNN Sequence-to-sequence model Улучшения: Bidirectional Encoder Forward LSTM Backward LSTM
- 16. RNN Sequence-to-sequence model Проблемы: Размер стейта фиксирован Изменения из начала последовательности затираются Не все входные токены
- 17. RNN Sequence-to-sequence model Решение: Внимание
- 18. Механизм внимания, мотивация Xu et al. 2015 Show, Attend and Tell: Neural Image Caption Generation with
- 20. Soft vs Hard Attention Hard Выбор одной/n областей Получаем сэмплингом из softmax Не дифференцируем Нужно учить
- 21. Механизм внимания, мотивация В случае машинного перевода
- 22. Механизм внимания, alignment
- 23. Механизм внимания, мотивация https://github.com/google/seq2seq
- 24. Механизм внимания https://arxiv.org/pdf/1409.0473.pdf
- 25. Механизм внимания Bahdanau et al. 2014 https://arxiv.org/pdf/1409.0473.pdf
- 26. Механизм внимания Bahdanau et al. 2014 Карта внимания или alignment слов https://arxiv.org/pdf/1409.0473.pdf
- 27. Механизм внимания Bahdanau et al. 2014 https://arxiv.org/pdf/1409.0473.pdf
- 28. Attention function Dot Product General Additive
- 29. Практические нюансы Wordpiece models and character-based models Pretrained embeddings Multihead Attention Teacher Forcing Beam Search
- 30. Проблемы словаря большой размер эмбеддингов и софтмакс слоя (сотни тысяч) неизвестные слова при инференсе, приходится заменять
- 31. Pretrained embeddings
- 32. Wordpiece models, BPE - byte-pair encoding
- 33. Multihead Attention
- 34. Teacher Forcing Подаем на вход декодера не прошлый выход, а верный символ из таргета
- 35. Beam Search
- 36. Beyond attention Attention позволяет построить текущее состояние с учетом всего прошлого последовательности. Одинаково хорошо учитывает данные
- 37. Transformer Attention is all you need, Vaswani et al. 2017 https://arxiv.org/abs/1706.03762 Self-attention instead of recurrence
- 38. Positional encoding Sinusoidal encoding 2. Learned positional embeddings. Position index -> embedding layer -> vector
- 40. Скачать презентацию





































Презентация на тему Работа с текстовой информацией в EXCEL
Информационные технологии
Лекция 29. CorelDRAW Инструменты группы. Изменение формы
Исполнитель Калькулятор
Создание 3d модели на основе операций твердотельного моделирования
Системное программное обеспечение
Популярные компьютерные игры
Разработка автоматизированной информационной системы учета материальных и иных активов в ЦЦОД IT-Куб г. Княгинино
Концепция Virtual logistics
Человек и информация
Буккроссинг - новое увлечение современных людей
Основы алгоритмизации инженерных задач
Проектирование пользовательского интерфейса графической оболочки сайта учебного учреждения АНПОО РОСТ
Интернет-мошенничество
Электронные издания в сети Интернет. Виды по целевому назначению
Технические средства телекоммуникаций
Техническое задание на проектирование персонажа
Информация и информационные процессы. Тест
Программное обеспечение для обслуживания жестких дисков компьютера
Презентация А.Пуоджюс
Джедаисты. Цели
Информатика и информационно-коммуникационные технологии
Введение в базовый синтаксис
Структуры данных
Инфографика
Продвижение информационной составляющей официального сайта
Компьютер, его системы и процессы
Автоматизированные информационные технологии