Слайд 3Вероятностные автоматы
Моделирование сложных систем, имеющих стохастическую природу
Построение мобильных агентов

Слайд 4Обучение автомата
Действие
Проверка «слабого условия»
Перераспределение вероятностей

Слайд 5Применение
стимулирующего обучения
Работать непосредственно с вероятностной моделью непрактично
Генерация автоматной модели

Слайд 6Q-learning:
статические задачи
Обучение Q-функции
Порождение оптимальной стратегии

Слайд 7Q-learning:
стохастические системы
Обучение Q-функции
Подсчёт вероятностей переходов
Сжатие вероятностной модели

Слайд 8Пример задачи на двумерном поле
Клетка поля определяет текущее состояние мобильного робота
Четыре доступных

действия
Выделенные клетки
Задача – максимизировать общую прибыль для нескольких мобильных роботов