Слайд 3Вероятностные автоматы
Моделирование сложных систем, имеющих стохастическую природу
Построение мобильных агентов
Слайд 4Обучение автомата
Действие
Проверка «слабого условия»
Перераспределение вероятностей
Слайд 5Применение
стимулирующего обучения
Работать непосредственно с вероятностной моделью непрактично
Генерация автоматной модели
Слайд 6Q-learning:
статические задачи
Обучение Q-функции
Порождение оптимальной стратегии
Слайд 7Q-learning:
стохастические системы
Обучение Q-функции
Подсчёт вероятностей переходов
Сжатие вероятностной модели
Слайд 8Пример задачи на двумерном поле
Клетка поля определяет текущее состояние мобильного робота
Четыре доступных
действия
Выделенные клетки
Задача – максимизировать общую прибыль для нескольких мобильных роботов