ДИНАМИЧЕСКАЯ СЕГМЕНТАЦИЯ ПРОСТРАНСТВА ПРИЗНАКОВ ДЛЯ СИСТЕМ АВТОНОМНОГО АДАПТИВНОГО УПРАВЛЕНИЯ И СИСТЕМ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕ
Содержание
- 2. Структура и функции «нервной системы» Автономного Адаптивного управления (ААУ)
- 3. Соотношение методов ААУ и обучения с подкреплением Образы - условия Эмоциональная оценка результата действия ААУ Reinforcement
- 4. Аппроксимация vs. Дискретизация Набор входных параметров: p1 … pn Множество состояний {si} Набор доступных действий a1
- 5. Проблема дискретизации пространства признаков - При малом числе состояний низкая точность, при большом – долгое обучение.
- 6. Предлагаемое решение последовательная сегментация пространства признаков в процессе обучения систем В результате образуется дерево вложенных состояний
- 7. Основные подзадачи Производить ли разделение очередного состояния на более мелкие и когда? Dev(Est(sold, ab0) >= min(
- 8. Свойства разработанного метода Итоговое разбиение пространства признаков на состояния неравномерно и отвечает специфике конкретной задачи. Определенное
- 9. Экспериментальное исследование Экспериментальное исследование разработанного метода проводилось на компьютерной и на физической модели наноспутника с адаптивной
- 10. Результаты экспериментального исследования Пример графика изменения качества управления при обучении с фиксированным набором состояний… И с
- 12. Скачать презентацию