Слайд 2Цели
Разработка фреймворка для создания обученных моделей, способных на дообучение под игрока (саморазвитие

в процессе игровой сессии)
Слайд 3Задачи
Изучить варианты применения ml в игровой сфере (ml-agents)
Изучить доступные библиотеки для работы

с ML
Рассмотреть математическую постановку задачи обучения с подкреплением и сравнить различные методы обучения
Апробирование обучения с подкреплением (практически) (возможно дообучение, остановка обучения) и тестирование на тестовой среде (игровой)
Разработка фреймворка на языке C# (в идеале, на основе готовых библиотек)
Слайд 4Образ результата
Фреймворк, который позволит внедрять агентов с саморазвитием в проекты на .NET

без необходимости разбираться в других языках (Python) и особенностях процесса обучения.
Слайд 5Научная новизна
Идея заключается в том, чтобы обучаемые объекты (агенты) могли продолжать свое

развитие после внедрения их в реальные среды, где они должны функционировать
В рамках игр, мы можем создавать обученных агентов с базовым функционалом (напр. бегать, стрелять и пр.), которые будут дообучаться (развиваться) с процессе игровой сессии с конкретным игроком (по сути, в реальном времени)
Слайд 6Прогресс
Изучили основы RL по книге «Конспект по обучению с подкреплением» Сергея Иванова
Изучили

основные отличия обучения с подкреплением (reinforcement learning) от классического машинного обучения.
Подготовили обзор существующих подходов к обучению с подкреплением.
Изучили принцип работы модуля Unity ML-Agents.
Изучили доступные библиотеки для работы с ML на языке C#.