Слайд 2Цели
Разработка фреймворка для создания обученных моделей, способных на дообучение под игрока (саморазвитие
![Цели Разработка фреймворка для создания обученных моделей, способных на дообучение под игрока](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/872447/slide-1.jpg)
в процессе игровой сессии)
Слайд 3Задачи
Изучить варианты применения ml в игровой сфере (ml-agents)
Изучить доступные библиотеки для работы
![Задачи Изучить варианты применения ml в игровой сфере (ml-agents) Изучить доступные библиотеки](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/872447/slide-2.jpg)
с ML
Рассмотреть математическую постановку задачи обучения с подкреплением и сравнить различные методы обучения
Апробирование обучения с подкреплением (практически) (возможно дообучение, остановка обучения) и тестирование на тестовой среде (игровой)
Разработка фреймворка на языке C# (в идеале, на основе готовых библиотек)
Слайд 4Образ результата
Фреймворк, который позволит внедрять агентов с саморазвитием в проекты на .NET
![Образ результата Фреймворк, который позволит внедрять агентов с саморазвитием в проекты на](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/872447/slide-3.jpg)
без необходимости разбираться в других языках (Python) и особенностях процесса обучения.
Слайд 5Научная новизна
Идея заключается в том, чтобы обучаемые объекты (агенты) могли продолжать свое
![Научная новизна Идея заключается в том, чтобы обучаемые объекты (агенты) могли продолжать](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/872447/slide-4.jpg)
развитие после внедрения их в реальные среды, где они должны функционировать
В рамках игр, мы можем создавать обученных агентов с базовым функционалом (напр. бегать, стрелять и пр.), которые будут дообучаться (развиваться) с процессе игровой сессии с конкретным игроком (по сути, в реальном времени)
Слайд 6Прогресс
Изучили основы RL по книге «Конспект по обучению с подкреплением» Сергея Иванова
Изучили
![Прогресс Изучили основы RL по книге «Конспект по обучению с подкреплением» Сергея](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/872447/slide-5.jpg)
основные отличия обучения с подкреплением (reinforcement learning) от классического машинного обучения.
Подготовили обзор существующих подходов к обучению с подкреплением.
Изучили принцип работы модуля Unity ML-Agents.
Изучили доступные библиотеки для работы с ML на языке C#.