Моделирование поведения взаимодействующих агентов в среде с ограничениями Юданов А.А., студент 525 гр. Научный руководитель: к.ф.-м.н.

Содержание

Слайд 2

Задача моделирования

Цель моделирования – классификация режимов работы моделируемой системы

(x1, x2,……….)

(x1, x2,……….)

(x1, x2,……….)

Поведение

Задача моделирования Цель моделирования – классификация режимов работы моделируемой системы (x1, x2,……….)
людей
(Perceptrak)
Видео (IPS)
Распознавание речи
(ViaVoice IBM)

система

компоненты

Сложная система – система, состоящая из компонент, взаимодействием которых нельзя пренебречь

Моделирование - приближение процессов работы системы более простыми процессами.

Слайд 3

Внешними данными можно пренебречь
Взаимодействием агентов нельзя пренебречь
Работа системы полностью состоит во взаимодействии

Внешними данными можно пренебречь Взаимодействием агентов нельзя пренебречь Работа системы полностью состоит
агентов
Внутренняя жизнь агентов имеет тот же приоритет, что и их взаимодействие

Моделируемый класс игр

Агентами являются игроки
Агенты существуют в виртуальной среде
Среда обеспечивает взаимодействие агентов
Все функционирование агентов заключается в их взаимодействием друг с другом.

агент-игрок

среда

Слайд 4

Постановка задачи

Изучить подходы к моделированию сложных динамических систем.
Проанализировать структуру игр из моделируемого

Постановка задачи Изучить подходы к моделированию сложных динамических систем. Проанализировать структуру игр
класса, выделить характерные особенности.
Разработать модель класса игр, учитывающую особенности структуры игр.
Реализовать программные средства для
а) автоматического построение модели конкретной игры
б) использования модели для анализа конкретной игры.

Слайд 5

Подходы

Нейронные сети
+ Восстанавливают сложные разделительные поверхности
Тяжело обучаемы
Шаблоны
+ Простой процесс добавления/изъятия
Охватывает очень частную закономерность
Конечные

Подходы Нейронные сети + Восстанавливают сложные разделительные поверхности Тяжело обучаемы Шаблоны +
автоматы
+ Более общие, чем шаблоны
Охватывают частные закономерности
Скрытые Марковские модели (СММ)
+ Хорошая модель времени
Структурные ограничения зависимостей переменных

Слайд 6

Описание модели

Каждому агенту соответствует своя СММ
Состояние агента двухуровневое
скрытое
наблюдаемое
Наблюдаемое состояние зависит только от

Описание модели Каждому агенту соответствует своя СММ Состояние агента двухуровневое скрытое наблюдаемое
скрытого
Вероятность смены скрытого состояния каждого агента зависит от предыдущих скрытых состояний всех агентов
Параметры модели
структурные (количество игроков)
свободные (вероятность изменения тактики)

Слайд 7

Структура модели

1) Возьмем СММ для каждого агента

• Наборы состояний скрытых и наблюдаемых

Структура модели 1) Возьмем СММ для каждого агента • Наборы состояний скрытых
– дискретны
• Вероятности переходов для скрытых состояний каждого агента записываются в виде k+1 мерной матрицы A
• Вероятности наблюдаемых состояний записываются в 2-х мерной матрице B

2) Добавим вероятностные зависимости для последовательности скрытых состояний
Получаем систему СММ (ССММ)

А

B

tin

bin

Для двух агентов:

Слайд 8

Обучение модели: по обучающим выборкам и структурным параметрам модели найти свободные параметры

Обучение модели: по обучающим выборкам и структурным параметрам модели найти свободные параметры
модели
Анализ хода игры: по заданным всем параметрам модели и выборке найти наиболее вероятную последовательность значений скрытых переменных (разметка выборки)

Основные задачи для модели

Слайд 9

Схема программной системы

Среда

переводчик

агент

агент

агент

агент

Пред-
обработка

Система
моделирования

Системо-зависимая часть

общая часть

ССММ

Значения
скрытых переменных

Наиболее вероятные
наблюдения

Язык С, система

Схема программной системы Среда переводчик агент агент агент агент Пред- обработка Система
matlab

Слайд 10

Эксперименты

Тестовая игра:
- 2 игрока
- 20 возможных событий
- 6581 пар элементов выборки
- 2

Эксперименты Тестовая игра: - 2 игрока - 20 возможных событий - 6581
значения скрытых переменных

Верхние графики – изменения поведения двух агентов.
Синий и розовый графики – изменения скрытых состояний агентов.
Голубой график – ручная экспертная разметка сигнала.
Нижний красный – разметка с помощью СММ

Код события

шаг

Quake 3

Слайд 11

Эксперименты

Код события

шаг

Мера точности:
Нормированная на длину последовательности сумма совпадающих разметок по всем временным

Эксперименты Код события шаг Мера точности: Нормированная на длину последовательности сумма совпадающих
шагам
Точность:
ССММ 78-87%
независимые СММ 75%

атака

атака

поиск

Ошибки

Слайд 12

Основные результаты

Разработана статистическая модель одного класса многопользовательских игр
Предложены и обоснованы алгоритмы и

Основные результаты Разработана статистическая модель одного класса многопользовательских игр Предложены и обоснованы
формулы для работы с моделью
Создана программная система, реализующая модель и алгоритмы работы с моделью; cистема испытана на игре Quake 3
Апробация: результаты работы опубликованы в тезисах конференции «Ломоносов-2010»

Слайд 13

Спасибо за внимание!

All your base are belong to us !!

Спасибо за внимание! All your base are belong to us !!
Имя файла: Моделирование-поведения-взаимодействующих-агентов-в-среде-с-ограничениями-Юданов-А.А.,-студент-525-гр.-Научный-руководитель:-к.ф.-м.н..pptx
Количество просмотров: 627
Количество скачиваний: 1