Слайд 3В чем интерес
Исторический контекст
Подходы к решению задач
Внутри AlphaGo
Слайд 6Способ решения задач
Грубая сила — перебор
Умная сила — тайные знания
вручную (алгоритмы)
автомагически
машинное
обучение
нейронные сети
Слайд 9Свёрточная глубокая нейронная сеть
Слайд 13Внутри DeepBlue (1997)
200,000,000 позиций в секунду
Материал, позиция, сохранность Короля, темп
11.38 GFLOPS
Специализированное железо
Слайд 15Внутри Alpha Go
Features
46 bits for slow
≈140,000 patterns for fast
Value networks to evaluate
board positions
Policy networks to select moves
Fast value network for rollout
Monte-Carlo tree search
“machine learning techniques” for time management
Слайд 19Компьютеры vs Человеки: Go
AlphaGo
1920 CPUs, 280 GPUs
1 MW
≈4 недели, 160,000 записей игр,
3,000,000 позиций
Lee Sedol
1 мозг (+ команда)
100 W
25+ лет карьеры
Слайд 20Тест Тьюринга, будущее
If no one told me, maybe I would think the
player was a little strange, but a very strong player, a real person.
Планы по обучению сети «с нуля»