Слайд 3В чем интерес
Исторический контекст
Подходы к решению задач
Внутри AlphaGo

Слайд 6Способ решения задач
Грубая сила — перебор
Умная сила — тайные знания
вручную (алгоритмы)
автомагически
машинное

обучение
нейронные сети
Слайд 9Свёрточная глубокая нейронная сеть

Слайд 13Внутри DeepBlue (1997)
200,000,000 позиций в секунду
Материал, позиция, сохранность Короля, темп
11.38 GFLOPS
Специализированное железо

Слайд 15Внутри Alpha Go
Features
46 bits for slow
≈140,000 patterns for fast
Value networks to evaluate

board positions
Policy networks to select moves
Fast value network for rollout
Monte-Carlo tree search
“machine learning techniques” for time management
Слайд 19Компьютеры vs Человеки: Go
AlphaGo
1920 CPUs, 280 GPUs
1 MW
≈4 недели, 160,000 записей игр,

3,000,000 позиций
Lee Sedol
1 мозг (+ команда)
100 W
25+ лет карьеры
Слайд 20Тест Тьюринга, будущее
If no one told me, maybe I would think the

player was a little strange, but a very strong player, a real person.
Планы по обучению сети «с нуля»