Слайд 2Биатлон для СКИФов:
быстро и точно
С.М. Абрамов,
А.И. Адамович,
М.Р. Коваленко,
В.А. Роганов
Институт программных систем
Российской академии

Слайд 3Программa “СКИФ”
разработка и освоение в серийном производстве
семейства высокопроизводительных вычислительных установок (суперкомпьютеров)
и прикладных

систем на их основе
Слайд 4Особенности
Программы “СКИФ”
учет тенденции к расширению области применения высокопроизводительных вычислений
семейство моделей с широким

спектром производительности
усилия по увеличению показателя
отношения производительности к стоимости
Слайд 5Заказчики-координаторы
Программы “СКИФ”
Национальная Академия наук Республики Беларусь
Министерство промышленности, науки и технологий

Российской Федерации
Слайд 6Участники Программы “СКИФ”
НИО “Кибернетика”, УП “НИИ ЭВМ”,
УП “Белмикросистемы”, ИТМО НАН Беларуси

и другие...
ИПС РАН, МГУ, НИЦЭВТ, ИВВиИС, предприятие “Суперкомпьютерные системы” и другие...
Слайд 8Первые образцы семейства “СКИФ”

Слайд 9Характеристики первых образцов (декабрь 2000 г.)

Слайд 10Поиск альтернативы
Цель: испытать в качестве вычислительных узлов для установок “СКИФ” системные платы

с процессорами AMD AthlonMP
Средства:
Тест на производительность: Linpack
Тест на работу с памятью: STREAM
Тесты производительности (bandwidth и latency) реализации MPI на SCI-сети: all2all, send-receive, ping-ping и ping-pong
Слайд 11Объекты испытаний
два типа процессоров:
AMD Athlon MP 1800+;
AMD Athlon MP 2000+;
три типа системных

плат:
ASUS A7M266-D;
TYAN Thunder K7X;
TYAN Tiger MPX;
адаптеры SCI:
Dolphin SCI PCI-64/66 / D330.
Слайд 12Результаты теста Linpack (KFlops)

Слайд 13Эффективность процессоров
(Linpack Flops/Hz)

Слайд 14STREAM: эффективность обменов процессор-память
Сравнение:
Intel Pentium-III 600 MHz, Supermicro SUPER 370DLE
AMD Athlon MP

1800+, ASUS A7M266-D.
Тесты:
“copy”, “scale”, “add”, “triad”
Режимы:
“mono” и “dual”
Слайд 16Эффективность обменов
с памятью в SMP-режиме:
отношение (dual/mono)

Слайд 17STREAM: выбор
оптимальной AMD-платформы

Слайд 18Эффективность MPI-обменов
по SCI-сети
Рекорды AMD платформ:
Bandwidth (max):
ping-ping — 276 MB/s;
ping-pong — 234 MB/s
send-receive — 258 MB/s
Latency

(packet size 0...32)
ping-ping — 3.6...4.6 µs;
ping-pong — 3.5...4.6 µs;
send-receive — 2.5...3.3 µs.
Слайд 20Tест ping-pong: bandwidth (MB/s)

Слайд 21Ping-pong/bandwidth: выбор
оптимальной AMD-платформы

Слайд 22Выводы
AMD AthlonMP — привлекательное решение для кластерных систем:
высокие технические характеристики;
отличное отношение стоимости

к производительности.
AMD Athlon MP 1800+ с системной платой ASUS A7M266-D — лучшая конфигурация на базе AMD процессоров из 6 рассмотренных нами вариантов (по совокупности всех тестов)
Слайд 23Благодарности
Авторы благодарны
Представительству AMD в Москве
фирме “Традиция”
ОАО “НИЦЭВТ”
которые предоставили авторам все

аппаратные средства, необходимые для рассмотренных экспериментов.