Содержание

Слайд 2

Биатлон для СКИФов: быстро и точно

С.М. Абрамов, А.И. Адамович, М.Р. Коваленко, В.А. Роганов Институт программных систем Российской академии

Биатлон для СКИФов: быстро и точно С.М. Абрамов, А.И. Адамович, М.Р. Коваленко,

Слайд 3

Программa “СКИФ”

разработка и освоение в серийном производстве
семейства высокопроизводительных вычислительных установок (суперкомпьютеров)
и прикладных

Программa “СКИФ” разработка и освоение в серийном производстве семейства высокопроизводительных вычислительных установок
систем на их основе

Слайд 4

Особенности Программы “СКИФ”

учет тенденции к расширению области применения высокопроизводительных вычислений
семейство моделей с широким

Особенности Программы “СКИФ” учет тенденции к расширению области применения высокопроизводительных вычислений семейство
спектром производительности
усилия по увеличению показателя отношения производительности к стоимости

Слайд 5

Заказчики-координаторы Программы “СКИФ”

Национальная Академия наук Республики Беларусь
Министерство промышленности, науки и технологий

Заказчики-координаторы Программы “СКИФ” Национальная Академия наук Республики Беларусь Министерство промышленности, науки и технологий Российской Федерации
Российской Федерации

Слайд 6

Участники Программы “СКИФ”

НИО “Кибернетика”, УП “НИИ ЭВМ”, УП “Белмикросистемы”, ИТМО НАН Беларуси

Участники Программы “СКИФ” НИО “Кибернетика”, УП “НИИ ЭВМ”, УП “Белмикросистемы”, ИТМО НАН
и другие...
ИПС РАН, МГУ, НИЦЭВТ, ИВВиИС, предприятие “Суперкомпьютерные системы” и другие...

Слайд 7

Двухуровневая архитектура


Двухуровневая архитектура

Слайд 8

Первые образцы семейства “СКИФ”


Первые образцы семейства “СКИФ”

Слайд 9

Характеристики первых образцов (декабрь 2000 г.)


Характеристики первых образцов (декабрь 2000 г.)

Слайд 10

Поиск альтернативы

Цель: испытать в качестве вычислительных узлов для установок “СКИФ” системные платы

Поиск альтернативы Цель: испытать в качестве вычислительных узлов для установок “СКИФ” системные
с процессорами AMD AthlonMP
Средства:
Тест на производительность: Linpack
Тест на работу с памятью: STREAM
Тесты производительности (bandwidth и latency) реализации MPI на SCI-сети: all2all, send-receive, ping-ping и ping-pong

Слайд 11

Объекты испытаний

два типа процессоров:
AMD Athlon MP 1800+;
AMD Athlon MP 2000+;
три типа системных

Объекты испытаний два типа процессоров: AMD Athlon MP 1800+; AMD Athlon MP
плат:
ASUS A7M266-D;
TYAN Thunder K7X;
TYAN Tiger MPX;
адаптеры SCI:
Dolphin SCI PCI-64/66 / D330.

Слайд 12

Результаты теста Linpack (KFlops)

Результаты теста Linpack (KFlops)

Слайд 13

Эффективность процессоров (Linpack Flops/Hz)

Эффективность процессоров (Linpack Flops/Hz)

Слайд 14

STREAM: эффективность обменов процессор-память

Сравнение:
Intel Pentium-III 600 MHz, Supermicro SUPER 370DLE
AMD Athlon MP

STREAM: эффективность обменов процессор-память Сравнение: Intel Pentium-III 600 MHz, Supermicro SUPER 370DLE
1800+, ASUS A7M266-D.
Тесты:
“copy”, “scale”, “add”, “triad”
Режимы:
“mono” и “dual”

Слайд 15

Результаты теста STREAM (MB/s)

Результаты теста STREAM (MB/s)

Слайд 16

Эффективность обменов с памятью в SMP-режиме: отношение (dual/mono)

Эффективность обменов с памятью в SMP-режиме: отношение (dual/mono)

Слайд 17

STREAM: выбор оптимальной AMD-платформы

STREAM: выбор оптимальной AMD-платформы

Слайд 18

Эффективность MPI-обменов по SCI-сети

Рекорды AMD платформ:
Bandwidth (max):
ping-ping — 276 MB/s;
ping-pong — 234 MB/s
send-receive — 258 MB/s
Latency

Эффективность MPI-обменов по SCI-сети Рекорды AMD платформ: Bandwidth (max): ping-ping — 276
(packet size 0...32)
ping-ping — 3.6...4.6 µs;
ping-pong — 3.5...4.6 µs;
send-receive — 2.5...3.3 µs.

Слайд 19

Tест ping-pong: latency (µs)

Tест ping-pong: latency (µs)

Слайд 20

Tест ping-pong: bandwidth (MB/s)

Tест ping-pong: bandwidth (MB/s)

Слайд 21

Ping-pong/bandwidth: выбор оптимальной AMD-платформы

Ping-pong/bandwidth: выбор оптимальной AMD-платформы

Слайд 22

Выводы

AMD AthlonMP — привлекательное решение для кластерных систем:
высокие технические характеристики;
отличное отношение стоимости

Выводы AMD AthlonMP — привлекательное решение для кластерных систем: высокие технические характеристики;
к производительности.
AMD Athlon MP 1800+ с системной платой ASUS A7M266-D — лучшая конфигурация на базе AMD процессоров из 6 рассмотренных нами вариантов (по совокупности всех тестов)

Слайд 23

Благодарности

Авторы благодарны
Представительству AMD в Москве
фирме “Традиция”
ОАО “НИЦЭВТ”
которые предоставили авторам все

Благодарности Авторы благодарны Представительству AMD в Москве фирме “Традиция” ОАО “НИЦЭВТ” которые
аппаратные средства, необходимые для рассмотренных экспериментов.
Имя файла: ?.pptx
Количество просмотров: 82
Количество скачиваний: 0