Слайд 2NBP – это…
NAS Parellel Benchmark(NBP) – набор тестов производительности нацеленных на проверку возможностей
высокопараллельных суперкомпьютеров.
Слайд 3Немного истории
Сравнительно молодой бенчмарк
Разрабатывался в центре NASA
Является «paper and pencil» тестом
Также имеет
готовая реализация
Реализация использует технологии OpenMP/MPI
Актуальная версия 3.3
Слайд 4Состав NBP
Ядра
Embarrassing Parallel (EP)
MultiGrid (MG)
Integer Sort (IS)
Conjugate Gradient (CG)
Fast Fourier Transform (FT)
Псевдо-приложения
Block Tridiagonal (BT)
Scalar Pentadiagonal (SP)
Lower-Upper
разложение (LU)
Слайд 5Решаемые задачи разделены на 6 классов
Слайд 6Тест EP
Embarrassingly Parallel — Чрезвычайно параллельный
Генерация независимых нормально распределенных случайных величин
Основывается на
методе Марсальи-Брея
Оценивает максимальную производительность кластера при операциях с плавающей точкой
Минимальные межпроцессорные взаимодействия
Слайд 7Тест EP - результаты
Intel Core i5 4Gb
Слайд 8Тест IS
Integer Sort – сортировка малых целых чисел
Основан на блочной сортировке
Играет сильное
значение начальное распределение в памяти
Оценивает работу с общей памятью
Слайд 9Тест FT
Решение 3-хмерного уравнения в частных производных при помощи БПФ
Используется прямое и обратное БПФ
Включает
большое количество действий, оказывающих большую нагрузку на сеть
Оценивает скорость перемещения массивов данных
Слайд 10Тест FT - результаты
Intel Core i5 4Gb
Слайд 11Тест CG
Решение неупорядоченной, разряженной СЛАУ методом сопряженных градиентов
Метод сопряженных градиентов используется для
нахождения приближенного значения наименьшего собственного числа матрицы
Тест применяется для оценки скорости передачи данных при отсутствии какой-либо регулярности
Слайд 12Тест CG - результаты
Intel Core i5 4Gb
Слайд 13Тест MG
Приближенное решение уравнения Пуассона
Размер сетки N определяется классом теста
Оценивает скорость передачи,
как длинных, так и коротких данных
Слайд 14Тест MG - результаты
Intel Core i5 4Gb
Слайд 15Псевдо-приложения
Решение системы нелинейных дифференциальных уравнений в частных производных
Lower-Upper symmetric Gauss-Seidel (LU)
Block Triagonal
(BT)
Scalar Pentadiagonal (SP)
Слайд 16Тест BT
Решение серии независимых систем уравнений (блочные трехдиагональные матрицы 5х5 с преобладанием
недиагональных элементов)
Эффективность с точки зрения общего потребления простых арифметических операций
Работает с плотными матрицами
Есть подтип данного теста с большой интенсивностью ввода-вывода
Слайд 17Тест BT - результаты
Intel Core i5 4Gb
Слайд 18Тест SP
Решение нескольких независимых систем скалярных уравнений (пентадиагональные матрицы с преобладанием недиагональных
членов)
Работает с плотными матрицами
Мильтираcпределение данных для полного параллелизма
Метод хорошо распараллеливается и обеспечивает оптимальную загрузку сети
Слайд 19Тест SP - результаты
Intel Core i5 4Gb
Слайд 20Тест LU
Решает систему уравнений с равномерной разряженной блочной структурой методом симметричной последовательной
верхней сверхрелаксации
Используются трехмерные уравнения Навье-Стокса
Тест критичен ко времени передачи очень маленьких объемов данных между узлами
Слайд 21Тест LU - результаты
Intel Core i5 4Gb
Слайд 22Заключение
Проведенные тесты показали, что кластер полностью использует свой потенциал
Время выполнения тестов
масштабируется как и ожидается, неожиданных скачков или падений времени выполнения тестов в какой-то определенной области не наблюдается
Это говорит о том что кластер хорошо настроен и вычисления хорошо распределены
Слайд 23Список литературы
Курс на Intuit.ru:
http://www.intuit.ru/department/supercomputing/tbucs/4/3.html
Статья на Wikipedia:
http://ru.wikipedia.org/wiki/NAS_Parallel_Benchmarks
Официальный сайт NASA:
http://www.nas.nasa.gov/publications/npb.html