NAS Parallel benchmark

Содержание

Слайд 2

NBP – это…

NAS Parellel Benchmark(NBP) – набор тестов производительности нацеленных на проверку возможностей

NBP – это… NAS Parellel Benchmark(NBP) – набор тестов производительности нацеленных на проверку возможностей высокопараллельных суперкомпьютеров.
высокопараллельных суперкомпьютеров.

Слайд 3

Немного истории

Сравнительно молодой бенчмарк
Разрабатывался в центре NASA
Является «paper and pencil» тестом
Также имеет

Немного истории Сравнительно молодой бенчмарк Разрабатывался в центре NASA Является «paper and
готовая реализация
Реализация использует технологии OpenMP/MPI
Актуальная версия 3.3

Слайд 4

Состав NBP

Ядра
Embarrassing Parallel (EP)
MultiGrid (MG)
Integer Sort (IS)
Conjugate Gradient (CG)
Fast Fourier Transform (FT)
Псевдо-приложения
Block Tridiagonal (BT)
Scalar Pentadiagonal (SP)
Lower-Upper

Состав NBP Ядра Embarrassing Parallel (EP) MultiGrid (MG) Integer Sort (IS) Conjugate
разложение (LU)

Слайд 5

Решаемые задачи разделены на 6 классов

Решаемые задачи разделены на 6 классов

Слайд 6

Тест EP

Embarrassingly Parallel — Чрезвычайно параллельный
Генерация независимых нормально распределенных случайных величин
Основывается на

Тест EP Embarrassingly Parallel — Чрезвычайно параллельный Генерация независимых нормально распределенных случайных
методе Марсальи-Брея
Оценивает максимальную производительность кластера при операциях с плавающей точкой
Минимальные межпроцессорные взаимодействия

Слайд 7

Тест EP - результаты

Intel Core i5 4Gb

Тест EP - результаты Intel Core i5 4Gb

Слайд 8

Тест IS

Integer Sort – сортировка малых целых чисел
Основан на блочной сортировке
Играет сильное

Тест IS Integer Sort – сортировка малых целых чисел Основан на блочной
значение начальное распределение в памяти
Оценивает работу с общей памятью

Слайд 9

Тест FT

Решение 3-хмерного уравнения в частных производных при помощи БПФ
Используется прямое и обратное БПФ
Включает

Тест FT Решение 3-хмерного уравнения в частных производных при помощи БПФ Используется
большое количество действий, оказывающих большую нагрузку на сеть
Оценивает скорость перемещения массивов данных

Слайд 10

Тест FT - результаты

Intel Core i5 4Gb

Тест FT - результаты Intel Core i5 4Gb

Слайд 11

Тест CG

Решение неупорядоченной, разряженной СЛАУ методом сопряженных градиентов
Метод сопряженных градиентов используется для

Тест CG Решение неупорядоченной, разряженной СЛАУ методом сопряженных градиентов Метод сопряженных градиентов
нахождения приближенного значения наименьшего собственного числа матрицы
Тест применяется для оценки скорости передачи данных при отсутствии какой-либо регулярности

Слайд 12

Тест CG - результаты

Intel Core i5 4Gb

Тест CG - результаты Intel Core i5 4Gb

Слайд 13

Тест MG

Приближенное решение уравнения Пуассона
Размер сетки N определяется классом теста
Оценивает скорость передачи,

Тест MG Приближенное решение уравнения Пуассона Размер сетки N определяется классом теста
как длинных, так и коротких данных

Слайд 14

Тест MG - результаты

Intel Core i5 4Gb

Тест MG - результаты Intel Core i5 4Gb

Слайд 15

Псевдо-приложения

Решение системы нелинейных дифференциальных уравнений в частных производных
Lower-Upper symmetric Gauss-Seidel (LU)
Block Triagonal

Псевдо-приложения Решение системы нелинейных дифференциальных уравнений в частных производных Lower-Upper symmetric Gauss-Seidel
(BT)
Scalar Pentadiagonal (SP)

Слайд 16

Тест BT

Решение серии независимых систем уравнений (блочные трехдиагональные матрицы 5х5 с преобладанием

Тест BT Решение серии независимых систем уравнений (блочные трехдиагональные матрицы 5х5 с
недиагональных элементов)
Эффективность с точки зрения общего потребления простых арифметических операций
Работает с плотными матрицами
Есть подтип данного теста с большой интенсивностью ввода-вывода

Слайд 17

Тест BT - результаты

Intel Core i5 4Gb

Тест BT - результаты Intel Core i5 4Gb

Слайд 18

Тест SP

Решение нескольких независимых систем скалярных уравнений (пентадиагональные матрицы с преобладанием недиагональных

Тест SP Решение нескольких независимых систем скалярных уравнений (пентадиагональные матрицы с преобладанием
членов)
Работает с плотными матрицами
Мильтираcпределение данных для полного параллелизма
Метод хорошо распараллеливается и обеспечивает оптимальную загрузку сети

Слайд 19

Тест SP - результаты

Intel Core i5 4Gb

Тест SP - результаты Intel Core i5 4Gb

Слайд 20

Тест LU

Решает систему уравнений с равномерной разряженной блочной структурой методом симметричной последовательной

Тест LU Решает систему уравнений с равномерной разряженной блочной структурой методом симметричной
верхней сверхрелаксации
Используются трехмерные уравнения Навье-Стокса
Тест критичен ко времени передачи очень маленьких объемов данных между узлами

Слайд 21

Тест LU - результаты

Intel Core i5 4Gb

Тест LU - результаты Intel Core i5 4Gb

Слайд 22

Заключение

Проведенные тесты показали, что кластер полностью использует свой потенциал
Время выполнения тестов

Заключение Проведенные тесты показали, что кластер полностью использует свой потенциал Время выполнения
масштабируется как и ожидается, неожиданных скачков или падений времени выполнения тестов в какой-то определенной области не наблюдается
Это говорит о том что кластер хорошо настроен и вычисления хорошо распределены

Слайд 23

Список литературы

Курс на Intuit.ru:
http://www.intuit.ru/department/supercomputing/tbucs/4/3.html
Статья на Wikipedia:
http://ru.wikipedia.org/wiki/NAS_Parallel_Benchmarks
Официальный сайт NASA:
http://www.nas.nasa.gov/publications/npb.html

Список литературы Курс на Intuit.ru: http://www.intuit.ru/department/supercomputing/tbucs/4/3.html Статья на Wikipedia: http://ru.wikipedia.org/wiki/NAS_Parallel_Benchmarks Официальный сайт NASA: http://www.nas.nasa.gov/publications/npb.html
Имя файла: NAS-Parallel-benchmark.pptx
Количество просмотров: 129
Количество скачиваний: 0