Введение

Февраль 20, 2021

Главная
Разное
Введение

Содержание

2. Москва, 2008 г. Параллельное программирование с OpenMP: Введение © Бахтин В.А. из 32 Содержание Тенденции развития
3. В течение нескольких десятилетий развитие ЭВМ сопровождалось удвоением их быстродействия каждые 1.5-2 года. Это обеспечивалось и
4. Время Тенденции развития современных процессоров В П В П В П В П В П В
5. Тенденции развития современных процессоров Суперкомпьютер СКИФ МГУ «Чебышев» Пиковая производительность - 60 TFlop/s Число процессоров/ядер в
6. Тенденции развития современных процессоров Quad-Core AMD Opteron 4 ядра встроенный контроллер памяти (2 канала памяти DDR2
7. Тенденции развития современных процессоров Intel Core i7 (архитектура Nehalem ) 4 ядра 8 потоков с технологией
8. Тенденции развития современных процессоров SUN UltraSPARC T2 Processor (Niagara 2) 8 ядер 64 потоков 4 контроллера
9. из 32 Тенденции развития современных процессоров Темпы уменьшения латентности памяти гораздо ниже темпов ускорения процессоров +
10. Существующие подходы для создания параллельных программ Автоматическое распараллеливание Библиотеки нитей Win32 API POSIX Библиотеки передачи сообщений
11. Вычисление числа π Москва, 2008 г. Параллельное программирование с OpenMP: Введение © Бахтин В.А. из 32
12. из 32 #include int main () { int n =100000, i; double pi, h, sum, x;
13. Автоматическое распараллеливание Polaris, CAPO, WPP, SUIF, VAST/Parallel, OSCAR, Intel/OpenMP, ParaWise, ОРС, САПФОР icc -parallel pi.c pi.c(8):
14. из 32 #include "mpi.h" #include int main (int argc, char *argv[]) { int n =100000, myid,
15. из 32 for (i = myid + 1; i { x = h * ((double)i -
16. из 32 #include #include #define NUM_THREADS 2 CRITICAL_SECTION hCriticalSection; double pi = 0.0; int n =100000;
17. из 32 void Pi (void *arg) { int i, start; double h, sum, x; h =
18. из 32 #include int main () { int n =100000, i; double pi, h, sum, x;
19. Достоинства использования OpenMP вместо MPI для многоядерных процессоров Возможность инкрементального распараллеливания Упрощение программирования и эффективность на
20. Достоинства использования OpenMP вместо MPI для многоядерных процессоров Процессоры Intel® Xeon® серии 5000 Процессоры Intel® Xeon®
21. Достоинства использования OpenMP вместо MPI для многоядерных процессоров #define Max(a,b) ((a)>(b)?(a):(b)) #define L 8 #define ITMAX
22. Достоинства использования OpenMP вместо MPI для многоядерных процессоров Москва, 2008 г. Параллельное программирование с OpenMP: Введение
23. История OpenMP OpenMP Fortran 1.1 OpenMP C/C++ 1.0 OpenMP Fortran 2.0 OpenMP C/C++ 2.0 1998 2000
24. OpenMP Architecture Review Board AMD Cray Fujitsu HP IBM Intel NEC The Portland Group, Inc. SGI
25. Компиляторы, поддеживающие OpenMP OpenMP 3.0: Intel 11.0: Linux, Windows and MacOS Sun Studio Express 11/08: Linux
26. Обзор основных возможностей OpenMP omp_set_lock(lck) #pragma omp parallel for private(a, b) #pragma omp critical C$OMP PARALLEL
27. из 32 Литература… http://www.openmp.org http://www.compunity.org http://www.parallel.ru/tech/tech_dev/openmp.html Москва, 2008 г. Параллельное программирование с OpenMP: Введение © Бахтин
28. из 32 Литература… Гергель В.П. Теория и практика параллельных вычислений. - М.: Интернет-Университет, БИНОМ. Лаборатория знаний,
29. из 32 Литература… Учебные курсы Интернет Университета Информационных технологий Гергель В.П. Теория и практика параллельных вычислений.
30. из 32 Вопросы? Вопросы? Москва, 2008 г. Параллельное программирование с OpenMP: Введение © Бахтин В.А.
31. из 32 OpenMP – модель параллелизма по управлению Следующая тема Москва, 2008 г. Параллельное программирование с
33. Скачать презентацию

Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин В.А.
из 32
Содержание
Тенденции

развития современных процессоров
Существующие подходы для создания параллельных программ
Основные возможности OpenMP
Литература

В течение нескольких десятилетий развитие ЭВМ сопровождалось удвоением их быстродействия каждые 1.5-2

года. Это обеспечивалось и повышением тактовой частоты и совершенствованием архитектуры (параллельное и конвейерное выполнение команд).
Узким местом стала оперативная память. Знаменитый закон Мура, так хорошо работающий для процессоров, совершенно не применим для памяти, где скорости доступа удваиваются в лучшем случае каждые 6 лет.
Совершенствовались системы кэш-памяти, увеличивался объем, усложнялись алгоритмы ее использования.
Для процессора Intel Itanium:
Latency to L1: 1-2 cycles
Latency to L2: 5 - 7 cycles
Latency to L3: 12 - 21 cycles
Latency to memory: 180 – 225 cycles
Важным параметром становится - GUPS (Giga Updates Per Second)

Тенденции развития современных процессоров

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 4

Время
Тенденции развития современных процессоров
В
П
В
П
В
П
В
П
В
П
В
П

Поток
Поток
Время
В
П
В
П
В
П
Поток 1
В
П
В
П
В
П
В
П
В
П
В
П
В
П
В
П
В
П
Поток 2
Поток 3
Поток 4
В
- вычисления
П
- доступ к памяти
Chip
MultiThreading
увеличили

производительность процессора в 2 раза

Поток или нить (по-английски “thread”) – это легковесный процесс, имеющий с другими потоками общие ресурсы, включая общую оперативную память.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 5

Тенденции развития современных процессоров
Суперкомпьютер СКИФ МГУ «Чебышев»
Пиковая производительность - 60 TFlop/s
Число

процессоров/ядер в системе - 1250 / 5000
Производительность на Linpack - 47.04 TFlop/s (78.4% от пиковой)
Номинальное энергопотребление компьютера - 330 кВт
Энергопотребление комплекса - 720 кВт
Важным параметром становится – Power Efficency (Megaflops/watt)
Как добиться максимальной производительности на Ватт => Chip MultiProcessing, многоядерность.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 6

Тенденции развития современных процессоров
Quad-Core AMD Opteron
4 ядра
встроенный контроллер памяти (2 канала

памяти DDR2 800 МГц )
3 канала «точка-точка» с использованием HyperTransort

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 7

Тенденции развития современных процессоров
Intel Core i7 (архитектура Nehalem )
4 ядра
8 потоков с

технологией Intel Hyper-Threading
8 МБ кэш-памяти Intel Smart Cache
встроенный контроллер памяти (3 канала памяти DDR3 1066 МГц )
технология Intel QuickPath Interconnect

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 8

Тенденции развития современных процессоров
SUN UltraSPARC T2 Processor (Niagara 2)
8 ядер
64 потоков
4 контроллера

памяти
потребляемая мощность – 60-123Ватт
встроенный котроллер 2x10 Gigabit Ethernet

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 9

из 32
Тенденции развития современных процессоров
Темпы уменьшения латентности памяти гораздо ниже темпов

ускорения процессоров + прогресс в технологии изготовления кристаллов => CMT (Chip MultiThreading)
Опережающий рост потребления энергии при росте тактовой частоты + прогресс в технологии изготовления кристаллов => CMP (Chip MultiProcessing, многоядерность)
И то и другое требует более глубокого распараллеливания для эффективного использования аппаратуры

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 10

Существующие подходы для создания параллельных программ
Автоматическое распараллеливание
Библиотеки нитей
Win32 API
POSIX
Библиотеки передачи сообщений
MPI
OpenMP
Москва,

2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 11

Вычисление числа π
Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 12

из 32
#include
int main ()
{
int n =100000, i;
double pi,

h, sum, x;
h = 1.0 / (double) n;
sum = 0.0;
for (i = 1; i <= n; i ++)
{
x = h * ((double)i - 0.5);
sum += (4.0 / (1.0 + x*x));
}
pi = h * sum;
printf("pi is approximately %.16f”, pi);
return 0;
}

Вычисление числа π. Последовательная программа.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 13

Автоматическое распараллеливание
Polaris, CAPO, WPP, SUIF, VAST/Parallel, OSCAR, Intel/OpenMP, ParaWise, ОРС, САПФОР
icc

-parallel pi.c
pi.c(8): (col. 5) remark: LOOP WAS AUTO-PARALLELIZED.
pi.c(8): (col. 5) remark: LOOP WAS VECTORIZED.
pi.c(8): (col. 5) remark: LOOP WAS VECTORIZED.
В общем случае, автоматическое распараллеливание затруднено:
косвенная индексация (A[B[i]]);
указатели (ассоциация по памяти);
сложный межпроцедурный анализ;
циклы с зависимостью по данным, как правило не распараллеливаются.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 14

из 32
#include "mpi.h"
#include
int main (int argc, char *argv[])
{
int n

=100000, myid, numprocs, i;
double mypi, pi, h, sum, x;
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&numprocs);
MPI_Comm_rank(MPI_COMM_WORLD,&myid);
MPI_Bcast(&n, 1, MPI_INT, 0, MPI_COMM_WORLD);
h = 1.0 / (double) n;
sum = 0.0;

Вычисление числа π с использованием MPI

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 15

из 32
for (i = myid + 1; i <= n;

i += numprocs)
{
x = h * ((double)i - 0.5);
sum += (4.0 / (1.0 + x*x));
}
mypi = h * sum;
MPI_Reduce(&mypi, &pi, 1, MPI_DOUBLE, MPI_SUM, 0, MPI_COMM_WORLD);
if (myid == 0) printf("pi is approximately %.16f”, pi);
MPI_Finalize();
return 0;
}

Вычисление числа π с использованием MPI

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 16

из 32
#include
#include
#define NUM_THREADS 2
CRITICAL_SECTION hCriticalSection;
double pi = 0.0;
int n

=100000;
void main ()
{
int i, threadArg[NUM_THREADS];
DWORD threadID;
HANDLE threadHandles[NUM_THREADS];
for(i=0; i InitializeCriticalSection(&hCriticalSection);
for (i=0; i CreateThread(0,0,(LPTHREAD_START_ROUTINE) Pi,&threadArg[i], 0, &threadID);
WaitForMultipleObjects(NUM_THREADS, threadHandles, TRUE,INFINITE);
printf("pi is approximately %.16f”, pi);
}

Вычисление числа π с использованием Win32 API

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 17

из 32
void Pi (void *arg)
{
int i, start;
double h, sum,

x;
h = 1.0 / (double) n;
sum = 0.0;
start = *(int *) arg;
for (i=start; i<= n; i=i+NUM_THREADS)
{
x = h * ((double)i - 0.5);
sum += (4.0 / (1.0 + x*x));
}
EnterCriticalSection(&hCriticalSection);
pi += h * sum;
LeaveCriticalSection(&hCriticalSection);
}

Вычисление числа π с использованием Win32 API

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 18

из 32
#include
int main ()
{
int n =100000, i;
double pi,

h, sum, x;
h = 1.0 / (double) n;
sum = 0.0;
#pragma omp parallel for reduction(+:sum) private(x)
for (i = 1; i <= n; i ++)
{
x = h * ((double)i - 0.5);
sum += (4.0 / (1.0 + x*x));
}
pi = h * sum;
printf("pi is approximately %.16f”, pi);
return 0;
}

Вычисление числа π c использованием OpenMP

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 19

Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Возможность инкрементального распараллеливания
Упрощение программирования и эффективность

на нерегулярных вычислениях, проводимых над общими данными
Ликвидация дублирования данных в памяти, свойственного MPI-программам
Объем памяти пропорционален быстродействию процессора. В последние годы увеличение производительности процессора достигается удвоением числа ядер, при этом частота каждого ядра снижается. Наблюдается тенденция к сокращению объема оперативной памяти, приходящейся на одно ядро. Присущая OpenMP экономия памяти становится очень важна.
Наличие локальных и/или разделяемых ядрами КЭШей будут учитываться при оптимизации OpenMP-программ компиляторами, что не могут делать компиляторы с последовательных языков для MPI-процессов.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 20

Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Процессоры Intel® Xeon® серии 5000
Процессоры Intel®

Xeon® серии 7000

Процессоры AMD Opteron

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 21

Достоинства использования OpenMP вместо MPI для многоядерных процессоров
#define Max(a,b) ((a)>(b)?(a):(b))
#define L 8
#define ITMAX

20
int i,j,it,k;
double eps, MAXEPS = 0.5;
double A[L][L], B[L][L];
int main(int an, char **as)
{
for (it=1; it < ITMAX; it++) {
eps= 0.;
for(i=1; j<=L-2; j++)
for(j=1; j<=L-2; j++) {eps = Max(fabs(B[i][j]-A[i][j]),eps); A[i][j] = B[i][j]; }
for(i=1; j<=L-2; j++)
for(j=1; j<=L-2; j++) B[i][j] = (A[i-1][j]+A[i+1][j]+A[i][j-1]+A[i][j+1])/4.;
printf( "it=%4i eps=%f\n", it,eps);
if (eps < MAXEPS) break;
}
}

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 22

Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Москва, 2008 г.
Параллельное программирование с OpenMP:

Введение © Бахтин В.А.

Для получения программы, способной работать на кластере, необходимо распределить данные и вычисления между процессорами.
После распределения данных требуется организовать межпроцессорные взаимодействия.
В данном случае - для доступа к удаленным данным используются “теневые” грани, которые являются источником дублирования данных.

из 32

Слайд 23

История OpenMP
OpenMP Fortran 1.1
OpenMP C/C++ 1.0
OpenMP
Fortran 2.0
OpenMP
C/C++ 2.0
1998
2000
1999
2002
OpenMP Fortran 1.0
1997
OpenMP
F/C/C++ 2.5
2005
OpenMP
F/C/C++ 3.0
2008
Москва, 2008 г.
Параллельное программирование

из 32

Слайд 24

OpenMP Architecture Review Board
AMD
Cray
Fujitsu
HP
IBM
Intel
NEC
The Portland Group, Inc.
SGI
Sun
Microsoft
ASC/LLNL
cOMPunity
EPCC
NASA
RWTH Aachen University
Москва, 2008

г.

из 32

Слайд 25

Компиляторы, поддеживающие OpenMP
OpenMP 3.0:
Intel 11.0: Linux, Windows and MacOS
Sun Studio Express 11/08:

Linux and Solaris
PGI 8.0: Linux and Windows
IBM 10.1: Linux and AIX
Предыдущие версии OpenMP:
GNU gcc (4.3.2)
Absoft Pro FortranMP
Lahey/Fujitsu Fortran 95
PathScale
HP
Microsoft Visual Studio 2008 C++

Москва, 2008 г.

из 32

Слайд 26

Обзор основных возможностей OpenMP
omp_set_lock(lck)
#pragma omp parallel for private(a, b)
#pragma omp critical
C$OMP PARALLEL

DO SHARED(A,B,C)

C$OMP PARALLEL REDUCTION (+: A, B)

CALL OMP_INIT_LOCK (LCK)

CALL OMP_TEST_LOCK(LCK)

SETENV OMP_SCHEDULE “STATIC,4”

CALL CALL OMP_SET_NUM_THREADS(10)

C$OMP DO LASTPRIVATE(XX)

C$OMP ORDERED

C$OMP SINGLE PRIVATE(X)

C$OMP SECTIONS

C$OMP MASTER

C$OMP ATOMIC

C$OMP FLUSH

C$OMP PARALLEL DO ORDERED PRIVATE (A, B, C)

C$OMP THREADPRIVATE(/ABC/)

C$OMP PARALLEL COPYIN(/blk/)

nthrds = OMP_GET_NUM_PROCS()

C$OMP BARRIER

OpenMP: API для написания многонитевых приложений
Множество директив компилятора, набор функции библиотеки системы поддержки, переменные окружения
Облегчает создание многонитиевых программ на Фортране, C и C++
Обобщение опыта создания параллельных программ для SMP и DSM систем за последние 20 лет

Москва, 2008 г.

из 32

Слайд 27

из 32
Литература…
http://www.openmp.org
http://www.compunity.org
http://www.parallel.ru/tech/tech_dev/openmp.html
Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин

В.А.

Слайд 28

из 32
Литература…
Гергель В.П. Теория и практика параллельных вычислений. - М.:

Интернет-Университет, БИНОМ. Лаборатория знаний, 2007.
Богачев К.Ю. Основы параллельного программирования. - М.: БИНОМ. Лаборатория знаний, 2003.
Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. - СПб.: БХВ-Петербург, 2002.
Немнюгин С., Стесик О. Параллельное программирование для многопроцессорных вычислительных систем — СПб.: БХВ-Петербург, 2002.

Москва, 2008 г.

Слайд 29

из 32
Литература…
Учебные курсы Интернет Университета Информационных технологий
Гергель В.П. Теория и

практика параллельных вычислений. — http://www.intuit.ru/department/calculate/paralltp/
Левин М.П. Параллельное программирование с OpenMP
http://www.intuit.ru/department/se/openmp/
Дополнительные учебные курсы:
Богданов А.В. и др. Архитектуры и топологии многопроцессорных вычислительных систем. — http://www.intuit.ru/department/hardware/atmcs/
Барский А.Б. Архитектура параллельных вычислительных систем. — http://www.intuit.ru/department/hardware/paralltech/
Барский А.Б. Параллельное программирование. — http://www.intuit.ru/department/se/parallprog/

Москва, 2008 г.

Введение

Содержание

Москва, 2008 г.Параллельное программирование с OpenMP: Введение © Бахтин В.А. из 32СодержаниеТенденции

В течение нескольких десятилетий развитие ЭВМ сопровождалось удвоением их быстродействия каждые 1.5-2

Тенденции развития современных процессоровСуперкомпьютер СКИФ МГУ «Чебышев»Пиковая производительность - 60 TFlop/s Число

Тенденции развития современных процессоровQuad-Core AMD Opteron 4 ядравстроенный контроллер памяти (2 канала

Тенденции развития современных процессоровIntel Core i7 (архитектура Nehalem )4 ядра8 потоков с

Тенденции развития современных процессоровSUN UltraSPARC T2 Processor (Niagara 2)8 ядер64 потоков4 контроллера

из 32Тенденции развития современных процессоровТемпы уменьшения латентности памяти гораздо ниже темпов

Существующие подходы для создания параллельных программАвтоматическое распараллеливаниеБиблиотеки нитейWin32 APIPOSIXБиблиотеки передачи сообщенийMPI OpenMPМосква,

Вычисление числа πМосква, 2008 г.Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32#include int main (){ int n =100000, i; double pi,

Автоматическое распараллеливаниеPolaris, CAPO, WPP, SUIF, VAST/Parallel, OSCAR, Intel/OpenMP, ParaWise, ОРС, САПФОР icc

из 32#include "mpi.h"#include int main (int argc, char *argv[]){ int n

из 32 for (i = myid + 1; i <= n;

из 32#include #include #define NUM_THREADS 2CRITICAL_SECTION hCriticalSection;double pi = 0.0;int n

из 32void Pi (void *arg){ int i, start; double h, sum,

из 32#include int main (){ int n =100000, i; double pi,

Достоинства использования OpenMP вместо MPI для многоядерных процессоровВозможность инкрементального распараллеливанияУпрощение программирования и эффективность

Достоинства использования OpenMP вместо MPI для многоядерных процессоровПроцессоры Intel® Xeon® серии 5000Процессоры Intel®

Достоинства использования OpenMP вместо MPI для многоядерных процессоров#define Max(a,b) ((a)>(b)?(a):(b))#define L 8#define ITMAX

Достоинства использования OpenMP вместо MPI для многоядерных процессоровМосква, 2008 г.Параллельное программирование с OpenMP:

История OpenMPOpenMP Fortran 1.1OpenMP C/C++ 1.0OpenMPFortran 2.0OpenMPC/C++ 2.01998200019992002OpenMP Fortran 1.01997OpenMPF/C/C++ 2.52005OpenMPF/C/C++ 3.02008Москва, 2008 г.Параллельное программирование

OpenMP Architecture Review BoardAMDCrayFujitsuHPIBMIntelNECThe Portland Group, Inc. SGISunMicrosoft ASC/LLNLcOMPunityEPCCNASARWTH Aachen UniversityМосква, 2008

Компиляторы, поддеживающие OpenMPOpenMP 3.0:Intel 11.0: Linux, Windows and MacOSSun Studio Express 11/08:

Обзор основных возможностей OpenMPomp_set_lock(lck)#pragma omp parallel for private(a, b)#pragma omp criticalC$OMP PARALLEL

из 32Литература… http://www.openmp.orghttp://www.compunity.orghttp://www.parallel.ru/tech/tech_dev/openmp.htmlМосква, 2008 г.Параллельное программирование с OpenMP: Введение © Бахтин

из 32Литература… Гергель В.П. Теория и практика параллельных вычислений. - М.:

из 32Литература… Учебные курсы Интернет Университета Информационных технологийГергель В.П. Теория и

из 32Вопросы?Вопросы?Москва, 2008 г.Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32OpenMP – модель параллелизма по управлению Следующая темаМосква, 2008 г.Параллельное

Похожие презентации

Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин В.А.
из 32
Содержание
Тенденции

Тенденции развития современных процессоров
Суперкомпьютер СКИФ МГУ «Чебышев»
Пиковая производительность - 60 TFlop/s
Число

Тенденции развития современных процессоров
Quad-Core AMD Opteron
4 ядра
встроенный контроллер памяти (2 канала

Тенденции развития современных процессоров
Intel Core i7 (архитектура Nehalem )
4 ядра
8 потоков с

Тенденции развития современных процессоров
SUN UltraSPARC T2 Processor (Niagara 2)
8 ядер
64 потоков
4 контроллера

из 32
Тенденции развития современных процессоров
Темпы уменьшения латентности памяти гораздо ниже темпов

Существующие подходы для создания параллельных программ
Автоматическое распараллеливание
Библиотеки нитей
Win32 API
POSIX
Библиотеки передачи сообщений
MPI
OpenMP
Москва,

Вычисление числа π
Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32
#include
int main ()
{
int n =100000, i;
double pi,

Автоматическое распараллеливание
Polaris, CAPO, WPP, SUIF, VAST/Parallel, OSCAR, Intel/OpenMP, ParaWise, ОРС, САПФОР
icc

из 32
#include "mpi.h"
#include
int main (int argc, char *argv[])
{
int n

из 32
for (i = myid + 1; i <= n;

из 32
#include
#include
#define NUM_THREADS 2
CRITICAL_SECTION hCriticalSection;
double pi = 0.0;
int n

из 32
void Pi (void *arg)
{
int i, start;
double h, sum,

из 32
#include
int main ()
{
int n =100000, i;
double pi,

Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Процессоры Intel® Xeon® серии 5000
Процессоры Intel®

Достоинства использования OpenMP вместо MPI для многоядерных процессоров
#define Max(a,b) ((a)>(b)?(a):(b))
#define L 8
#define ITMAX

Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Москва, 2008 г.
Параллельное программирование с OpenMP:

История OpenMP
OpenMP Fortran 1.1
OpenMP C/C++ 1.0
OpenMP
Fortran 2.0
OpenMP
C/C++ 2.0
1998
2000
1999
2002
OpenMP Fortran 1.0
1997
OpenMP
F/C/C++ 2.5
2005
OpenMP
F/C/C++ 3.0
2008
Москва, 2008 г.
Параллельное программирование

OpenMP Architecture Review Board
AMD
Cray
Fujitsu
HP
IBM
Intel
NEC
The Portland Group, Inc.
SGI
Sun
Microsoft
ASC/LLNL
cOMPunity
EPCC
NASA
RWTH Aachen University
Москва, 2008

Компиляторы, поддеживающие OpenMP
OpenMP 3.0:
Intel 11.0: Linux, Windows and MacOS
Sun Studio Express 11/08:

Обзор основных возможностей OpenMP
omp_set_lock(lck)
#pragma omp parallel for private(a, b)
#pragma omp critical
C$OMP PARALLEL

из 32
Литература…
http://www.openmp.org
http://www.compunity.org
http://www.parallel.ru/tech/tech_dev/openmp.html
Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин

из 32
Литература…
Гергель В.П. Теория и практика параллельных вычислений. - М.:

из 32
Литература…
Учебные курсы Интернет Университета Информационных технологий
Гергель В.П. Теория и

из 32
Вопросы?
Вопросы?
Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32
OpenMP – модель параллелизма по управлению
Следующая тема
Москва, 2008 г.
Параллельное