Учебный курс Введение в параллельные алгоритмы

Февраль 18, 2021

Главная
Разное
Учебный курс Введение в параллельные алгоритмы

Содержание

2. Вычислить с точностью ε значение определенного интеграла Пусть на отрезке [A,B] задана равномерная сетка, содержащая n+1
3. IntTrap01(A,B) { n=1 J2n=(f(A)+f(B))(B-A)/2 do { Jn= J2n n=2n s=f(A)+f(B) for(i=1;i s+=2f(A+(B-A)i/n); J2n=s(B-A)/n; } while(|J2n- Jn|≥ε
4. Пример функции Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. Результаты вычисления интеграла
5. main() { J= IntTrap03( A, B, f(A),f(B) ) } Адаптивный алгоритм Введение в параллельные алгоритмы: Параллельные
6. IntTrap04(A,B) { J=0 fA=f(A) fB=f(B) sAB=(fA+fB)*(B-A)/2 while(1) { Тело цикла } return J } Метод локального
7. // данные, описывающие стек // указатель вершины стека sp=0 // массив структур в которых // хранятся
8. Тестирование показало, что при расчете с помощью алгоритма локального стека IntTrap04 время работы было меньше, примерно
9. Метод геометрического параллелизма? Метод коллективного решения? ? Параллельный алгоритм интегрирования Введение в параллельные алгоритмы: Параллельные алгоритмы
10. Метод геометрического параллелизма Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. main() {
11. Расчет интеграла на разных отрезках Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.
12. main() { // Порождение p параллельных процессов, // каждый из которых выполняет процедуру slave for(k=0;k StartParallel(slave
13. Практически непригодны для решения поставленной задачи методы геометрического параллелизма (статическая балансировка) и коллективного решения (динамическая балансировка)
14. Метод геометрического параллелизма? Метод коллективного решения? ? Параллельный алгоритм интегрирования Введение в параллельные алгоритмы: Параллельные алгоритмы
15. Вычислительные системы с общей памятью Динамическая балансировка загрузки Отсутствие централизованного управления Метод глобального стека Введение в
16. Пусть есть доступный всем параллельным процессам список отрезков интегрирования, организованный в виде стека. Назовем его глобальным
17. Глобальный стек Локальные стеки Стеки алгоритма Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский
18. Глобальный стек Локальные стеки Стеки алгоритма Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский
19. Глобальный стек Локальные стеки Стеки алгоритма Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский
20. какую часть отрезков следует перемещать из локального стека в глобальный стек? в какой момент интеграл вычислен?
21. slave_thr() { // цикла обработки стека отрезков while(sdat.ntask>0) { // чтение одного интервала из списка интервалов
22. main() { . Sem_init(sdat.sem_sum,1) //доступ к глобальной сумме открыт . } slave_thr() { … // Начало
23. slave_thr() { // цикла обработки стека отрезков while(sdat.ntask>0) { // чтение одного интервала из списка интервалов
24. Схема интегрирования отрезка Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. while(1) //
25. Схема интегрирования отрезка Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. c=(a+b)/2; fc=f(c)
26. Схема интегрирования отрезка Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. if(!BreakCond(sacb,sab)) {
27. Схема интегрирования отрезка Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. if((sp>SPK) &&
28. while(1) { // Начало критической секции чтения из глобального // стека очередного интервала интегрирования sem_wait(sdat.sem_list) if(sdat.ntask≤0)
29. Условие выхода из цикла обработки стека интервалов выбрано неудачно Интегрирующие процессы не должны заканчивать работу до
30. Отрезок интегрирования может находиться в нескольких состояниях: - находится в глобальном стеке интервалов; - обрабатывается некоторым
31. Необходимые данные Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. из 40 Москва,
32. int slave_thr() { // все переменные, начинающиеся с sdat. являются глобальными, // к ним имеет доступ
33. Инициализация Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. int slave_thr() { //
34. Начало обработки глобального стека Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. //
35. Запись терминальных отрезков Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В. // Начало
36. какую часть отрезков следует перемещать из локального стека в глобальный стек? в какой момент интеграл вычислен?
37. Время выполнения Ускорение Эффективность Результаты тестирования Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский
38. Рассмотрен ряд методов вычисления интегралов на многопроцессорных системах, проанализированы их преимущества и недостатки Показано, что методы
39. Якобовский М.В., Кулькова Е.Ю. Решение задач на многопроцессорных вычислительных системах с разделяемой памятью. - М.: СТАНКИН,
41. Скачать презентацию

Слайд 2

Вычислить с точностью ε значение определенного интеграла
Пусть на отрезке [A,B] задана равномерная

сетка, содержащая n+1 узел:
Тогда, согласно методу трапеций, можно численно найти
определенный интеграл от функции на отрезке [A,B]:
Будем полагать значение J найденным с точностью ε,
если выполнено условие:

Постановка задачи

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

xn1=B

x0=A

xn2=B

x0=A

из 40

Москва, 2010 г.

Слайд 3

IntTrap01(A,B)
{
n=1
J2n=(f(A)+f(B))(B-A)/2
do
{
Jn= J2n
n=2n
s=f(A)+f(B)
for(i=1;i s+=2f(A+(B-A)i/n);
J2n=s(B-A)/n;
}
while(|J2n- Jn|≥ε J2n)
return J2n
}
Последовательный алгоритм интегрирования
Введение в параллельные алгоритмы: Параллельные алгоритмы

интегрирования функций © Якобовский М.В.

x2=B

x0=A

Недостатки:
в некоторых точках значение подынтегральной функции вычисляется более одного раза
на всем интервале интегрирования используется равномерная сетка, тогда как число узлов сетки на единицу длины на разных участках интервала интегрирования, необходимое для достижения заданной точности, зависит от вида функции

из 40

Москва, 2010 г.

Слайд 4

Пример функции
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.
Результаты

вычисления интеграла на разных отрезках

из 40

Москва, 2010 г.

Слайд 5

main()
{
J= IntTrap03( A, B, f(A),f(B) )
}
Адаптивный алгоритм
Введение в параллельные алгоритмы: Параллельные алгоритмы

интегрирования функций © Якобовский М.В.

IntTrap03(A,B,fA,fB)
{
J=0
C=(A+B)/2
fC=f(C)
sAB=(fA+fB)*(B-A)/2
sAC=(fA+fC)*(C-A)/2
sCB=(fC+fB)*(B-C)/2
sACB=sAC+sCB
if(|sAB-sACB|≥ε|sACB|)
J=IntTrap03(A,C,fA,fC)+IntTrap03(C,B,fC,fB)
else
J= sACB
return J
}

x2=B

x0=A

x1=C

Недостаток:
координаты концов отрезков хранятся в программном стеке процесса и фактически недоступны программисту

Преимущества:
нет повторных вычислений функции
малое число вычислений на гладких участках

из 40

Москва, 2010 г.

Слайд 6

IntTrap04(A,B)
{
J=0
fA=f(A)
fB=f(B)
sAB=(fA+fB)*(B-A)/2
while(1)
{
Тело цикла
}
return J
}
Метод локального стека
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций

C=(A+B)/2
fC=f(C)
sAC=(fA+fC)*(C-A)/2
sCB=(fC+fB)*(B-C)/2
sACB=sAC+sCB
if(|sAB-sACB|≥ε|sACB|)
{
PUT_INTO_STACK( A, C, fA, fC, sAC)
A=C
fA=fC
sAB=sCB
}
else
{
J+=sACB
if(STACK_IS_NOT_FREE)
break
GET_FROM_STACK( A, B, fA, fB, sAB)
}

из 40

Москва, 2010 г.

Слайд 7

// данные, описывающие стек
// указатель вершины стека
sp=0
// массив структур в которых

// хранятся отложенные задания
struct
{
A,B,fA,fB,s
}
stk[1000]

Процедуры и данные обеспечивающие стек

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

// макроопределения доступа к стеку
#define STACK_IS_NOT_FREE (sp>0)
#define PUT_INTO_STACK(A,B,fA,fB,s)
{
stk[sp].A=A
stk[sp].B=B
stk[sp].fA=fA
stk[sp].fB=fB
stk[sp].s=s
sp++
}
#define GET_FROM_STACK(A,B,fA,fB,s)
{
sp--
A=stk[sp].A
B=stk[sp].B
fA=stk[sp].fA
fB=stk[sp].fB
s=stk[sp].s
}

из 40

Москва, 2010 г.

Слайд 8

Тестирование показало, что при расчете с помощью алгоритма локального стека IntTrap04 время

работы было меньше, примерно на 5%, чем при использовании IntTrap03
Примем алгоритм IntTrap04 за «наилучший» последовательный

К вопросу о времени выполнения

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 9

Метод геометрического параллелизма?
Метод коллективного решения?
?
Параллельный алгоритм интегрирования
Введение в параллельные алгоритмы: Параллельные алгоритмы

интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 10

Метод геометрического параллелизма
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

М.В.

main()
{
…
for(i=0;i StartParallelProcess
( IntTrap04, A+(B-A)*i/p, A+(B-A)*(i+1)/p, &(s[i]) )
WaitAllParallelProcess
J=0
for(i=0;i J+=s[i]
}

из 40

Недостаток:
Значительный дисбаланс загрузки процессоров

Москва, 2010 г.

Слайд 11

Расчет интеграла на разных отрезках
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций

A=1e-5

Недостаток:
Большой дисбаланс загрузки процессоров

из 40

Москва, 2010 г.

Слайд 12

main()
{
// Порождение p параллельных процессов,
// каждый из которых выполняет процедуру slave
for(k=0;k StartParallel(slave

#k)
i=0 // число переданных для обработки интервалов
// n – число отрезков интегрирования
for(k=0;k { // Передача концов отрезков интегрирования
Send(slave #k, A+(B-A)*i/n, A+(B-A)*(i+1)/n)
i++
}
// J - значение интеграла на всем интервале [A,B]
J=0

Метод коллективного решения

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

slave()
{
подчиненный процесс, вычисляющий значение интеграла на отрезке [a,b]
while(1){ Recv(main,a,b)
s=IntTrap04(a,b)
Send(main,s)
}
}

Пока есть отрезки, не переданные для отработки,
следует дождаться сообщения от любого из процессов slave,
вычислившего частичную сумму на переданном ему отрезке,
Получить значение этой суммы, прибавить к общему значению
Интеграла и передать освободившемуся процессу очередной
отрезок
while(i {
Recv(slave #any, s)
J+=s
Send(slave #any, A+(B-A)*i/n, A+(B-A)*(i+1)/n)
i++
}
// Получить результаты вычислений переданных отрезков
// и прибавить их к общей сумме
for(k=0;k {
Recv(slave #any, s)
J+=s
}
}

Недостаток:
Либо большой дисбаланс загрузки процессоров
Либо большой объем лишних вычислений

из 40

Москва, 2010 г.

Слайд 13

Практически непригодны для решения поставленной задачи методы
геометрического параллелизма (статическая балансировка)
и

коллективного решения (динамическая балансировка)

Вывод

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 14

Метод геометрического параллелизма?
Метод коллективного решения?
?
Параллельный алгоритм интегрирования
Введение в параллельные алгоритмы: Параллельные алгоритмы

интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 15

Вычислительные системы с общей памятью
Динамическая балансировка загрузки
Отсутствие централизованного управления
Метод глобального стека
Введение в

параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 16

Пусть есть доступный всем параллельным процессам список отрезков интегрирования, организованный в виде

стека. Назовем его глобальным стеком.
Пусть у каждого процесса есть свой, доступный только этому процессу локальный стек
Перед запуском параллельных процессов в глобальный стек помещается единственная запись (в дальнейшем "отрезок"):
координаты концов отрезка интегрирования,
значения функции на концах,
приближенное значение интеграла на этом отрезке.
Тогда, предлагается следующая схема алгоритма, выполняемого каждым из параллельных процессов:
Пока в глобальном стеке есть отрезки:
- взять один отрезок из глобального стека
- выполнить алгоритм локального стека, но,
если при записи в локальный стек в нем есть несколько отрезков, а в глобальном стеке отрезки отсутствуют, то:
- переместить часть отрезков из локального стека в глобальный стек.

Идея алгоритма

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 17

Глобальный стек
Локальные стеки
Стеки алгоритма
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 18

Глобальный стек
Локальные стеки
Стеки алгоритма
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Якобовский М.В.

Только стек
Никакого процесса нет

из 40

Москва, 2010 г.

Слайд 19

Глобальный стек
Локальные стеки
Стеки алгоритма
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 20

какую часть отрезков следует перемещать из локального стека в глобальный стек?
в какой

момент интеграл вычислен?
что должен делать процесс у которого пуст локальный стек, если глобальный стек тоже пуст?
должен ли процесс закончить работу, если в его локальном и в глобальном стеке отрезков нет?

Вопросы

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 21

slave_thr()
{
// цикла обработки стека отрезков
while(sdat.ntask>0)
{
// чтение одного интервала из списка

$slave_thr() { // цикла обработки стека отрезков while(sdat.ntask>0) { // чтение одного$

интервалов
sdat.ntask-- // указатель глобального стека
GET_FROM_GLOBAL_STACK[sdat.ntask](a,b,fa,fb,sab)
ИНТЕГРИРОВАНИЕ ОДНОГО ОТРЕЗКА
}
sdat.s_all = sdat.s_all + s
}

Схема Интегрирующего процесса

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 22

main()
{
.
Sem_init(sdat.sem_sum,1) //доступ к глобальной сумме открыт
.
}
slave_thr()
{
…
// Начало критической секции сложения частичных

$main() { . Sem_init(sdat.sem_sum,1) //доступ к глобальной сумме открыт . } slave_thr()$

сумм
sem_wait(sdat.sem_sum)
sdat.s_all = sdat.s_all + s
sem_post(sdat.sem_sum)
// Конец критической секции сложения частичных сумм
}

Правильное определение общей суммы

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 23

slave_thr()
{
// цикла обработки стека отрезков
while(sdat.ntask>0)
{
// чтение одного интервала из

$slave_thr() { // цикла обработки стека отрезков while(sdat.ntask>0) { // чтение одного$

списка интервалов
sdat.ntask-- // указатель глобального стека
GET_FROM_GLOBAL_STACK[sdat.ntask](a,b,fa,fb,sab)
ИНТЕГРИРОВАНИЕ ОДНОГО ОТРЕЗКА
}
sem_wait(sdat.sem_sum)
sdat.s_all = sdat.s_all + s
sem_post(sdat.sem_sum)
}

Схема Интегрирующего процесса

Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

из 40

Москва, 2010 г.

Слайд 24

Схема интегрирования отрезка
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

М.В.

while(1) // интегрирование одного отрезка
{
c=(a+b)/2; fc=f(c)
sac=(fa+fc)*(c-a)/2
scb=(fc+fb)*(b-c)/2
sacb=sac+scb
if(!BreakCond(sacb,sab)) // Точность на части отрезка достигнута
{
s+=sacb
if(sp==0) break; // локальный стек пуст, выход
sp--; GET_FROM_LOCAL_STACK[sp]( a, b, fa, fb, sab)
}
else
{
PUT_INTO_LOCAL_STACK[sp]( a, c, fa, fc, sac); sp++
a=c
fa=fc
sab=scb
}
if((sp>SPK) && (!sdat.ntask)) // перемещение части локального стека в общий список интервалов
{
while((sp>1) && (sdat.ntask {
sp--; GET_FROM_LOCAL_STACK[sp](a,b,fa,fb,sab)
PUT_INTO_GLOBAL_STACK[sdat.ntask](a,b,fa,fb,sab); sdat.ntask++
}
}
}

из 40

Москва, 2010 г.

Слайд 25

Схема интегрирования отрезка
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

М.В.

c=(a+b)/2;
fc=f(c)
sac=(fa+fc)*(c-a)/2
scb=(fc+fb)*(b-c)/2
sacb=sac+scb

// интегрирование одного отрезка
while(1)
{
Инициализация
Точность на части отрезка достигнута?
Добавлять отрезки в глобальный стек?
}

из 40

Москва, 2010 г.

Слайд 26

Схема интегрирования отрезка
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

М.В.

if(!BreakCond(sacb,sab))
{ // Точность на части отрезка достигнута
s+=sacb
if(sp==0) break; // локальный стек пуст, выход
sp--;
GET_FROM_LOCAL_STACK[sp]( a, b, fa, fb, sab)
}
else
{
PUT_INTO_LOCAL_STACK[sp]( a, c, fa, fc, sac);
sp++
a=c
fa=fc
sab=scb
}

из 40

Москва, 2010 г.

Слайд 27

Схема интегрирования отрезка
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

М.В.

if((sp>SPK) && (!sdat.ntask)) // перемещение части локального стека в общий список интервалов
{
while((sp>1) && (sdat.ntask {
sp--;
GET_FROM_LOCAL_STACK[sp](a,b,fa,fb,sab)
PUT_INTO_GLOBAL_STACK[sdat.ntask](a,b,fa,fb,sab);
sdat.ntask++
}
}

из 40

Москва, 2010 г.

Слайд 28

while(1)
{
// Начало критической секции чтения из глобального
// стека очередного

интервала интегрирования
sem_wait(sdat.sem_list)
if(sdat.ntask≤0)
{
sem_post(sdat.sem_list) // разрешить другим процессам
// доступ к глобальному стеку
break
}
sdat.ntask-- // указатель глобального стека
GET_FROM_GLOBAL_STACK[sdat.ntask](a,b,fa,fb,sab)
sem_post(sdat.sem_list)
// Конец критической секции чтения из глобального
// стека очередного интервала интегрирования
…
}

Преждевременное окончание работы процесса

из 40

Москва, 2010 г.

Слайд 29

Условие выхода из цикла обработки стека интервалов выбрано неудачно
Интегрирующие процессы не должны

заканчивать работу до тех пор, пока все отрезки интервала интегрирования не будут полностью обработаны
Преждевременное завершение работы приведет к получению верного ответа, но за большее время

Преждевременный выход

из 40

Москва, 2010 г.

Слайд 30

Отрезок интегрирования может находиться в нескольких состояниях:
- находится в глобальном стеке интервалов;
-

обрабатывается некоторым интегрирующим процессом;
- находится в локальном стеке интервалов некоторого процесса;
- полностью обработан: известно значение интеграла на этом отрезке и оно прибавлено к локальной частичной сумме соответствующего процесса.
"Время жизни" отрезка, после того, как некоторый процесс начал его обработку, относительно невелико - отрезок разбивается на две части и перестает существовать, породив два новых отрезка. Таким образом, требование "все отрезки интервала интегрирования полностью обработаны" означает, что:
- функция проинтегрирована на всех отрезках, покрывающих исходный интервал интегрирования;
- полученные на отрезках интегрирования значения интегралов добавлены к частичным суммам соответствующих процессов.

Если глобальный и локальный стеки пусты

из 40

Москва, 2010 г.

Слайд 31

Необходимые данные Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

из 40

Москва, 2010 г.

Слайд 32

int slave_thr()
{
// все переменные, начинающиеся с sdat. являются глобальными,
// к

$int slave_thr() { // все переменные, начинающиеся с sdat. являются глобальными, //$

ним имеет доступ каждый из запущенных процессов slave_thr
// и запускающая программа main
// sp, s - локальные переменные процессов slave_thr
sp=0 // указатель локального стека - локальный стек пуст
s=0 // частичная сумма интегралов, вычисленных на отрезках,
// обработанных данной копией процесса
// начало цикла обработки стека интервалов
while(1)
{
// ожидание появления в глобальном стеке интервалов для обработки
sem_wait(sdat.sem_task_present)
// чтение одного интервала из списка интервалов
// Начало критической секции чтения из глобального
// стека очередного интервала интегрирования
//
sem_wait(sdat.sem_list)
sdat.ntask-- // указатель глобального стека
GET_OF_GLOBAL_STACK[sdat.ntask](a,b,fa,fb,sab)
if(sdat.ntask)
sem_post(&sdat.sem_task_present)
if(a<=b) // очередной отрезок не является терминальным
sdat.nactive++ // увеличить число процессов, имеющих
// интервал для интегрирования
sem_post(sdat.sem_list)
//
// Конец критической секции чтения из глобального
// стека очередного интервала интегрирования
if(a>b) // отрезок является терминальным
break // выйти из цикла обработки стека интервалов
// начало цикла интегрирования одного интервала
while(1)
{
c=(a+b)/2
fc=fun(c)
sac=(fa+fc)*(c-a)/2
scb=(fc+fb)*(b-c)/2
sacb=sac+scb
if(!BreakCond(sacb,sab))
{
s+=sacb
if(!sp) // локальный стек пуст
break // выход из цикла интегрирования
// одного интервала
sp--
GET_FROM_LOCAL_STACK[sp]( a, b, fa, fb, sab)
}
else
{
PUT_TO_LOCAL_STACK[sp]( a, c, fa, fc, sac)
sp++
a=c
fa=fc
sab=scb
}
// перемещение части локального стека
// в общий список интервалов
if((sp>SPK) && (!sdat.ntask))
{
// Начало критической секции заполнения глобального
// стека отрезками интегрирования
//
sem_wait(sdat.sem_list)
if(!sdat.ntask)
{
// установить семафор наличия
// записей в глобальном стеке
sem_post(sdat.sem_task_present)
}
while((sp>1) && (sdat.ntask {
sp--
GET_FROM_LOCAL_STACK[sp](a,b,fa,fb,sab)
PUT_TO_GLOBAL_STACK[sdat.ntask](a,b,fa,fb,sab)
sdat.ntask++
}
sem_post(sdat.sem_list)
//
// Конец критической секции заполнения глобального
// стека отрезками интегрирования
}
}
// конец цикла интегрирования одного интервала
// Начало критической секции заполнения глобального
// стека терминальными отрезками (a>b)
//
sem_wait(&sdat.sem_list)
sdat.nactive--
if( (!sdat.nactive) && (!sdat.ntask) )
{
// запись в глобальный стек списка терминальных отрезков
for(i=0;i {
PUT_TO_GLOBAL_STACK[sdat.ntask](2,1,-,-,-)
sdat.ntask++;
}
// в глобальном стеке есть записи
sem_post(sdat.sem_task_present)
}
sem_post(sdat.sem_list)
//
// Конец критической секции заполнения глобального
// стека терминальными отрезками
}
// конец цикла обработки стека интервалов
// Начало критической секции сложения частичных сумм
//
sem_wait(&(sdat.sem_sum))
sdat.s_all+=s
sem_post(&(sdat.sem_sum))
//
// Конец критической секции сложения частичных сумм
}
PUT_INTO_GLOBAL_STACK[sdat.ntask]
(A,B,fA,fB,sAB)
{
sdat.list_of_tasks[sdat.ntask].a=A;
sdat.list_of_tasks[sdat.ntask].b=B;
sdat.list_of_tasks[sdat.ntask].fa=fA;
sdat.list_of_tasks[sdat.ntask].fb=fB;
sdat.list_of_tasks[sdat.ntask].s=sAB;
}
PUT_FROM_GLOBAL_STACK[sdat.ntask]
(A,B,fA,fB,sAB)
{
A=sdat.list_of_tasks[sdat.ntask].a;
B=sdat.list_of_tasks[sdat.ntask].b;
fA=sdat.list_of_tasks[sdat.ntask].fa;
fB=sdat.list_of_tasks[sdat.ntask].fb;
sAB=sdat.list_of_tasks[sdat.ntask].s;
}

Параллельный алгоритм: метод глобального стека

из 40

Москва, 2010 г.

Слайд 33

Инициализация
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.
int slave_thr()
{

// все переменные, начинающиеся с sdat. являются глобальными,
// к ним имеет доступ каждый из запущенных процессов slave_thr
// и запускающая программа main
// sp, s - локальные переменные процессов slave_thr
sp=0 // указатель локального стека - локальный стек пуст
s=0 // частичная сумма интегралов, вычисленных на отрезках,
// обработанных данной копией процесса

из 40

Москва, 2010 г.

Слайд 34

Начало обработки глобального стека Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций

Якобовский М.В.

// начало цикла обработки глобального стека
while(1)
{
// ожидание появления в глобальном стеке интервалов для обработки
sem_wait(sdat.sem_task_present)
// чтение одного интервала из списка интервалов
sem_wait(sdat.sem_list)
sdat.ntask-- // указатель глобального стека
GET_OF_GLOBAL_STACK[sdat.ntask](a,b,fa,fb,sab)
if(sdat.ntask)
sem_post(&sdat.sem_task_present)
if(a<=b) // очередной отрезок не является терминальным
sdat.nactive++ // увеличить число процессов, имеющих интервал для интегрирования
sem_post(sdat.sem_list)
if(a>b) // отрезок является терминальным
break // выйти из цикла обработки стека интервалов

из 40

Москва, 2010 г.

Слайд 35

Запись терминальных отрезков
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

М.В.

// Начало критической секции заполнения глобального
// стека терминальными отрезками (a>b)
//
sem_wait(&sdat.sem_list)
sdat.nactive--
if( (!sdat.nactive) && (!sdat.ntask) )
{
// запись в глобальный стек списка терминальных отрезков
for(i=0;i {
PUT_TO_GLOBAL_STACK[sdat.ntask](2,1,-,-,-)
sdat.ntask++;
}
// в глобальном стеке есть записи
sem_post(sdat.sem_task_present)
}
sem_post(sdat.sem_list)
//
// Конец критической секции заполнения глобального
// стека терминальными отрезками

из 40

Москва, 2010 г.

Слайд 36

какую часть отрезков следует перемещать из локального стека в глобальный стек?
в какой

Вопросы

из 40

Москва, 2010 г.

Слайд 37

Время выполнения
Ускорение
Эффективность
Результаты тестирования
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

М.В.

из 40

Москва, 2010 г.

Слайд 38

Рассмотрен ряд методов вычисления интегралов на многопроцессорных системах, проанализированы их преимущества и

недостатки
Показано, что методы геометрического параллелизма и коллективного решения неприменимы для эффективного численного интегрирования функций общего вида

Заключение

из 40

Москва, 2010 г.

Слайд 39

Якобовский М.В., Кулькова Е.Ю. Решение задач на многопроцессорных вычислительных системах с разделяемой

памятью. - М.: СТАНКИН, 2004. – 30 c. http://www.imamod.ru/~serge/arc/stud/Jackob_2.pdf

Литература

из 40

Москва, 2010 г.

Учебный курс Введение в параллельные алгоритмы

Содержание

Вычислить с точностью ε значение определенного интеграла Пусть на отрезке [A,B] задана равномерная

Пример функцииВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.Результаты

main(){J= IntTrap03( A, B, f(A),f(B) )}Адаптивный алгоритмВведение в параллельные алгоритмы: Параллельные алгоритмы

IntTrap04(A,B){J=0fA=f(A)fB=f(B)sAB=(fA+fB)*(B-A)/2while(1){Тело цикла}return J}Метод локального стекаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций

// данные, описывающие стек// указатель вершины стекаsp=0 // массив структур в которых

Тестирование показало, что при расчете с помощью алгоритма локального стека IntTrap04 время

Метод геометрического параллелизма?Метод коллективного решения??Параллельный алгоритм интегрированияВведение в параллельные алгоритмы: Параллельные алгоритмы

Метод геометрического параллелизмаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Расчет интеграла на разных отрезкахВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций

main(){// Порождение p параллельных процессов, // каждый из которых выполняет процедуру slavefor(k=0;k StartParallel(slave

Практически непригодны для решения поставленной задачи методы геометрического параллелизма (статическая балансировка) и

Метод геометрического параллелизма?Метод коллективного решения??Параллельный алгоритм интегрированияВведение в параллельные алгоритмы: Параллельные алгоритмы

Вычислительные системы с общей памятьюДинамическая балансировка загрузкиОтсутствие централизованного управленияМетод глобального стекаВведение в

Пусть есть доступный всем параллельным процессам список отрезков интегрирования, организованный в виде

Глобальный стекЛокальные стекиСтеки алгоритмаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Глобальный стекЛокальные стекиСтеки алгоритмаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Глобальный стекЛокальные стекиСтеки алгоритмаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

какую часть отрезков следует перемещать из локального стека в глобальный стек?в какой

slave_thr(){ // цикла обработки стека отрезков while(sdat.ntask>0) { // чтение одного интервала из списка

main(){.Sem_init(sdat.sem_sum,1) //доступ к глобальной сумме открыт.}slave_thr(){… // Начало критической секции сложения частичных

slave_thr(){ // цикла обработки стека отрезков while(sdat.ntask>0) { // чтение одного интервала из

Схема интегрирования отрезкаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Схема интегрирования отрезкаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Схема интегрирования отрезкаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Схема интегрирования отрезкаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

while(1) { // Начало критической секции чтения из глобального // стека очередного

Условие выхода из цикла обработки стека интервалов выбрано неудачноИнтегрирующие процессы не должны

Отрезок интегрирования может находиться в нескольких состояниях:- находится в глобальном стеке интервалов;-

Необходимые данныеВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

int slave_thr(){ // все переменные, начинающиеся с sdat. являются глобальными, // к

ИнициализацияВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.int slave_thr(){

Начало обработки глобального стекаВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Запись терминальных отрезковВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

какую часть отрезков следует перемещать из локального стека в глобальный стек?в какой

Время выполненияУскорениеЭффективностьРезультаты тестированияВведение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Рассмотрен ряд методов вычисления интегралов на многопроцессорных системах, проанализированы их преимущества и

Якобовский М.В., Кулькова Е.Ю. Решение задач на многопроцессорных вычислительных системах с разделяемой

Похожие презентации

Вычислить с точностью ε значение определенного интеграла
Пусть на отрезке [A,B] задана равномерная

Пример функции
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.
Результаты

main()
{
J= IntTrap03( A, B, f(A),f(B) )
}
Адаптивный алгоритм
Введение в параллельные алгоритмы: Параллельные алгоритмы

IntTrap04(A,B)
{
J=0
fA=f(A)
fB=f(B)
sAB=(fA+fB)*(B-A)/2
while(1)
{
Тело цикла
}
return J
}
Метод локального стека
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций

// данные, описывающие стек
// указатель вершины стека
sp=0
// массив структур в которых

Метод геометрического параллелизма
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Расчет интеграла на разных отрезках
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций

main()
{
// Порождение p параллельных процессов,
// каждый из которых выполняет процедуру slave
for(k=0;k StartParallel(slave

Практически непригодны для решения поставленной задачи методы
геометрического параллелизма (статическая балансировка)
и

Вычислительные системы с общей памятью
Динамическая балансировка загрузки
Отсутствие централизованного управления
Метод глобального стека
Введение в

Глобальный стек
Локальные стеки
Стеки алгоритма
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Глобальный стек
Локальные стеки
Стеки алгоритма
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Глобальный стек
Локальные стеки
Стеки алгоритма
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

какую часть отрезков следует перемещать из локального стека в глобальный стек?
в какой

slave_thr()
{
// цикла обработки стека отрезков
while(sdat.ntask>0)
{
// чтение одного интервала из списка

main()
{
.
Sem_init(sdat.sem_sum,1) //доступ к глобальной сумме открыт
.
}
slave_thr()
{
…
// Начало критической секции сложения частичных

slave_thr()
{
// цикла обработки стека отрезков
while(sdat.ntask>0)
{
// чтение одного интервала из

Схема интегрирования отрезка
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Схема интегрирования отрезка
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Схема интегрирования отрезка
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

Схема интегрирования отрезка
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

while(1)
{
// Начало критической секции чтения из глобального
// стека очередного

Условие выхода из цикла обработки стека интервалов выбрано неудачно
Интегрирующие процессы не должны

Отрезок интегрирования может находиться в нескольких состояниях:
- находится в глобальном стеке интервалов;
-

Необходимые данные
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.

int slave_thr()
{
// все переменные, начинающиеся с sdat. являются глобальными,
// к

Инициализация
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский М.В.
int slave_thr()
{

Начало обработки глобального стека
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций ©

Запись терминальных отрезков
Введение в параллельные алгоритмы: Параллельные алгоритмы интегрирования функций © Якобовский

какую часть отрезков следует перемещать из локального стека в глобальный стек?
в какой