Визуализация в распределенных системах Институт математического моделирования Российской академии наук

Содержание

Слайд 2

Особенности момента

Потребность в суперкомпьютерах высока
Эффективность использования суперкомпьютеров низка:
Использование каждого ядра последовательной программой

Особенности момента Потребность в суперкомпьютерах высока Эффективность использования суперкомпьютеров низка: Использование каждого
составляет проценты и доли процентов
Обмены, синхронизация и другие дополнительные операции ещё снижают эффективность параллельной программы
Есть минимальный объем вычислений на процессорное ядро, определяющий максимальное число используемых ядер
За счет многопроцессорности проблематично сокращать время моделирования физического процесса, но можно повышать сложность решаемой задачи, например за счет увеличения размеров и детальности представления изучаемых объектов

Слайд 3

JSCC
MSU

Оперативная память
Кеш
Операционные устройства
Множественный доступ
Бета-тестер

JSCC MSU Оперативная память Кеш Операционные устройства Множественный доступ Бета-тестер

Слайд 4

Вычислительная среда

Выбор математической модели и солверов.
Сопоставление атрибутам начальных и граничных условий, физических

Вычислительная среда Выбор математической модели и солверов. Сопоставление атрибутам начальных и граничных
параметров.

Выбор сервера вычислений

Выбор сервера визуализации

Проект

Построение геометрической модели,
поверхностной и объемной сетки.
Задание атрибутов.

Формирование варианта задания

Расчет варианта задания

Файлы результатов

Визуализация результатов

Слайд 5

Визуализация

Скалярные
Векторные
Стационарные
Зависящие от времени
Решетки
Треугольные и тетраэдральные сетки

сетки
Большие

Визуализация Скалярные Векторные Стационарные Зависящие от времени Решетки Треугольные и тетраэдральные сетки сетки Большие

Слайд 6

Этапы визуализации

Запись
Сетка Сеточная функция
Чтение
Формирование объектов виртуальной сцены
Отображение

Этапы визуализации Запись Сетка Сеточная функция Чтение Формирование объектов виртуальной сцены Отображение

Слайд 7

Клиент-серверная технология

Аппроксимация и потоковая обработка

VISIT ParaView
EnSight OpenDX

Отображение
Расчет
Запись результатов

Копирование всех данных
Чтение
Формирование сцены

Чтение
Формирование сцены

TecPlot
Origin

Клиент-серверная технология Аппроксимация и потоковая обработка VISIT ParaView EnSight OpenDX Отображение Расчет

Слайд 8

Методы

Распределенное иерархическое хранение
Декомпозиция
Огрубление с контролируемой точностью
Клиент-серверная технология
Потоковая обработка
Хранение образов

Методы Распределенное иерархическое хранение Декомпозиция Огрубление с контролируемой точностью Клиент-серверная технология Потоковая обработка Хранение образов

Слайд 9

Обтекание самолета

Сетка Изоповерхности

Обтекание самолета Сетка Изоповерхности

Слайд 19

Расчетная сетка

Расчетная сетка

Слайд 20

Огрубление поверхностей

Огрубление поверхностей

Слайд 21

Огрубление поверхностей

Огрубление поверхностей

Слайд 22

Двухуровневое разбиение

Сетка предварительно разбивается на большое число микродоменов, образующих макрограф

Вершины макрографа

Двухуровневое разбиение Сетка предварительно разбивается на большое число микродоменов, образующих макрограф Вершины
распределяются по процессорам

I

II

Слайд 23

Потоковая обработка

40 процессоров, полное чтение файла

40 процессоров, чтение фрагментов файла

Потоковая обработка 40 процессоров, полное чтение файла 40 процессоров, чтение фрагментов файла

Слайд 24

Изоповерхности

Ошибка аппроксимации 5%

Изоповерхности Ошибка аппроксимации 5%

Слайд 25

Огрубление 3D-данных

Огрубление 3D-данных

Слайд 26

Огрубление 3D-данных

Огрубление 3D-данных

Слайд 27

Сечение регулярной 3D сетки плоскостью

В результате сечения регулярной кубической решетки получается фрагмент

Сечение регулярной 3D сетки плоскостью В результате сечения регулярной кубической решетки получается фрагмент неструктурированной сетки
неструктурированной сетки

Слайд 28

Аппроксимация триангулированных поверхностей

Алгоритмы синтеза
Алгоритмы редуцирования

Аппроксимация триангулированных поверхностей Алгоритмы синтеза Алгоритмы редуцирования

Слайд 29

Начальная аппроксимация кривой

Начальная аппроксимация кривой

Слайд 30

Аппроксимация кривой этап 2

1 вектор

Аппроксимация кривой этап 2 1 вектор

Слайд 31

Аппроксимация кривой этап 3

3 вектора

Аппроксимация кривой этап 3 3 вектора

Слайд 32

Аппроксимация кривой этап 4

7 векторов

Аппроксимация кривой этап 4 7 векторов

Слайд 33

Аппроксимация кривой этап 5

15 векторов

Аппроксимация кривой этап 5 15 векторов

Слайд 34

Методы редуцирования

Удаление ребра
Удаление точки
Уточнение топологии

Методы редуцирования Удаление ребра Удаление точки Уточнение топологии

Слайд 35

Аппроксимация изоповерхностей

Аппроксимация изоповерхностей

Слайд 36

Плоскость, пересекающая цилиндр

Ошибка аппроксимации 5%

Плоскость, пересекающая цилиндр Ошибка аппроксимации 5%

Слайд 37

Многоуровневое огрубление больших сеток

Многоуровневое огрубление больших сеток

Слайд 38

Распределенная визуализация

Распределенная визуализация

Слайд 39

Моделирование течения вокруг летательного аппарата

Моделирование течения вокруг летательного аппарата

Слайд 40

Изоповерхности поля плотности

RemoteViewer

Tecplot

Изоповерхности поля плотности RemoteViewer Tecplot

Слайд 41

Тетраэдральные сетки 108 узлов

Тетраэдральные сетки 108 узлов

Слайд 43

Заполнение пространства пирамидами

На каждую из 2n точек в среднем опирается 2n пирамид
Число

Заполнение пространства пирамидами На каждую из 2n точек в среднем опирается 2n
пирамид ~ n2


Слайд 44

Зависимость объема хранимых данных от числа микродоменов

38 350 -> 2 356 196 узлов
219 034 *

Зависимость объема хранимых данных от числа микродоменов 38 350 -> 2 356
82 -> 14 018 176 тетраэдров

На 35% больше чем 124

Слайд 45

Нерегулярная тетраэдральная сетка

110 533 834 узлов
659 316 736 тетраэдров
2 589 184 поверхностных треугольников
Время выполнения программы на 100

Нерегулярная тетраэдральная сетка 110 533 834 узлов 659 316 736 тетраэдров 2
процессорах МВС-15000ВМ составляет 270 секунд (с учетом записи данных на диск).
Время равномерного измельчения – 30 секунд.
Дисковое пространство 12.33 Гб

Слайд 46

Библиотека ввода-вывода

Ввод-вывод тетраэдральных сеток
Хранение микродоменов
Хранение макрографа
Ввод-вывод регулярных решеток
Хранение фрагментов сеток
Хранение сеточных функций

Библиотека ввода-вывода Ввод-вывод тетраэдральных сеток Хранение микродоменов Хранение макрографа Ввод-вывод регулярных решеток

Слайд 47

Записи двух сеточных 2d функций



Функция F1 Функция F2
Рисунок 2.

Записи двух сеточных 2d функций Функция F1 Функция F2 Рисунок 2.

Слайд 48

Групповое сжатие вещественных чисел

Перегруппировка байт

Сжатие байт стандартной библиотекой zlib

Обнуление младших бит мантиссы

Групповое сжатие вещественных чисел Перегруппировка байт Сжатие байт стандартной библиотекой zlib Обнуление младших бит мантиссы

Слайд 49

Отсечение младших бит мантиссы f=x2+y2+z2

23 106 427 байт

10^9 узлов - 113 354 035 байт – 0.1%

Отсечение младших бит мантиссы f=x2+y2+z2 23 106 427 байт 10^9 узлов -
- 0.92 битa на узел

10^9 узлов:
1000 блоков по 10^6 узлов

3.54 ■ бинарный без компрессии без огрубления

компрессия без огрубления

3.141592
3.14159
3.1415
3.141
3.14

Слайд 50

Огрубление данных

Огрубление данных

Слайд 51

Моделирование процессов охлаждения CPU

Моделирование процессов охлаждения CPU

Слайд 52

CPU

Процессор, охлаждаемый медным радиатором

Мощность 65Вт

10мм

~1.4мм

Толщина
0.3мм

7мм

……

97.5мм, 78 медных пластин

100мм

……

Поток воздуха: T=20C, .004-.005 м3/с

Cu

30x30

CPU Процессор, охлаждаемый медным радиатором Мощность 65Вт 10мм ~1.4мм Толщина 0.3мм 7мм
мм

35мм до границы

Слайд 53

Зависимость эффективности от числа ядер

Конфигурация: 78 тонких ребер (0.3 мм) на радиаторе
Сетка:

Зависимость эффективности от числа ядер Конфигурация: 78 тонких ребер (0.3 мм) на
1000 х 3500 х 150 = 525 млн. Параллельная реализация: MPI + нити (8 нитей на узле)

Слайд 55

Изоповерхности температуры: Т=20.5, 21, 22.5 С сетка 800*700*120=67,2 млн. узлов

Изоповерхности температуры: Т=20.5, 21, 22.5 С сетка 800*700*120=67,2 млн. узлов

Слайд 59

Зависимость коэффициента сжатия от числа усеченных бит

28 244 379 w101_reduced 12.bjn
22 340

Зависимость коэффициента сжатия от числа усеченных бит 28 244 379 w101_reduced 12.bjn
718 w101_reduced 13.bjn
17 228 023 w101_reduced 14.bjn
13 339 249 w101_reduced 15.bjn
5 171 208 w101_reduced 16.bjn
3 321 150 w101_reduced 17.bjn
2 213 949 w101_reduced 18.bjn
1 471 818 w101_reduced 19.bjn
793 457 w101grid.bjn

Сетка: 1000 х 3500 х 150 = 525 млн узлов

Слайд 60

Параллельные библиотеки http://www.imamod.ru

SDLB - динамическая балансировка (0D)
MCoarse - огрубление сеток (2D, 3D)
BjnIOlib

Параллельные библиотеки http://www.imamod.ru SDLB - динамическая балансировка (0D) MCoarse - огрубление сеток
- ввод-вывод регулярных сеток
TMLlib - ввод-вывод неструктурированных сеток
LRND - генерация псевдослучайных чисел
PSORT - параллельная сортировка

Слайд 61

Якобовский М.В.
д.ф.-м.н.,
зав. сектором
«Программного обеспечения многопроцессорных систем и вычислительных сетей»

Якобовский М.В. д.ф.-м.н., зав. сектором «Программного обеспечения многопроцессорных систем и вычислительных сетей»

Института математического моделирования
Российской академии наук
mail: mail: lira@imamod.rumail: lira@imamod.ru
http://lira.imamod.ru
Имя файла: Визуализация-в-распределенных-системах-Институт-математического-моделирования-Российской-академии-наук.pptx
Количество просмотров: 484
Количество скачиваний: 1