Архитектура вычислительных систем

Содержание

Слайд 3

АРХИТЕКТУРА – искусство строить сооружения, неразрывно сочетая решение практических и эстетических задач
АРХИТЕКТУРА

АРХИТЕКТУРА – искусство строить сооружения, неразрывно сочетая решение практических и эстетических задач
ВС - комплекс оптимальных решений, принятых при проектировании ВС в :
структурной и поведенческой организации Аппаратных средств (АО)
системе программирования (СПРГ)
операционной системе (ОС)
СПРГ – совокупность средств автоматизации разработки ПО: компиляторы, трансляторы, интерпретаторы, редакторы, загрузчики, отладчики, тестеры, документаторы, библиотеки
ОС – комплекс программ, обеспечивающий: - Автоматизацию выполнения вычислительных процессов ВС в различных режимах - Монопольном, Пакетной обработки, Разделения времени, Реального времени ... - Автоматизацию распределения ресурсов ВС между вычислительными процессами : . время, память, периферия - Автоматический контроль и защиту вычислительных процессов от взаимовлияний - Автоматический диалог с пользователем - Автоматический обмен с Окружением по фиксированным Интерфейсу и Протоколу
СТРУКТУРА – организация аппаратных средств

Слайд 5

КЛАССИФИКАЦИЯ ПО НАЗНАЧЕНИЮ

СИСТЕМЫ ЗАПРОС-ОТВЕТ - системы оперативного обслуживания (обработки), Для них

КЛАССИФИКАЦИЯ ПО НАЗНАЧЕНИЮ СИСТЕМЫ ЗАПРОС-ОТВЕТ - системы оперативного обслуживания (обработки), Для них
характерно ограничение на среднее время ответа . СИСТЕМЫ РЕАЛЬНОГО ВРЕМЕНИ (RT) - системы с абсолютным ограничением на время ответа СИСТЕМЫ РАЗДЕЛЕНИЯ ВРЕМЕНИ(РВР) - системы коллективного пользования с преимущественным обслуживанием коротких заявок над длинными. СИСТЕМЫ ПАКЕТНОЙ ОБРАБОТКИ (ПО) - системы обслуживания пакета заданий с высоким коэффициентом загрузки аппаратных средств и минимальным временем обслуживания пакета

Слайд 6

КЛАССИФИКАЦИЯ ВС ПОТОКАМ ПК\ПД (Flynn)

КЛАССИФИКАЦИЯ ВС ПОТОКАМ ПК\ПД (Flynn)

Слайд 7

КЛАССЫ КЛАССИФИКАЦИИ ПО ПОТОКАМ

SISD – фон-Неймановская архитектура: каждая команда арифметической обработки инициирует

КЛАССЫ КЛАССИФИКАЦИИ ПО ПОТОКАМ SISD – фон-Неймановская архитектура: каждая команда арифметической обработки
выполнение одной арифметической операции: ► Единое вычислительное устройство из ПРЦ, ОП, последовательного УУ ► Линейная структура адресации памяти (ОП – вектор слов) ► Низкий уровень машинного языка – отсутствие типов слов
SIMD – векторная архитектура: ► Векторная команда обеспечивает одновременное выполнение операций в нескольких (m) арифметических ПРЦ ► ОП должна быть либо в m раз скорее, либо расслоена (разделена) на m секций с независимым доступом
MISD – конвейерная архитектура: ► Обеспечивает одновременное выполнение множества операций одной формулы, связанных по промежуточным результатам ► Одновременное выполнение множества операций не связанных промежуточными результатами и принадлежащих либо разным формулам, либо независимо вычисляемым фрагментам одной формулы
MIMD – архитектура многопроцессорной матрицы

Слайд 8

КЛАССИФИКАЦИЯ ВС ПОТОКАМ ПК\ПД (Flynn)

Time

е (ai*bi)

i=1..4

КЛАССИФИКАЦИЯ ВС ПОТОКАМ ПК\ПД (Flynn) Time е (ai*bi) i=1..4

Слайд 9

КЛАССИФИКАЦИЯ ШОРА

КЛАССИФИКАЦИЯ ШОРА

Слайд 10

КЛАССЫ КЛАССИФИКАЦИИ ШОРА

I – обычная ВМ с последовательной обработкой слов и параллельной

КЛАССЫ КЛАССИФИКАЦИИ ШОРА I – обычная ВМ с последовательной обработкой слов и
обработкой разрядов слов (считывание данных – параллельная выборка всех разрядов слова)
II – система с параллельной обработкой слов и последовательной обработкой разрядов в ассоциативном (вертикальном) ПРЦ за одну команду осуществляет параллельную обработку 1 разряда всех слов ОП (или разрядного среза). За счет этого поразрядно осуществляется параллельный поиск или обработка всех слов ОП одновременно. Адресация и выбор данных осуществляется по разрядам, выделенным маской и удовлетворяющим отношению из множества { = ≠ < ≤ > ≥ min max} Достигается высокая скорость выполнения логических операций и их последовательностей, скорость выполнения арифметических операций ниже, чем в I.
III - ортогональная система объединяет преимущества машин I и II. Обеспечивается эффективный поиск данных при обработке разрядных срезов в вертикальном ПРЦ и эффективная обработка найденных слов в горизонтальном ПРЦ

Слайд 11

КЛАССИФИКАЦИЯ ШОРА

КЛАССИФИКАЦИЯ ШОРА

Слайд 12

КЛАССЫ КЛАССИФИКАЦИИ ШОРА

IV – ансамбль ПРЦ получается путем интеграции модулей машины I

КЛАССЫ КЛАССИФИКАЦИИ ШОРА IV – ансамбль ПРЦ получается путем интеграции модулей машины
в единую вычислительную структуру с общей шиной. Эта структура эффективна для обработки векторов, но по сравнению с машиной I скорость обработки << lg2M
V – матричная структура, получается введением наряду с ОШ прямых связей между соседними ПРЦ. Структура эффективна для обработки векторов и матриц, по сравнению с машиной I скорость обработки ~ lg2M
VI – объединяет логическую обработку с ассоциативным поиском прямо в ОП, поскольку в матричной ОП содержатся элементы логической обработки, которые осуществляют логические операции на проходе при доступе к ячейкам ОП

Слайд 13

КЛАССИФИКАЦИЯ ПО СТЕПЕНИ ПАРАЛЛЕЛИЗМА ОБРАБОТКИ

1

2

3

4

5

6

7

I-Обычн.ПРЦ II-Одноразр.ПРЦ III-Ансамбль ПРЦ IV-Матричная сист. V-Ассоциативн. сист. НС,ВС- Низкая (высокая) связность ОР,НР- Однородность, неоднородность

КЛАССИФИКАЦИЯ ПО СТЕПЕНИ ПАРАЛЛЕЛИЗМА ОБРАБОТКИ 1 2 3 4 5 6 7

УР. СВЯЗИ: КН - КАНАЛ-КАНАЛ ПМ - ПАМЯТЬ-ПАМЯТЬ ПР - ПРОЦЕССОР-ПРОЦЕССОР

УР.СВЯЗИ: ОШ - ОБЩ.ШИНА-ОШ МШ - МНОГОШИН-МШ ПК - ПЕРЕКР.СВЯЗИ (МАТР.КОМ)

Слайд 14

Закон Гроша: Производительность и стоимость ВС связаны квадратичным законом: p ~ C2

C/p

1990

2000

Закон

Закон Гроша: Производительность и стоимость ВС связаны квадратичным законом: p ~ C2
Мура – Вычислительная мощность за данную цену удваивается каждые 18 месяцев
Общая оценка ВС – Производительность/Стоимость или Стоимость единицы производительности

Стоимость единицы производительности со временем падает Стоимость единицы производительности мощной ВМ всегда дешевле менее мощной для машин одного класса (сервера, рабочие станции, notebook)

ЗАКОНЫ ПРОИЗВОДИТЕЛЬНОСТИ

“Как бы ни старались разработчики HW, разработчики SW всегда сведут их усилия на нет. И это не предел.” Д.Платт

2010

Слайд 15

ЗАКОНЫ ПАРАЛЛЕЛЬНОЙ АРХИТЕКТУРЫ

1. Параллельная ВС имеет более высокую производительность, чем последовательная при

ЗАКОНЫ ПАРАЛЛЕЛЬНОЙ АРХИТЕКТУРЫ 1. Параллельная ВС имеет более высокую производительность, чем последовательная
одинаковой стоимости. 2. Соотношение Стоимость/Производительность при одной и той же производительности всегда выше у последовательной ВС, чем у параллельной

3. Наращиваемость и расширяемость многомашинной архитектуры всегда выше за счет модульности и простого подключения дополнительных процессоров 4. Отказоустойчивость многомашинной архитектуры выше за счет рекофигурации и восстанавливаемости
Закон Джина Амдала – Любой поддающийся распараллеливанию процесс содержит часть, которая выполняется параллельно, и часть, которая выполняется последовательно. Если последовательная часть составляет долю Х, то на бесконечном числе процессоров максимальное распараллеливание ограничено 1/Х При доле 0.1 распараллеливание не больше, чем 10. Но на больших задачах, где доля последовательных компонент << параллельных, это ограничение влияет слабо.

Слайд 16

ЗАКОНЫ ПАРАЛЛЕЛЬНОЙ АРХИТЕКТУРЫ

Закон Джина Амдала в более точной формулировке:
P=N/(X*N+1-X), где X – последовательная

ЗАКОНЫ ПАРАЛЛЕЛЬНОЙ АРХИТЕКТУРЫ Закон Джина Амдала в более точной формулировке: P=N/(X*N+1-X), где
часть вычислений, N – число обработчиков (процессоров), P – степень распараллеливания.

Слайд 17

КЛАССИФИКАЦИЯ СВЯЗЕЙ МЕЖДУ ЭЛЕМЕНТАМИ ММА

КЛАССИФИКАЦИЯ СВЯЗЕЙ МЕЖДУ ЭЛЕМЕНТАМИ ММА

Слайд 18

КЛАССИФИКАЦИЯ СВЯЗЕЙ МЕЖДУ ЭЛЕМЕНТАМИ ММА

КЛАССИФИКАЦИЯ СВЯЗЕЙ МЕЖДУ ЭЛЕМЕНТАМИ ММА

Слайд 19

ЧТО ПОСЛЕ СУПЕРСКАЛЯРНОЙ АРХИТЕКТУРЫ

Суперскалярная архитектура обеспечивает параллелизм для традиционных последовательностей операций. Как

ЧТО ПОСЛЕ СУПЕРСКАЛЯРНОЙ АРХИТЕКТУРЫ Суперскалярная архитектура обеспечивает параллелизм для традиционных последовательностей операций.
ее улучшить: 1. Снять зависимость от избыточных обращений к памяти при промежуточных вычислениях Ю вести вычисления в регистрах (от 10 Рг Ю 100-1000 Рг ) 2. Вычислять статически адреса a, b, c и сохранять их в стеке данных 3. Предсказывать переходы и заранее считывать программу и данные 4. Вычислять все ветки альтернатив и отбрасывать несостоявшиеся при вычислении условия(спекулятивные вычисления) 5. Подготовку всех статических вычислений поручить транслятору, а динамику вычислять аппаратно с использованием тегов.

(2)

(4)

выбор

... выбор

7
5
3
1

Загр. (в слоях конв.)

50 100 Степень векторизации(%)

Чист.RISC 0,6 - 1,6 SuperScalar 1 - 2 VectorPipe 0,6 - 4 WLIW 3 - 12

Средн.загр в 5 раза выше SuperScalar

(5)

Имя файла: Архитектура-вычислительных-систем-.pptx
Количество просмотров: 158
Количество скачиваний: 0