Современные микропроцессоры

Содержание

Слайд 2

Рассматриваемые процессоры

Intel Itanium 2
Intel Core 2 Duo
IBM Cell

Рассматриваемые процессоры Intel Itanium 2 Intel Core 2 Duo IBM Cell

Слайд 3

Неявный и явный параллелизмы

Неявный и явный параллелизмы

Слайд 4

Блок-схема процессора Itanium 2

Блок-схема процессора Itanium 2

Слайд 5

Исполнительные устройства

Исполнительные устройства

Слайд 6

Конвейер Itanium 2

Основной конвейер 8 стадий

Конвейер Itanium 2 Основной конвейер 8 стадий

Слайд 7

Регистровый файл

128 целочисленных регистров
128 регистров с плавающей запятой
64 предикатных регистра
128 регистров приложений
Register

Регистровый файл 128 целочисленных регистров 128 регистров с плавающей запятой 64 предикатных
Stack Engine

Слайд 8

Связка

3 инструкции + шаблон
Объединяются в группы без RAW зависимостей

Связка 3 инструкции + шаблон Объединяются в группы без RAW зависимостей

Слайд 9

Структура кода

Структура кода

Слайд 10

Предикатные регистры

Предикатные регистры

Слайд 11

Программно-конвейеризуемые циклы

Аппаратная поддрежка SWP-циклов
Стадии пролога и эпилога
Вращение регистров
Предикаты

Программно-конвейеризуемые циклы Аппаратная поддрежка SWP-циклов Стадии пролога и эпилога Вращение регистров Предикаты

Слайд 12

Спекуляция по данным

Спекуляция по данным

Слайд 13

Технические характеристики Itanium 2

L1 DCache 16K 4-way
L1 ICache 16K 4-way
L2 Cache 256K

Технические характеристики Itanium 2 L1 DCache 16K 4-way L1 ICache 16K 4-way
8-way
L3 Cache 6M 12-way
Устройства
6 Integer
4 Load/Store
2 FP
6 Multimedia
4 Branch

Слайд 14

Core 2 Duo

Core 2 Duo

Слайд 15

Core 2 Duo

Двухъядерная 64-битная архитектура
За основу ядра взято ядро Pentium Pro
Широкое динамическое

Core 2 Duo Двухъядерная 64-битная архитектура За основу ядра взято ядро Pentium
исполнение
Разделяемый КЭШ 2го уровня
Поддержка мультимедиа
Micro-ops fusion и Macrofusion
Энергосберегательная система

Слайд 18

Разделяемый КЭШ 2го уровня

Нет необходимости поддерживать когерентность
Динамически распределяется между ядрами

Разделяемый КЭШ 2го уровня Нет необходимости поддерживать когерентность Динамически распределяется между ядрами

Слайд 19

Smart Memory Access

6 Блоков предвыборки
2 для КЭШа 2го уровня
По 2 для КЭШей

Smart Memory Access 6 Блоков предвыборки 2 для КЭШа 2го уровня По
1го уровня
Memory Disambiguation
Спекуляция по данным (RAW зависимость)

Слайд 22

Технические характеристики Core 2 Duo

L1 DCache 32K 8-way
L1 ICache 32K 8-way
L2 Cache

Технические характеристики Core 2 Duo L1 DCache 32K 8-way L1 ICache 32K
4M / 2 Cores
ITLB 128 ent
DTLB 256 ent
Устройства
5 Integer 3 ALU + 2 AGU
2 Load/Store (1 Load + 1 Store)
4 FP (FADD + FMUL + FLOAD + FSTORE)
3 SSE (128 bit)

Слайд 24

Cell

Главный процессорный элемент
Упорядоченное исполнение
Поддержка работы с двумя потоками
8 синергетических процессорных элементов
Ядро на

Cell Главный процессорный элемент Упорядоченное исполнение Поддержка работы с двумя потоками 8
основе 286 архитектуры
Поддержка векторных вычислений 128 бит
Отсутствие КЭШей
Локальная память 256 Кбайт с прямым доступом
Шина ввода вывода
Пропускная способность 76,8 Гбайт/с

Слайд 25

Шина взаимосвязанных элементов

Передает 96 байт/цикл
Более 100 уникальных запросов

Шина взаимосвязанных элементов Передает 96 байт/цикл Более 100 уникальных запросов

Слайд 26

Power Processor Element

Два 64-битных ядра на основе архитектуры POWER
Упорядоченное исполнение комманд
Поддержка SMT

Power Processor Element Два 64-битных ядра на основе архитектуры POWER Упорядоченное исполнение
(многопоточность)
КЭШ
1го уровня: 32+32 Кбайт
2го уровня: 512 Кбайт

Слайд 27

Synergistic Processor Element

4 целочисленных векторных устройства
4 векторных устройства с плавающей запятой
128

Synergistic Processor Element 4 целочисленных векторных устройства 4 векторных устройства с плавающей
регистров по 128 бит
256 Кбайт локальной памяти
Динамическая защита доступа к памяти

Слайд 28

Производительность Cell (для 4GHz)

256 GFLOPS с плавающей запятой
256 GOPS целочисленная арифметика
25 GFLOPS с

Производительность Cell (для 4GHz) 256 GFLOPS с плавающей запятой 256 GOPS целочисленная
плавающей запятой двойной точности
Имя файла: Современные-микропроцессоры.pptx
Количество просмотров: 285
Количество скачиваний: 3