Содержание
- 2. Цель и область применения Область применения – серверы на базе микропроцессоров Эльбрус/МЦСТ-XR В серверах среднего уровня
- 3. Основные цели Для систем с числом процессоров более 4-х надо 1. Рассмотреть варианты протокола когерентности: с
- 4. Построение системы с16-ю процессорами Чип_КК использует существующий протокол когерентности для взаимодействия с процессорами кластера Для взаимодействия
- 5. Основные положения Чип-КК расширяет возможности построения систем до 4-х кластеров Для быстрого доступа к удаленным данным
- 6. Протокол MOESI Состояния: I – Invalid – нет данных; E – Exclusive – данные есть только
- 7. Способы решения проблемы пропускной способности в линках 1. Фильтр исключает обращения за пределы кластера для данных
- 8. Cостояния строки в фильтре Состояния: I – Invalid – нет данных; S_G - Shared_global – данные
- 9. Автомат состояний фильтра
- 10. Время доступа к локальной памяти с использованием справочника Справочник отслеживает состояния строк локальной памяти кластера Для
- 11. Состояния строки в справочнике Состояния: I – Invalid – нет данных; S - Shared – данные
- 12. Время доступа к удаленной памяти с использованием фильтра Фильтр отслеживает состояния строк удаленной памяти внутри данного
- 13. кластер с 4-мя процессорами
- 14. 1-ая стадия: Запрос Read_64 в HOME-узел HOME-узел Запросчик
- 15. HOME-узел 2-ая стадия: Выдача Snoop-запросов
- 16. HOME-узел 3-я стадия: сбор Snoop-ответов
- 17. 4-ая стадия: Сообщение о завершении операции HOME-узел Запросчик
- 18. Особенности существующего протокола когерентности Snoop-based – т.е. используется опрос кеш -памяти всех процессоров системы Требует минимального
- 19. Локальность ресурсов процесса Ресурсы процесса включают: процессор(ы) память Варианты локальности: процессор обращается только к памяти “своего”
- 20. Что предлагается Для а) уменьшения времени доступа к данным памяти и б) исключения непроизводительных потерь пропускной
- 21. Полный справочник – имеет информацию о каждой строке памяти Усеченный справочник - имеет информацию не о
- 22. Организация справочника (Directory) Элемент справочника имеется для каждой строки локальной памяти, взятой в удаленные кластеры Справочник
- 23. Организация справочника (Directory) (продолжение) Структура элемента справочника(MOESI протокол): - состояние строки данных (2бита); - указатель на
- 24. Организация фильтра (Filter) Элемент фильтра имеется для каждой строки памяти, взятой из удаленных кластеров Состояние строки
- 25. Организация фильтра (Filter) (продолжение) Структура элемента фильтра (модифицированный MOESI протокол): - состояние строки данных (2/3 бита);
- 26. Аппаратные затраты на справочник и фильтр СПРАВОЧНИК Число строк в процессорах удаленных кластеров: [2М/64(байта в строке)]
- 27. Возможности встроенной памяти в ALTERA Stratix FPGA Family StratixIII FPGA Family – 65nm process M9K Memory
- 28. Возможности IO в ALTERA StratixIV FPGA Family User I/O - 904 Full-Duplex LVDS(Receive/Transmit) – 98 Medium
- 29. Особенность Эльбрус/МЦСТ-ХR NUMA архитектуры с учетом добавляемых аппаратных средств: справочника (directory) и фильтра для строк данных,
- 30. Read_64 операция в 16-ти процессорной системе Передача Запроса Read_64 от Запросчика(REQ) в Home – 3 пакета
- 31. 16-процессорная система
- 32. Read_64 операция в 16-ти процессорной системе(1 из 5)
- 33. Read_64 операция в 16-ти процессорной системе(2 из 5)
- 34. Read_64 операция в 16-ти процессорной системе(3 из 5)
- 35. Read_64 операция в 16-ти процессорной системе(4 из 5)
- 36. Read_64 операция в 16-ти процессорной системе(5 из 5)
- 37. Расширение аппаратной поддержки когерентности на 64-х процессорный вариант СПРАВОЧНИК Число строк в процессорах удаленных кластеров: [2М/64(байта
- 38. Расширение аппаратной поддержки когерентности на 64-х процессорный вариант
- 39. Расширение аппаратной поддержки когерентности на 64-х процессорный вариант(прогноз для 32nm)
- 40. Расширение аппаратной поддержки когерентности на 64-х процессорный вариант Вариант с поддержкой справочника на внешней памяти, подключаемой
- 41. Расширение аппаратной поддержки когерентности на 64-х процессорный вариант ВЫВОД: прогресс в области FPGA не позволяет рассчитывать
- 46. Открытые вопросы Работа с Е состоянием (м.б. изменения в процессоре!?) Обеспечение надежности 16-ти процессорной системы –
- 47. 3-х процессорный модуль
- 48. 16-процессорная система с избыточностью (18 процессоров)
- 50. Скачать презентацию