Реферат: Разработка межкластерного коммутатора для организации многопроцессорного вычислительного комплекса на базе процессора «эльбрус-3S»
РАЗРАБОТКА МЕЖКЛАСТЕРНОГО КОММУТАТОРА ДЛЯ ОРГАНИЗАЦИИ
МНОГОПРОЦЕССОРНОГО ВЫЧИСЛИТЕЛЬНОГО КОМПЛЕКСА
НА БАЗЕ ПРОЦЕССОРА «ЭЛЬБРУС-3S»
Шерстнёв А.Е.
Научный руководитель: проф., д.т.н. Сахин Ю.Х.
ОАО "Институт электронных управляющих машин"
119991, Москва, ул. Вавилова, 24,
Е-mail: andrewsh@mcst.ru
«Эльбрус-3S» − это проектируемый ЗАО «МЦСТ» многопроцессорный вычислительный комплекс, каждый процессорный модуль которого представляет собой систему-на-кристалле (System-on-Chip, SOC). На одном кристалле размещаются процессор и оборудование распределённой интерфейсной логики (chipset) − «северного моста». При помощи высокоскоростных последовательных каналов межпроцессорного обмена от двух до четырёх процессоров могут быть объединены в когерентную систему. Каналы связывают каждый процессор со всеми остальными. Система не имеет общего контроллера памяти, на одном кристалле с каждым процессором интегрирован собственный контроллер, работающий с подключенной к процессору памятью. Таким образом, «Эльбрус-3S» является системой с неоднородным доступом в память (NUMA). Когерентность при доступе в память в NUMA-системе «Эльбрус-3S» поддерживается на аппаратном уровне при помощи техники снупирования. Это означает, что при каждом обращении процессора в память формируются запросы проверки когерентности, направляемые в контроллер кэша каждого процессора.
Разработанный протокол межпроцессорного обмена ориентирован на эффективное взаимодействие процессоров внутри кластера, включающего не более четырёх процессорных модулей.
Организация многопроцессорной системы (более 4 процессоров) требует использования дополнительного компонента для связи 4-процессорных кластеров между собой - контроллера межкластерного обмена (КМО). КМО в каждом кластере встраивается в разрыв межпроцессорных каналов и служит для передачи данных между кластерами. На рис. 1 представлена 16-процессорная система, использующая КМО.
Рис. 1. 4 кластера, объединённых посредством КМО (ICS - Inter Cluster Switch)
Текущая версия КМО допускает построение серверов среднего уровня с максимальным числом процессоров 16.
Поскольку протокол нижнего («кластерного») уровня основан на полном и безусловном снупировании соседних процессоров, увеличение числа процессоров приводит к проблеме увеличения количества запросов проверки
когерентности и, как следствие, росту величины задержки доступа к данным и падению эффективной пропускной способности каналов межпроцессорного обмена. В качестве решения данной проблемы без усложнения логики процессорного модуля и без изменений протокола межпроцессорного обмена предлагается сократить число запросов проверки когерентности путём оптимизации работы КМО. Для этого в КМО, помимо коммутирующей логики, вводятся два устройства: фильтр и справочник.
Фильтр оптимизирует доступ к удалённой памяти, т.е. памяти, обслуживаемой в других кластерах, справочник - к локальной. Фильтр отслеживает состояние кэш-строк удалённых процессоров, а также содержит идентификатор процессора-владельца, если данные кэшированы.
Справочник служит для слежения за локальной памятью. В нём содержится информация о том, есть ли данные из памяти, принадлежащей кластеру, в кэше процессоров из удалённых кластеров.
Если после проверки оказывается, что данные не кэшированы в удалённых процессорах, это позволяет не выдавать запросы проверки когерентности за пределы кластера. Если же данные есть в кэшах одного или нескольких процессоров из других кластеров, а локальный процессор-запросчик собирается производить модификацию данных по этому адресу, во все удалённые кластеры, содержащие эти данные, направляются сообщения о инвалидировании рассматриваемого адреса. Справочник можно реализовать одним из двух способов:
^ Полный справочник, хранящий информацию о каждой строке памяти.
Справочник такого типа должен быть принадлежностью контроллера памяти, а
значит требует доработки контроллера памяти и логики распределённого
чипсета.
^ Усечённый справочник хранит информацию только о кэшированных
строках. Усечённый справочник организуется в виде кэш-памяти и может быть
выделен в обособленный модуль, реализуемый в отдельном чипе.
После анализа преимуществ и недостатков справочников двух типов для системы «Эльбрус-3S» был сделан выбор в пользу усечённого справочника. Элемент справочника имеется для каждой строки локальной памяти кластера, взятой в удалённые кластеры. Справочник организован в виде множественно-ассоциативной кэш-памяти с числом колонок не менее их суммарного числа во всех процессорах удалённых кластеров (48).
Таким образом, в случае обработки локальных данных, на что и ориентирована архитектура NUMA, применение фильтра и справочника в КМО позволяет полностью исключить пересылку между кластерами ненужных запросов (как первичных запросов, так и запросов проверки когерентности), что значительно повышает эффективность многокластерных серверов.
Дальнейшие разработки по данному направлению связаны с созданием распределённого КМО и его занесения внутрь процессорного модуля для сокращения числа компонентов, необходимых для создания многопроцессорных систем.
еще рефераты
Еще работы по разное
Реферат по разное
Тема: Классификация вычислительных систем
18 Сентября 2013
Реферат по разное
Классификация вычислительных систем
18 Сентября 2013
Реферат по разное
Отправление поездом из Санкт-Петербурга до Москвы вечером, с Московского вокзала. Ночь в поезде
18 Сентября 2013
Реферат по разное
Реализация алгоритмов решения задач газовой динамики на многопроцессорных вычислительных системах
18 Сентября 2013