Реферат: Концепция 7 1 Описание алгоритма в виде «триад» 7 2 Принципы построения процессора 10
Мультиклеточные процессоры
(концепция)
Рынок информационных технологий, общий объем которого составляет триллионы долларов, прямо или косвенно зависит от архитектуры процессора.
С момента создания первого компьютера на этом рынке абсолютно доминирует фон-неймановская архитектура. Но, по мнению экспертного сообщества, эпоха этой архитектуры завершается. Динамика развития рынка требует качественно новой (пост-неймановской) архитектуры, способной на десятилетия определить дальнейшее направление создания микропроцессоров.
^ Вывод такой архитектуры на рынок создает реальную возможность занятия лидирующих позиций.
Исследования процессорных архитектур, проведенные в ООО «УралАрхЛаб», показывают, что такое пост-неймановское направление всего одно(!) – это создание процессоров с контекстно-зависимой программой. Только они могут решить как существующие проблемы, так и перспективные задачи компьютерной индустрии.
Разработка, при поддержке Фонда «Инновационые технологии», первого мультиклеточного процессора с контекстно-зависимой программой MCp0402100100 подтвердила реализуемость и правильность выбранного направления.
Разноплановость и качественный состав преимуществ предлагаемой архитектуры, позволяют позиционировать ее как принципиально новое и высокоэффективное пост-неймановское направление развития микропроцессорной техники.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ 4
1 КОНЦЕПЦИЯ 7
1.1 Описание алгоритма в виде «триад» 7
1.2 Принципы построения процессора 10
2 АРХИТЕКТУРА 12
2.1 Схема мультиклеточного процессора 12
2.2 Исполнение программы 13
2.3 Архитектурные особенности 15
ЗАКЛЮЧЕНИЕ 19
Приложение 1 20
ВВЕДЕНИЕ
«Фон-неймановская» эпоха в компьютерной индустрии завершается. В International Technology Roadmap for Semiconductors (ITRS) отмечается, что эволюционное развитие, доминирующей последние шестьдесят лет на рынке фон-неймановской модели процессора, сходит на нет [htpp://itrs.net/Links/2005ITRS/Sys Drivers2005.pdf].
Ретроспективный анализ этого пути показывает, что каждый очередной шаг в совершенствовании фон-неймановской архитектуры требовал все больше усилий и давал все меньшую отдачу.
Учитывая роль архитектуры, создавшуюся ситуацию можно рассматривать как очередную точку бифуркации в развитии компьютерной индустрии. Выход из нее – это поиск качественно нового, пост-неймановского направления развития процессорных архитектур.
На данный момент, в качестве основного архитектурного направления, ведущими производителями процессоров предлагается многоядерность. Но, это решение не может рассматриваться как начало пост-неймановской эпохи. Это экстенсивное и поэтому временное направление развития все той же фон-неймановской модели. Многоядерность не является качественно новым шагом и не решает существующих проблем компьютерной индустрии.
Начиная с первых вычислительных машин, основной тенденцией развития фон-неймановской архитектуры было увеличение уровня параллелизма при выполнении потока команд. Это стремление неразрывно связано с попытками ослабить или обойти ключевой принцип фон-неймановской архитектуры, а именно, упорядоченное, последовательное размещение команд в программе и их исполнение в порядке размещения. Так, например, конвейер – это частичное совмещение исполнения нескольких команд во времени. Суперскалярная организация процессоров и VLIW-процессоры – это совмещение исполнения нескольких команд не только во времени, но и в пространстве.
Требование упорядоченного размещения и исполнения команд – необходимое условие реализации опосредованной формы информационных связей между командами, которая используется в фон-неймановской архитектуре. А именно, результат выполнения любой очередной команды отчуждается, т.е. записывается в общедоступную память машины (регистры, ЗУ), и только после этого он доступен (виден) программисту и может использоваться им в качестве операнда для последующих команд.
Наиболее известные попытки уйти от опосредованной формы и, таким образом, обеспечить «естественную» реализацию параллелизма – это потоковые и редукционные машины, использующие не опосредованное, а явное задание информационных связей между командами.
Так, в потоковой машине адрес команды, потребителя результата выполнения другой команды, задается непосредственно в командном слове команды-источника этого результата. После выполнения команды-источника результат записывается непосредственно в поле операнда команды-потребителя и становится ее частью.
В редукционной машине адрес команды-источника задается в командном слове команды-потребителя, что также обеспечивает непосредственную передачу и использование результата.
Информационные связи в обеих машинах определяют порядок исполнения. В итоге, оно становится неупорядоченным – «по готовности» или «по запросу». Это обстоятельство, противоречит модели вычислений используемой в наиболее распространенных императивных языках высокого уровня.
Как известно, модель вычислений в императивных языках высокого уровня – это выполнение упорядоченной последовательности операторов. Каждый оператор представляет собой неделимую и целостную языковую конструкцию, описывающую процесс преобразования данных. Порядок выполнения операций внутри оператора задается путем их ранжирования и расстановки скобок, т.е. указанием информационных связей между операциями. Промежуточные результаты вычислений внутри оператора не отчуждаются и программисту не видны. Отчуждается и виден только результат выполнения оператора. Следовательно, для абстрактной машины, непосредственно реализующий некоторый язык высокого уровня, оператор языка является командой.
Исходное множество операций любого алгоритмического языка изначально зафиксировано и конечно. Множество операторов, которые теоретически могут быть сконструированы с использованием данных операций — потенциально бесконечно и, соответственно, машина с архитектурой, непосредственно реализующей язык высокого уровня, не имеет фиксированной системы команд.
Подобная архитектура лежит в основе принципиально нового направления построения процессоров – мультиклеточных процессоров, качественные и количественные характеристики которых позволяют говорить о появлении нового пост-неймановского поколения и которые были подтверждены разработкой первого мультиклеточного процессора MCp0402100100.
^ 1 КОНЦЕПЦИЯ
1.1 Описание алгоритма в виде «триад»
Любую формулу, например, приведенную на рисунке 1.1(а), можно представить в виде ярусно-параллельной формы так, как показано на рисунке 1.1(б).
(а) (б)
Рисунок 1.1 - Ярусно-параллельное представление формулы: формула(а); ярусно-параллельная форма(б).
Пронумеруем последовательно все узлы ярусно-параллельной формы приведенной на рисунке 1.1(б) каким-либо образом, например, слева направо и сверху вниз. Идентификаторы переменных, если их значения используются другими операциями, будем рассматривать как операции чтения данных переменных. Если идентификатор фиксирует результат выполнения операции, то его будем рассматривать как операцию записи данной переменой. Запишем выполняемые операции в порядке номеров. В качестве операндов выполняемой операции укажем номера операций, результаты исполнения которых являются ее аргументами.
Номер
oc
op1
op2
0
1
2
3
4
5
6
7
8
9
10
RD
RD
RD
+
RD
-
RD
*
/
+
WR
a
b
c
0
e
0
f
3
5
7
9
1
2
4
6
8
g
Рисунок 1.2 - Описание ЯПФ в виде «триад»
Данное описание, показанное на рисунке 1.2, аналогично промежуточному представлению программы в виде «триад», используемому в процессе компиляции программ, написанных на языках высокого уровня. От классической формы этого представления оно отличается использованием операций чтения и записи и ссылок на эти операции вместо непосредственного использования идентификаторов (ссылок на таблицу идентификаторов). Таким образом, его можно рассматривать как машинно-адаптированную форму исходной программы написанной на языке высокого уровня.
Программа в этом виде представляется пронумерованной последовательностью триад, которая делится на участки. Каждый участок соответствует, как правило, одному оператору программы и содержит подмножество триад, реализующее этот оператор. Очередность записи участков соответствует очередности записи операторов в программе. Каждая триада описывает выполнение некоторой операции над операндами, заданными идентификаторами или ссылками. Ссылка является номером триады, результат выполнения которой используется в качестве операнда, т.е. ссылка явно задает информационную связь между операциями. При этом результаты триад передаваемые по ссылке не отчуждаются.
Так как информационный обмен между операторами опосредован и осуществляется через отчуждение результатов, то подмножество триад реализующих оператор замкнуто. Оно не имеет ссылок на триады других операторов и триады других операторов не ссылаются на триады данного подмножества. Вне своего подмножества конкретная триада смысла не имеет и, следовательно, не может считаться командой, т.е. информационным сообщением, определяющим действия исполнительного устройства и обладающим целостностью и неделимостью (см. приложение 1). Триада обладает неделимостью, но не обладает целостностью.
Любая триада имеет смысл и может быть выполнена только в определенном контексте. А именно, только после выполнения триад, результаты которых она использует и до тех триад, которые используют ее результаты, т.е. только в составе своего подмножества. Следовательно, программа образованная последовательностью триад является контекстно-зависимой.
Для сравнения, выполнение любой команды в фон-неймановском или потоковом процессоре не зависит от контекста. Программа данных процессоров — контекстно-свободна. Все команды этих процессоров обладают неделимостью и целостностью. Группа команд реализующая оператор обладает целостностью, но не обладает неделимостью.
В общем случае триады оператора могут быть размещены на участке произвольным образом. Их размещение, в отличие от фон-неймановской архитектуры, не определяет порядок исполнения. Очередность их исполнения определяется, как уже отмечалось, информационными связями.
Таким образом, если программа в фон-неймановском процессоре однозначно определяет «что» и «как» надо сделать, то программа, представленная в виде триад однозначно определяет только «что» надо сделать. «Как» надо сделать — решается процессором. И, именно это обстоятельство, дает необходимую степень свободы, которая обеспечивает получение качественно новых и улучшение количественных характеристик процессора.
^ 1.2 Принципы построения процессора
Очевидно, что архитектура процессора способного выполнить программный текст на языке «триад» должна принципиально отличаться от всех известных фон-неймановской и не-фон-неймановских (потоковая и редукционная) архитектур.
Так, во-первых, отличен способ описания информационных связей между операциями и, следовательно, будет отличен способ их реализации. Если в фон-неймановской модели информационные связи между командами (операциями) явно не описываются и реализуются опосредованно, через память (регистры общего назначения, ЗУ), то на языке «триад» они задаются явно, указанием информационных связей между командами. При этом, в отличие от не-фон-неймановских моделей способ задания носит не адресный, а выборочный характер. Результат команды не посылается конкретному потребителю (потоковые процессоры) и не указывается конкретная команда для получения результата (редукционные процессоры), а потребители сами должны выбирать требуемые им результаты из общего потока результатов, который формируется не по заявкам, а императивно, путем выборки и исполнения всех команд линейного участка. Следовательно, архитектура процессора должна иметь механизм идентификации получаемых результатов и интеллектуальную коммутационную среду, обеспечивающую не только широковещательную рассылку всех результатов, но и отбор необходимых результатов для конкретных операций.
Во-вторых, отличен и сам этот процесс. Если потоковые и редукционные процессоры имеют неупорядоченную выборку и исполнение команд, «по готовности» данных или «по запросу» результата, соответственно, то язык «триад» предполагает последовательную выборку команд линейного участка и исполнение их не только «по готовности» данных, но и «по готовности» потребителей результатов. А именно, выбранная команда не может быть выполнена до тех пор пока не будут получены все операнды (готовность данных) и пока не будут выбраны все команды использующие ее результат (готовность потребителей). Такой подход к исполнению последовательно выбираемых команд связан с их неупорядоченностью.
Неопределенность временного интервала с момента выборки и до момента исполнения команды предполагает использование механизмов буферизации команд, обеспечивающих хранение выбранной команды, комплектование ее операндами, отобранными из потока результатов и выдачу ее на исполнение после выборки всех потребителей ее результата.
^ 2 АРХИТЕКТУРА
2.1 Схема мультиклеточного процессора
Рассмотрим параллельную систему показанную на рисунке 2.1 и состоящую из N процессорных блоков PU_0, PU_1, …, PU_n-1 связанных между собой однонаправленным коммутатором(SB) типа «каждый с каждым», имеющим N информационных входов и 2N информационных выходов, а также 2N адресных входов.
Рисунок 2.1 — Концептуальная схема процессора
Предположим, что система содержит четыре процессорных блока (клетки). Разместим рассматриваемую последовательность команд в РМ процессорных блоков, начиная с нулевого PU так, как показано на рисунке 2.2. Каждой триаде сопоставим индивидуальный тег (адреса и значения тегов приведены для 0-го PU).
Адрес
Тег
PM_0
PM_1
PM_2
PM_3
A+0
A+4
A+8
t+0
t+4
t+8
RD a
RD e
/ 5,6
RD b
- 0,2
+ 7,8
RD c
RD f
WR 9,a
+ 0,1
* 3,4
Рисунок 2.2 - Размещение программы в памяти программ процессорных блоков
Для того, чтобы обеспечить параллельное выполнение данной программы функциональными блоками процессора, структура которого приведена на рисунке 2.1, необходимо:
обеспечить согласованную (когерентную) выборку команд находящихся в одной строке;
организовать процесс динамического формирования значений тегов таким образом, чтобы он учитывал количество функциональных блоков осуществляющих выборку команд и их относительные номера.
^ 2.2 Исполнение программы
Процесс выборки командных слов инициализируется передачей управления на линейный участок. Он начинается с выборки первой команды линейного участка из памяти программ (PM) и продолжается до выборки последней команды. При этом выполняются следующие действия.
Для каждой выбранной команды динамически формируется значение тега. Оно равно сумме последнего использованного значения тега при выборке команд и количества функциональных блоков. Значение тега ссылки рассчитывается как сумма начального значения тега на данном линейном участке и номера ссылки. Значение тега в процессе выборки команд изменяется циклически. Его максимальная величина определяется емкостью буфера.
Команда записывается в свободную строку буфера. Если команда содержит значение аргумента непосредственно в командном слове, например, адрес переменной находящейся в памяти данных (DM), то это значение также переписывается в соответствующее поле этой строки буфера. После записи “заготовки” команды в строку буфера устройство управления (CU) приступает к выборке следующей команды.
Процесс приостанавливается после выборки, отмеченной специальным признаком, последней команды линейного участка, которая выбирается и выполняется на общих основаниях. Следует отметить, что последней командой может быть любая команда, а не только команда, которая формирует начальный адрес нового линейного участка. Команда, формирующая начальный адрес следующего участка, может занимать любое место в выполняемом участке. Сформированный ею адрес рассылается всем функциональным блокам, которые на основании его вычисляют свой адрес передачи управления на следующий участок и выполняют эту передачу (возобновляют выборку) после получения сигнала о выборке последней команды текущего участка. Выборка также заканчивается, когда заполнен буфер и возобновляется, когда буфер освобождается.
Поля аргументов в строках буфера организованы как два массива с ассоциативной адресацией. Ассоциативным адресом, по которому осуществляется запись значения поступающего результата при совпадении его с тегом результата является тег запрашиваемого результата.
Команда находится в буфере до тех пор, пока в буфер не придут запрошенные ею результаты и пока в буфера не будут записаны все команды использующие ее результат. Если эти условия удовлетворяются хотя бы для одной команды, инициализируется процесс исполнения команд. При этом, если готовых к исполнению команд несколько, то на исполнение передается команда, которая была выбрана раньше всех.
Исполнительное устройство (EU) выполняет команду и выдает в буфер её результат с тегом, равным тегу исполненной команды. Завершается или приостанавливается этот процесс тогда, когда в буфере нет готовых к исполнению команд.
Следует отметить, что в процессе исполнения команд, клетки свои действия не согласовывают и работают независимо. Клетка выполняя команду не знает, кто будет потребителем результата. Не определена и очередность исполнения команд. Она определяется потоками данных и команд.
^ 2.3 Архитектурные особенности
1. От фон-неймановской модели мультиклеточная архитектура отличается непосредственным указанием информационных связей между операциями и, соответственно, снятием требования упорядоченного размещения описаний операций в программе.
Эта неупорядоченность делает ненужными все те методы (суперскалярность, широкое командное слово, суперконвейер, предсказание переходов и т.п.), которые, обеспечивая быстродействие, резко усложняли процессы проектирования процессора и инструментальных программных средств (компиляторы, отладчики) и увеличивали их стоимость.
2. От известных не-фон-неймановских архитектур она отличается последовательным способом выборки команд, который обеспечивает реализацию императивных языков программирования, а также использованием для указания информационных связей не адресов команд, а значений динамически формируемых тегов. Команда исполняется по «готовности данных» и «готовности потребителей ее результата».
3. Система команд клетки, основана на промежуточном представлении компилируемой программы после синтаксического анализа (триадах) и, фактически, является аппаратной реализацией входного языка программирования. Она минимизирует трудозатраты на создание компиляторов, так как с ее использованием исчезают блоки машинно-ориентированной оптимизации, распараллеливания, резко сокращается объем блока генерации команд. Исчезает понятие «программирование на ассемблере», поскольку язык процессора не наглядный и поэтому «не программируемый». Программное обеспечение становится реально машинно-независимым.
4. Неупорядоченность триад обеспечивает, при необходимости, получение после каждой компиляции индивидуального объектного кода для каждого процессора. Это, а также замкнутость подмножеств триад, резко ограничивают возможности незаметного и несанкционированного вмешательства извне в работу системного программного обеспечения.
5. Индивидуальность системного кода и использование непривилегированным пользователем для программирования только языка высокого уровня позволяют создать новый и эффективный инструментарий для борьбы с вирусами.
6. Триады обеспечивают возможность одновременного чтения и исполнения нескольких команд без анализа их очередности выполнения и информационной связности т.е. обеспечивают «естественную» реализацию параллелизма. «Естественность» изначально обусловлена видом и механизмами исполнения команд. В мультиклеточном процессоре нет аппаратных средств обеспечивающих выявление информационных связей между выбранными операциями (командами) и распределение их по функциональным устройствам, т.е. нет динамического распараллеливания. Нет и статического распараллеливания, т.к. программа в виде триад хотя и описывает информационные связи, но имеет линейную форму и не содержит каких-либо указаний, что и как можно выполнять параллельно.
7. Полносвязная интеллектуальная коммутационная среда, работающая в режиме «широковещательной» рассылки, не вносит каких-либо топологических ограничений на межклеточный обмен данными и, следовательно, обеспечивает эффективную реализацию любого класса задач (универсальность архитектуры), а также эффективное масштабирование процессора. При увеличении количества клеток и при наличии потенциального параллелизма алгоритма, рост производительности процессора практически равен увеличению количества клеток.
8. Откомпилированная программа может быть выполнена на любом количестве клеток. При этом возможно динамическое изменение их количества, что обеспечивает реализацию методологии постепенной деградации процессора при отказах его клеток. Процессор может перестраиваться и быть работоспособным до тех пор, пока исправна хотя бы одна клетка и коммутационная среда.
Подобная независимость кода от используемых ресурсов создает основу решения проблем непрерывной самоадаптации процессора к потоку задач, а также его самовосстановления после сбоев или после подключения новых ресурсов.
9. Асинхронная и децентрализованная организация мультиклеточного процессора, как на системном уровне – между клетками (при реализации параллелизма), так и на внутриклеточном уровне – между блоками клетки (при реализации команд), дополнительно обеспечивает:
минимизацию номенклатуры объектов проектирования и уменьшение их сложности;
уменьшение площади кристалла, так как объем оборудования при децентрализованном управлении меньше, чем при централизованном;
увеличение производительности и сокращение энергопотребления в несколько раз (см. раздел «Реализация MCP – 1.1хх»), так как позволяет реализовать эффективный вычислительный процесс;
при реализации, в перспективе, на одном кристалле десятков и сотен клеток, использование индивидуальной системы синхронизации для каждой клетки.
В результате, получается хорошо структурированная и модульная система, позволяющая резко уменьшить сложность процессора и, соответственно, снизить трудозатраты и повысить качество проектирования.
ЗАКЛЮЧЕНИЕ
Разноплановость и качественный состав преимуществ предлагаемой архитектуры, позволяют позиционировать ее как принципиально новое и высокоэффективное пост-неймановское направление развития микропроцессорной техники.
Приложение 1
КЛАССИФИКАЦИЯ
^ ПРОГРАММНО-УПРАВЛЯЕМЫХ СИСТЕМ
1. Введение
Теория эволюционного развития компьютеров, опирается на внешнее сходство процессов развития вычислительных и биологических систем [1]. Но, если столь разные системы эволюционируют похожим образом, то можно задаться вопросом – насколько закономерно это сходство? Случайно оно или является следствием каких-то общих законов, определяющих принципы построения и развития данных систем? Если такие законы существуют, то учитывая качественные отличия и различную природу вычислительных и биологических систем, их существование может быть обусловлено только наличием общих факторов, связанных с организацией и/или функционированием данных систем, но не зависящих от их физической реализации.
Традиционный взгляд на вычислительную систему – это представление о ней как об инструменте, ускоряющем процесс вычислений, история которого насчитывает более 3000 лет. Акцент делается на действия системы, а не на то как она это делает. При таком взгляде найти что-то общее между современной версией счетов «абак» — компьютером и живым организмом невозможно.
Но, на вычислительную систему можно посмотреть и с другой стороны. С точки зрения ее организации. А именно, ее можно рассматривать как впервые созданный человеком простейший мир, состоящий из среды (памяти, каналов ввода-вывода) и субъектов действия (процессоров) — источников активности по отношению к окружающей их среде. Каждый процессор, в свою очередь, можно рассматривать как примитивный одноклеточный или многоклеточный организм, который также как и процессор является программно-управляемой структурой. При таком взгляде история вычислительных систем будет насчитывать немногим более 60 лет, но он позволяет провести прямые аналогии между нашим миром и создаваемыми нами мирами вычислительных систем.
Как известно, основой всех биологических систем является клетка. Эволюция дала всего два типа клеток (прокариоты и эукариоты). и три формы их организации в системы. Это одноклеточные и многоклеточные живые существа (особи), а также колонии. Колонии могут быть организованы как одноклеточными, так и многоклеточными существами (сообщество). Каждая особь – это неделимая и целостная единица жизни, обладающая определенной системной организацией. Колония также имеет определенную системную организацию и целостность, но не обладает неделимостью.
Большинство видов живых существ состоит из эукариотических клеток, в том числе, все многоклеточные высокоорганизованные существа. Более того, только многоклеточность наиболее совершенного типа клеток – эукариотов (так называемая «истинная многоклеточность») дает новое качество и, как следствие, переход на следующую ступень эволюционного развития, включая появление разума.
В отличие от истинной многоклеточности объединение особей в колонию не дает нового качества. Хотя, по степени целостности, ее жизнь может вполне приближаться к уровню, характерному для поведения отдельной особи, колониальная форма организации обеспечивает только более эффективное решение задач, которые стоят перед перед членами колонии, как за счет объединения их возможностей и ресурсов, так и за счет их специализации [2].
Существующие организационные формы биологических систем и предположение о существовании общих законов, определяющих принципы построения, естественно, порождают целый ряд вопросов по отношению к вычислительным системам. А именно, что является аналогом одноклеточного, колонии или многоклеточного существа в компьютерном мире? Чему соответствуют создаваемые параллельные вычислительные системы? Что является аналогом клетки и что такое прокариоты и эукариоты применительно к вычислительным системам и чем они отличаются? Можно поставить вопрос о том, исчерпывают ли существующие три формы организации систем из клеток все принципиально возможные, или могут быть еще какие-то формы.
Ответ на эти и другие подобные вопросы связан с построением принципиально возможного множества моделей, отражающих принципы организации существующих программно-управляемых систем. При этом, модели должны быть полностью абстрагированы от особенностей физической реализации конкретных систем.
Если такое множество моделей может быть построено и, при этом, если оно будет полное и систематизируемое и, каждой системе будет сопоставлена ее абстрактная модель, то анализ и классификация этих моделей позволили бы не только ответить на поставленные вопросы. Они позволили бы целенаправленно подойти к выбору нового направления развития процессорных архитектур и стать мощным инструментом исследования живой природы.
В настоящей статье предлагаются принципы построения и классификации подобного множества моделей исходя из организации вычислительных систем.
Полученные результаты проецируются на организацию биологических систем и на основании их эволюции делается вывод о дальнейшем направлении развития процессорных архитектур. Это направление – создание процессоров с хранимым алгоритмом (контекстно-зависимой программой).
2. Построение и классификация процессорных
архитектур
2.1. Постановка задачи
Как известно, основой абсолютно всех систем классификации является абстрагирование. Оно позволяет создать модель классифицируемой системы опираясь на главное – параметры классификации, опустив при этом второстепенные детали. Выбор параметров определяется целями классификации и налагаемыми требованиями. Так, в нашем случае обязательным условием является абстрагирование от всех особенностей реализации. Из известных классификаций вычислительных систем [3], этому условию удовлетворяет, и то только частично, классификация Флинна [4]. Она рассматривает вычислительную систему на максимально возможном, но содержательном, уровне абстрагирования, который можно определить как концептуальный. На этом уровне система состоит из командных устройств (устройств управления), исполнительных устройств и устройств памяти, связанных потоками команд и данных. Параметрами классификации являются количественные оценки потоков команд и данных.
Среди потоков, связывающих устройства системы в единое целое, есть те, которые присутствуют абсолютно во всех известных системах и, про которые можно сказать, что они отражают внутреннюю сущность вычислительных систем. Другие – порождены реализацией, т.е. теми техническими решениями, которые были использованы для достижения целей, поставленных при создании конкретных систем.
К числу первых, безусловно относятся потоки команд, формируемые устройствами управления и поступающие в исполнительные устройства. Среди потоков разнообразных данных, циркулирующих в организационно различных системах, общими для всех являются только потоки результатов, формируемые исполнительными устройствами при выполнении ими принятого поток команд. Потоки данных в том понимании, в котором они используются в классификации Флинна, а именно вызываемые («called») при выполнении команд, т.е. поступающие из памяти на обработку, присутствуют только у части систем.
Так, например, потоковая машина не имеет потоков данных, поступающих из памяти и используемых для выполнения очередной команды. Все данные, необходимые для исполнения команды, поступают вместе с ней, как составная часть командного слова.
Очевидно, что в основе как моделей систем, абстрагированных от особенностей реализации, так и в основе их классификации, использующей в качестве параметров классификации оценку потоков команд и данных, должны лежать только те потоки, которые присутствуют абсолютно во всех вычислительных системах.
Отмеченное ранее концептуальное отличие архитектуры потоковых машин от традиционной фон-неймановской архитектуры, связанное с отсутствием вызываемых потоков данных, обеспечивается записью результатов выполненных команд непосредственно в поля аргументов тех команд, которые их используют. Команды исполняются после получения всех необходимых аргументов. Таким образом, очередность их исполнения и, как следствие, вид текущего выходного потока данных непосредственно зависит от потока данных, ранее сформированного исполнительным устройством.
Указанная зависимость имеет ключевое значение для выделения потоковых машин в отдельный вид. Применение только количественной оценки потоков команд и данных, без учета существующих зависимостей между потоками, в принципе, не может решить задачу систематизации подобных (нетрадиционных) архитектур.
Более того, сам подход к формированию этой оценки, используемый в классификации Флинна, не позволяет четко классифицировать даже системы, построенные на базе традиционных, фон-неймановских решений (например – векторно-конвейерные машины).
Так, корректность любой количественной оценки обеспечивается измерительным инструментом, не зависящим от объекта измерения и равенством условий измерения. Применительно к количественной оценке потоков эти два требования можно сформулировать следующим образом:
на принятом уровне абстрагирования систем должны быть однозначно определены понятия «одиночный» и «множественный», действительные по отношению к любым потокам (команд или данных) и для любых архитектур;
все систематизируемые вычислительные системы должны рассматриваться на одном уровне абстрагирования.
Ни первое, ни второе требования в классификации Флинна не выполняются. Суть количественных показателей не определена. Их значения устанавливаются постфактум, путем сравнения классифицируемой системы с эталонными для каждого класса образцами и, таким образом, определения ее класса.
В результате, одна и та же характеристика «множественный поток данных», в эталонных образцах классов MIMD (многопроцессорная система) и SIMD (матричный процессор), используется для описания двух принципиально разных явлений. Множества независимых потоков данных в многопроцессорной системе и потока векторных (многокомпонентных) данных в матричном процессоре.
Следует также отметить, что эталонный образец класса SIMD не соответствует концептуальному уровню. Модель функционирования матричного процессора, предусматривающая одновременное выполнение команды над векторным элементом потока данных, отражает одну из возможных реализаций векторных команд. Для других команд, например, скалярных – эта модель не применима. Следовательно, она не применима и на концептуальном уровне, на котором команда рассматривается в обобщенном виде.
Таким образом, для построения множества моделей вычислительных систем, абстрагированных от особенностей реализации, и последующей классификации этого множества необходимо:
в качестве потоков данных рассматривать потоки результатов выполнения команд, формируемые исполнительными устройствами;
ввести в качестве параметра классификации наличие функциональной зависимости между потоками;
однозначно определить понятия «одиночный» и «множественный», действительные по отношению к любым потокам (команд или данных) и для любых архитектур.
Выполнение указанных требований приводит, как показано ниже, к новой системе классификации, предметом которой является множество процессорных архитектур, рассматриваемых на концептуальном уровне.
^ 2.2. Основные понятия и определения
На принятом уровне абстрагирования любой процессор будет состоять из устройств управления и исполнительных устройств, связанных в единое целое потоками команд и данных.
Под устройством управления (УУ) понимается источник потока команд. Каждая команда является неделимым и целостным информационным сообщением, однозначно определяющим некоторую неделимую и целостную последовательность действий приемника (приемников). Команда не может быть выдана и исполнена по частям.
Исполнительное устройство (ИУ) – это источник потока промежуточных (не фиксируемых) данных и конечных (фиксируемых) результатов. ИУ принимает, полностью или частично, поступающий ему поток команд и исполняет его. В процессе исполнения ИУ изменяет состояние процессора и/или порождает поток данных (информационных сообщений). Результатом выполнения команды является наблюдаемое (фиксируемое) изменение состояния процессора и/или изменение окружающей среды.
Исполнение последовательности команд — это последовательный переход процессора из одного наблюдаемого состояния в д
еще рефераты
Еще работы по разное
Реферат по разное
Подготовить реферат по индивидуальной теме Табл
17 Сентября 2013
Реферат по разное
Актуальна потому, что юрисдикция любого органа ограничена известными пределами и характеризуется определенной процессуальной правоспособностью
17 Сентября 2013
Реферат по разное
«Использования информационных технологий в биржевой торговле»
17 Сентября 2013
Реферат по разное
Личность в истории: Николай II
17 Сентября 2013