Книга: Микропроцессоры 2

Микропроцессоры

Наиболее важными компонентами любого компьютера, обусловливающими его основные характеристики, являются микропроцессоры, системные платы и ин­терфейсы.

Микропроцессор (МП), или CentralProcessingUnit (CPU) — функционально законченное программно управляемое устройство обработки информации, вы­полненное в виде одной или нескольких больших (БИС) или сверхбольших (СБИС) интегральных схем.

Микропроцессор выполняет следующие функции :

□ вычисление адресов команд и операндов;

□ выборку и дешифрацию команд из основной памяти (ОП);

□ выборку данных из ОП, регистров МПП и регистров адаптеров внешних уст­ройств (ВУ);

□ прием и обработку запросов и команд от адаптеров на обслуживание ВУ;

□ обработку данных и их запись в ОП, регистры МПП и регистры адаптеров ВУ;

□ выработку управляющих сигналов для всех прочих узлов и блоков ПК;

□ переход к следующей команде.

Основными параметрами микропроцессоров являются :

□ разрядность;

□ рабочая тактовая частота;

□ размер кэш-памяти;

□ состав инструкций;

□ конструктив;

□ рабочее напряжение и т. д.

Разрядность шины данных микропроцессора определяет количество разрядов, над которыми одновременно могут выполняться операции; разрядность шины адреса МП определяет его адресное пространство.

Адресное пространство — это максимальное количество ячеек основной памяти, которое может быть непосредственно адресовано микропроцессором.

Рабочая тактовая частота МП во многом определяет его внутреннее быстро­действие, поскольку каждая команда выполняется за определенное количество тактов. Быстродействие (производительность) ПК зависит также и от тактовой частоты шины системной платы, с которой работает (может работать) МП.

Кэш-память, устанавливаемая на плате МП, имеет два уровня:

□ L1 — память 1-го уровня, находящаяся внутри основной микросхемы (ядра) МП и работающая всегда на полной частоте МП (впервые кэш L1 был введен в МП i486 и в МП i386SLC);

□ L2 — память 2-го уровня, кристалл, размещаемый на плате МП и связанный с ядром внутренней микропроцессорной шиной (впервые введен в МП PentiumII). Память L2 может работать на полной или половинной частоте МП. Эффективность этой кэш-памяти зависит и от пропускной способности микропроцессорной шины.

Состав инструкций — перечень, вид и тип команд, автоматически исполняемых МП. От типа команд зависит классификационная группа МП (CISC, RISC, VLIW и т. д.). Перечень и вид команд определяют непосредственно те процеду­ры, которые могут выполняться над данными в МП, и те категории данных, над которыми могут применяться эти процедуры. Дополнительные инструкции в не­больших количествах вводились во многих МП (286, 486, PentiumPro и т. д.). Но существенное изменение состава инструкций произошло в МП i386 (этот со­став далее принят за базовый), PentiumMMX, PentiumIII, Pentium 4.

Конструктив подразумевает те физические разъемные соединения, в которые устанавливается МП и которые определяют пригодность материнской платы для установки МП. Разные разъемы имеют разную конструкцию (Slot — щеле­вой разъем, Socket — разъем-гнездо), разное количество контактов, на которые подаются различные сигналы и рабочие напряжения.

Рабочее напряжение также является фактором пригодности материнской платы для установки МП.

Первый микропроцессор был выпущен в 1971 году фирмой Intel (США) — МП 4004. В настоящее время разными фирмами выпускается много десятков различных микропроцессоров, но наиболее популярными и распространенными являются микропроцессоры фирмы Intel и Intel-подобные.

Все микропроцессоры можно разделить на группы:

CISC (Complex Instruction Set Command) с полным набором системы команд;

RISC (Reduced Instruction Set Command) сусеченнымнаборомсистемыкоманд;

VLIW (Very Length Instruction Word) со сверхбольшим командным словом;

MISC (MinimumInstructionSetCommand) с минимальным набором системы команд и весьма высоким быстродействием и т. д.

Микропроцессоры типа CISC

Большинство современных ПК типа IBMPC используют МП типа CISC, вы­пускаемые многими фирмами: Intel, AMD, Cyrix, IBM и т. д. «Законодателем мод» здесь выступает Intel, но ей «на пятки» наступает AMD, в последние годы создавшая ряд МП, по некоторым параметрам превосходящие «интеловские». Все же пока МП фирмы Intel имеют большее распространение. Характеристики некоторых из них приведены в табл. 8.1.



Таблица 8.1.

Характеристики некоторых CISC МП1
Модель МП Intel

Разрядность

данных /адреса,

бит

Тактовая частота, МГц Адресное пространство, байт Состав команд Число элементов; Технология Кэш L1 и L2, Кбайт Напряжение питания; конструктив Год выпуска
4004 4 4 0,108 640 -

2300;

10 мкм

- - 1971
8080 8 8 2,0 64 — 103 - 10 000; 6 мкм - 1974
8086 16 16 4,77 и8 106 - 70 000; 3 мкм - 1979
8088 8, 16 16 4,77 и8 106 - 70 000; 3 мкм - 1978
80186 16 20 8и 10 106 - 140 000 - - 1981
80286 16 24 8-20 16 — 106 - 180 000; 1,5 мкм - - 1982
80386 32 32 16-50 4 — 109 Базовый

275 000;

1 мкм

- - 1985
80486 32 32 25-100 4- 109 Базовый 1,2 • 106; 1 мкм 8 - 1989
Pentium 64 32 60-233 4-Ю9 Базовый 3,3 — 106; 0,5, 0,35 мкм 8 + 8 5 В; Socket 5 1993
PPentium Pro 64 32 150-200 4-Ю9 Базовый 5,5 • 106; 0,5, 0,35 мкм 8 + 8 5 В; Socket 8 1995

Следует знать, что:

□ у микропроцессоров 80386 и 80486 есть модификации с буквами SX, DX, SLи т. д., отличающиеся от базовой модели разрядностью шины, тактовой часто­ той, надежностью, габаритами, потреблением энергии, амплитудой напряже­ния и другими параметрами;

□ микропроцессоры Pentium, PentiumII, PentiumIII имеют много различных модификаций, некоторые из них будут названы далее;

□ число элементов — это количество элементарных полупроводниковых пере­ходов, размещенных в интегральной схеме МП. Технология обычно характеризуется размером элемента в микрометрах (микронная технология).

Следует также знать, что:

□ микропроцессоры 80486DX и выше имеют встроенный математический сопроцессор, могут работать с умножением внутренней частоты. С увеличен­ной частотой работают только внутренние схемы МП, все внешние по отношению к МП схемы, в том числе расположенные на системной плате, работа­ют с обычной частотой;

□ у МП 80286 и выше конвейерное выполнение команд. В МП 286 предусмотрены регистры для очереди команд общим размером 6 байт, в МП 486 —16 байт и т. д. Конвейерное выполнение команд — это одновременное выполнение разных тактов последовательных команд в разных частях МП при непосредственной передаче результатов из одной части МП в другую. Кон­вейерное выполнение команд увеличивает эффективное быстродействие ПК в 2-5 раз;

□ у МП 80286 и выше есть возможность работы и вычислительной сети;

□ у МП 80286 и выше имеется возможность многозадачной работы (многопрограммность) и сопутствующая ей защита памяти.

Современные микропроцес соры имеют два режима работы

О реальный (однозадачный, RealAddressMode), в котором возможно выпол­нение только одной программы и непосредственно адресоваться могут только 1024 + 64 Кбайт основной памяти компьютера, а остальная память (расширенная) доступна лишь при подключении специальных драйверов, поддерживается операционной системой DOS;

О защищенный (многозадачный, ProtectedVirtualAddressMode), обеспечи­вающий выполнение сразу нескольких программ, непосредственную адре­сацию и прямой доступ (без дополнительных драйверов) к расширенной основной памяти. Предоставляется непосредственный доступ к памяти ем­костью 16 Мбайт для МП 286; 4 Гбайт для процессоров 386, 486, Celeron; 100 Гбайт для МП PentiumXeon и 64 Гбайт для остальных процессоров Pentium, а при страничной организации памяти — к 16 Тбайт виртуальной памяти каждой задаче. В этом режиме осуществляется автоматическое распределение памяти между выполняемыми программами и соответст­вующая ее защита от обращений со стороны чужих программ. Защищен­ный режим поддерживается операционными системами Windows, OS/2, Unix и т. д;

□ в МП 80386 и выше встроена поддержка системы виртуальных машин. Систе­ма виртуальных машин является дальнейшим развитием режима многозадач­ной работы, при котором каждая задача может выполняться под управлением своей операционной системы, то есть практически в одном МП моделируется как бы несколько компьютеров, работающих параллельно и имеющих разные операционные системы;

□ у МП 80486 и выше имеется поддержка кэш-памяти двух уровней (L1 и L2);

□ у МП 80486 и выше имеются RISC-элементы, позволяющие выполнять ко­роткие операции за один такт.

Микропроцессоры Pentium

Микропроцессоры 80586 (Р5) более известны по их товарной марке Pentium, ко­торая запатентована фирмой Intel (МП 80586 других фирм имеют иные обозна­чения: К5 у фирмы AMD, Ml у фирмы Cyrix и т. д.). Эти микропроцессоры имеют пятиступенную конвейерную структуру, обеспечивающую многократное совме­щение тактов выполнения последовательных команд (возможно независимое выполнение сразу двух простых команд), и кэш-буфер для команд условной пе­редачи управления, позволяющий предсказывать направление ветвления про­грамм; по эффективному быстродействию они приближаются к RISC МП, вы­полняющим каждую команду как бы за один такт. Процессоры Pentium имеют 32-разрядную адресную шину и 64-разрядную шину данных. Обмен данными с системой может выполняться со скоростью 1 Гбайт/с.

У всех МП Pentium имеется встроенная кэш-память, отдельно для команд, от­дельно для данных по 8-16 Кбайт, и встроенный контроллер кэш-памяти 2-го уровня (что обеспечивает работу последней на внутренней частоте МП); имеют­ся специализированные конвейерные аппаратные блоки сложения, умножения и деления, существенно ускоряющие выполнение операций с плавающей запятой. Удачные архитектурные решения МП Pentium обусловили то, что производи­тельности микропроцессоров 486DX4-120 и Pentium-60 приблизительно одина­ковы (то есть за счет архитектуры производительность увеличилась в два раза).

Микропроцессоры Pentium Pro

В сентябре 1995 года были выпущены МП шестого поколения 80686 (Р6), торго­вая марка PentiumPro. Микропроцессор состоит из двух кристаллов: собственно МП и кэш-памяти. Но он не полностью совместим с просто Pentium и, в частно­сти, требует специальную системную плату. PentiumPro прекрасно работает с 32-битовыми приложениями, а в 16-битовых иногда даже несколько проигрыва­ет просто Pentium. Новые схемотехнические решения обеспечивают для ПК бо­лее высокую производительность. Часть этих новшеств может быть объединена понятием «динамическое исполнение» (dynamicexecution), что, в первую оче­редь, означает наличие многоступенчатой суперконвейерной структуры (super­pipelining), предсказания ветвлений программы при условных передачах управления (multiplebranchprediction) и исполнение команд по предполагаемому пути ветвления (speculativeexecution).

В программах решения многих задач, особенно экономических, содержится боль­шое число условных передач управления. Если процессор может заранее пред­сказывать направление перехода (ветвления), то производительность его работы значительно повысится за счет оптимизации загрузки вычислительных конвейе­ров. Тем не менее следует сказать, что если путь ветвления предсказан неверно, процессор должен сбросить полученные результаты, очистить конвейеры и за­грузить нужные команды заново, что требует довольно большого числа тактов. В процессоре PentiumPro вероятность правильного предсказания 90 % против 80 % у МП Pentium.

Кэш-память емкостью 256-512 Кбайт — обязательный атрибут высокопроизво­дительных систем на базе процессоров Pentium. Однако у них встроенная кэш­память имеет небольшую емкость (16 Кбайт), а основная ее часть находится вне процессора на материнской плате. Поэтому обмен данными с ней происходит не на внутренней частоте МП, а на частоте тактового генератора, которая обычно в 2-5 раз ниже, что снижает общее быстродействие компьютера. В МП Pen­tiumPro есть и кэш-память 1-го уровня (по 8 Кбайт для команд и данных), и кристалл кэш-памяти 2-го уровня емкостью 256 или 512 Кбайт, расположен­ный тоже на плате самого микропроцессора и работающий на внутренней часто­те МП.

Микропроцессоры Pentium ММХ и Pentium II

В 1997 году появились модернизированные для работы в мультимедийной тех­нологии микропроцессоры Pentium и PentiumPro, получившие торговые марки, соответственно, Pentium ММХ (ММХ — MultiMediaeXtention) и Pentium П. МП Pentium ММХ содержит дополнительные 57 команд, ориентированные на обработку аудио- и видеоинформации, увеличенную вдвое (до 32 Кбайт) кэш­память, дополнительные восемь 64-битовых регистров, новый блок предсказа­ния ветвлений, заимствованный у МП PentiumPro, и т. д. Вследствие этого у него на 1 миллион транзисторных элементов больше, чем у МП Pentium.

Для эффективного использования этих микропроцессоров во все старые программы (в том числе и в операционные системы Windows 95, WindowsNT) необ­ходимо включить согласующие программные фрагменты; правда и без них МП Pentium ММХ несколько производительнее просто МП Pentium. При выполнении обычных приложений Pentium ММХ на 10-15 % быстрее Pentium, а при ра­боте мультимедийных приложений с использованием новых 57 команд он уже эффективнее на 30 % (для сравнения: МП PentiumPro опережает МП Pentium при выполнении обычных приложений примерно на 20 %). Программы, напи­санные с учетом специфики Pentium ММХ, не будут работать на ПК с обычным МП Pentium. Для МП Pentium ММХ требуется системная плата с разъемом Socket 7, с новым BIOS, поддерживающим ММХ, и с двумя напряжениями пи­тания (3,5 и 2,8 В).

МП PentiumII имеет иную конструкцию, нежели чем все остальные МП, в част­ности, он выполнен в виде небольшой платы-картриджа (корпус SECC), на ко­торой размещены сам процессор (содержащий 7,5 млн транзисторов против 5,5 млн в МП PentiumPro) и четыре микросхемы кэш-памяти 2-го уровня, общим объе­мом 512 Кбайт. Кэш-память 1-го уровня, находящаяся в микросхеме самого про­цессора, имеет емкость 32 Кбайта, против 16 Кбайт, имевшихся в МП Pen­tiumPro, но кэш-память 2-го уровня работает не на внутренней частоте МП, а на вдвое меньшей частоте.

Важным отличием PentiumII является архитектура двойной независимой шины (первые варианты введения такой шины были уже у МП PentiumPro). Процессор обменивается данными с кэшем L2 по специализированной высокоскоростной шине (иногда называемой backside — задней), отделенной от системной шины (frontside — передней). Системная шина работает на частоте материнской платы, и это существенно снижает эффективное быстродействие компьютера. Наличие же backside-шины ускоряет обмен с кэш-памятью.

МП PentiumII поддерживает двухпроцессорную конфигурацию ПК. В МП Pen­tiumPro и PentiumII появилась качественно новая перспектива: начали вне­дряться так называемые SIMD-инструкции (SingleInstructionMultiplyData — сравните со структурами многопроцессорных систем), в которых одно и то же действие совершается над многими данными (эта технология получит развитие в следующих моделях МП). МП производится на основе технологии 0,35 мкм и использует напряжение питания 2,8 В. Для него, естественно, требуется иная системная плата, чем для всех других Pentium. Микропроцессоры PentiumII име­ют много модификаций: Klamath, Deschutes, Katmai, Tanga; МП средней группы Celeron — Covington, Mendocino, Dixon.

Для более дешевых компьютеров был предложен облегченный вариант процес­сора, названный Celeron. Первые процессоры Celeron имели частоты 266 и 300 МГц. Вторичный кэш исключили, что заметно отразилось на производитель­ности ПК (системные платы с разъемом Slot 1 вторичного кэша не имеют), и ПК на их основе оказались малоэффективными. Тогда были выпущены процессоры Celeron А, которые имеют небольшой (128 Кбайт) вторичный кэш, установлен­ный на плате МП и работающий уже на полной частоте МП. Эти процессоры, известные также под названием Mendocino, стали очень популярными.

Кроме широко известных особенностей вторичного кэша (либо его нет, либо 128 Кбайт), процессор Celeron имеет следующие отличия от PentiumII:

□ разрядность шины адреса сокращена с 36 до 32 бит (адресуемая память —4 Гбайт);

□ несколько ослаблены процедуры контроля достоверности преобразования информации;

□ Celeron предназначен только для однопроцессорных конфигураций.

Процессоры Celeron А являются самыми популярными из недорогих компьюте­ров и в настоящее время. Большинство МП PentiumII, в том числе и CeleronA, поддерживают частоту шины системной платы 100, 133 МГц и более (предыду­щие модели — только 66 МГц).

Микропроцессоры Pentium III

Появившиеся в 1999 году процессоры PentiumHI (Coppermine) являются даль­нейшим развитием PentiumII. Их главным отличием является основанное на новом блоке 128-разрядных регистров расширение набора SIMD-инструкций, ориентированных на форматы данных с плавающей запятой — SSE (StreamingSIMDExtensions). По возможностям мультипроцессорных конфигураций эти про­цессоры аналогичны своим предшественникам PentiumII.

Кэш 2-го уровня у МП PentiumIII имеет размер 256 Кбайт, работает на полной частоте МП и обслуживается быстродействующей backside-шиной, что во много раз ускоряет как работу с кэшем, так и производительность ПК в целом. МП PentiumIII предназначены для работы с материнскими платами, имеющими чип­сеты (набор микросхем, связывающих процессор с остальной системой) Intel: 440BX, 440ZX, 440GX, 810, 815, 820, 840 и более новые; поддерживают частоту шины материнской платы 100, 133, 150 МГц и выше. «Простые» PentiumIII устанавли­ваются в SlotI, PentiumIIIXeon — в Slot 2. Процессоры PentiumHIXeon (и по­следующие модели Tanner, Cascades) являются продолжением линии МП Pen­tiumPro и отличаются увеличенным кэшем 2-го уровня (512, 1024 и 2048 Кбайт), работающим на полной частоте МП.

Микропроцессоры Pentium 4

Модификация МП Pentium — Pentium 4 — предназначена для высокопроизво­дительных компьютеров, в первую очередь серверов, рабочих станций класса high-end и мультимедийных игровых ПК. Рассмотрим основные особенности Pentium 4.

Добавлены 144 новые потоковые инструкции, расширяющие набор SIMD-инст­рукций, ориентированных на форматы данных с плавающей запятой — SSE (StreamingSIMDExtensions). Модуль вычислений с плавающей запятой и пото­ковый модуль оптимизированы для работы с аудио- и видеопотоками, в том чис­ле ЗО-технологиями.

Имеется кэш 2-го уровня размером 256 Кбайт; он работает на полной частоте МП, использует встроенную программу коррекции ошибок и обслуживается бы­стродействующей с разрядностью 256 бит (32 байт) шиной, работающей на час­тоте МП. Это для Pentium 4 с частотой 1500 МГц, например, обеспечивает ско­рость обмена с кэшем 48 Гбайт/с.

Есть возможность работы с системной шиной с эквивалентной частотой 400 МГц (Quard-PumpedBusno 100 МГц), что обеспечивает скорость обмена 3,2 Гбайт/с.

Вновь улучшена система «динамического исполнения» (dynamicexecution), что, в первую очередь, связано с наличием 20-ступенной (у МП PentiumIII конвейер имел 10 ступеней) суперконвейерной структуры (superpipelining), лучшего пред­сказания ветвлений программы при условных передачах управления (branchprediction) и параллельного «по предположению» (опережающего, спекулятив­ного) исполнения команд по нескольким предполагаемым путям ветвления (spe­culativeexecution). Поясним это. Динамическое исполнение позволяет процес­сору предсказывать порядок выполнения инструкций при помощи технологии множественного предсказания ветвлений, которая прогнозирует прохождение про­граммы по нескольким ветвям. Это оказывается возможным, поскольку в про­цессе исполнения инструкции процессор просматривает программу на несколько шагов вперед. Технология анализа потока данных позволяет проанализировать программу и составить ожидаемую последовательность исполнения инструкций, независимо от порядка их следования в тексте программы. И наконец, опере­жающее выполнение повышает скорость работы программы за счет выполнения нескольких инструкций одновременно, по мере их поступления в ожидаемой по­следовательности — то есть по предположению (интеллектуально). Поскольку выполнение инструкций происходит на основе предсказания ветвлений, резуль­таты сохраняются как «интеллектуальные» с последующим удалением тех, кото­рые вызваны промахами в предсказании. На конечном этапе порядок инструк­ций и результатов их выполнения восстанавливается до первоначального.

Используется новая микроархитектура, базирующаяся на двух параллельных 32-битовых конвейерах и поддерживающая технологию поточной обработки HyperPipelined. Это позволило сделать эффективным длинный конвейер. Суть в том, что при длинном конвейере в задачах с частыми условными переходами его эффективность снижается. Два параллельных конвейера снижение эффек­тивности уменьшают. Теперь реальна ситуация, когда в каждый момент времени одна инструкция загружается, другая декодируется, для третьей (или несколь­ких) формируется пакет данных, четвертая инструкция (или несколько) испол­няется, для пятой записывается результат. И если при строго последовательном исполнении инструкций даже самые короткие операции исполнялись за 5 так­тов, то при такой поточной обработке многие инструкции могут быть выпол­нены за такт.

Новая технология ускоренных вычислений (RapidExecutionEngine) использует два быстрых, работающих на удвоенной частоте, процессора АЛУ, выполняю­щие короткие арифметические и логические операции за 0,5 такта, и третье, мед­ленное АЛУ, исполняющее длинные операции (умножение, деление и т. д.).

Процессор имеет площадь кристалла 217 мм2, потребляет 52 Вт при частоте 1500 МГц, содержит 42 млн транзисторов. На базе Pentium 4 можно создать вы­сокоэффективную ММХ-систему, но для этого необходимо наличие:

□ программного обеспечения, ориентированного на использование дополни­тельных команд этого процессора;

□ системной платы с чипсетами, поддерживающими данные микропроцессоры.

В 2002-2004 годах корпорация Intelпредставила:

□ семейство МП PentiumIIITualatin на основе технологии 0,13 мкм с улуч­шенными по сравнению с Coppermine характеристиками (тактовые частоты до 1266 МГц, кэш-память L2 емкостью до 512 Кбайт, работающая на частоте микропроцессора, с поддержкой частоты системной шины (FSB) до 133 МГц).

□ Выпускаются МП трех видов: для портативных и настольных компьютеров и для серверов;

□ МП Celeron с тактовыми частотами 2,3 и 2,4 ГГц, изготовленными по технологии 0,13 мкм и поддерживающими тактовую частоту шины 400 МГц;

□ семейство нового поколения МП Pentium 4E — ядро Prescott под процес­сорный разъем LGA7751: Pentium 4Е 5202 2,8 ГГц, Pentium 4E 530 3 ГГц, Pentium 4E 540 3,2 ГГц, Pentium 4E 550 3,4 ГГц, Pentium 4E 560 3,6 ГГц.

Все МП имеют кэш 2-го уровня 1024 Кбайт.

□ две модели Р4ЕЕ (ExtremeEdition) 3,2 и 3,4 ГГц, кэш 3-го уровня 2 Мбайт и кэш 2-го уровня 512 Кбайт;

□ системный чипсет для этих МП — i875;

□ микропроцессоры PentiumM для портативных компьютеров — новое поколе­ние МП с системным чипсетом i855 и средствами беспроводного доступа к локальным сетям по протоколу IEEE 802.11.

Компания Intel выпускает:

□ в 2005 году — МП по технологии 0,065 мкм, довести тактовую частоту МП до 20 ГГц;

□ в 2005-2006 годах — две версии микропроцессора Smithfield с двумя ядрами по технологии 0,09 мкм на конструктиве LGA775.

Все новые процессоры Pentium 4 имеют микроархитектуру Intel Net Burst , под­держивающую ряд инновационных возможностей:

□ технологию НТ;

□ технологию гиперконвейерной обработки данных;

□ частоту системной шины 800, 533 или 400 МГц;

□ кэш-память первого уровня с отслеживанием выполнения команд;

□ расширенные функции выполнения команд;

□ расширенные функции выполнения операций с плавающей запятой и мультимедийных операций;

□ набор потоковых SIMD-расширений SSE2 или SSE3.

Технология НТ

Технология HyperTreading (tread — поток) реализует многопотоковое исполне­ние программ: на одном физическом процессоре можно одновременно исполнять два задания или два потока команд одной программы (операционные системы «видят» два логических процессора вместо одного). Иначе говоря, эта техноло гия на базе одного МП формирует два или более логических процессора, работаю­щих параллельно и, в известной степени, независимо. HyperTreading обеспечивает повышение производительности (до 30 %) в многозадачных средах и при испол­нении программ, которые допускают многопотоковое исполнение.

ПРИМЕЧАНИЕ

Следует, однако, иметь в виду, что все микропроцессоры, начиная с i386, позволяют про­граммным путем также реализовать систему виртуальных машин, когда на одном физиче­ском МП моделируются два виртуальных, каждый из которых может исполнять свою программу независимо и даже под управлением своей операционной системы.

Технология НТ была создана фирмой Intel изначально для серверных процес­соров Хеоn с целью повышения производительности серверных систем: в них она дополняет традиционную многопроцессорность, обеспечивая дополнитель­ный параллелизм в работе.

Архитектурно микропроцессоры, поддерживающие НТ, имеют дополнительно груп­пу дублирующих регистров и логические схемы, назначающие ресурсы потокам и средства APIC (AdvancedProgrammableInterruptController), организующие прерывания для обработки потоков команд разными логическими процессора­ми. Кроме этого для поддержки HyperTreading необходимы материнские платы с соответствующим BIOS, и с чипсетами Intel 845 РЕ и GE, Intel 865, 875, 915, 925 и т. п., а также многозадачные операционные системы WindowsXP, Linux (Windows 9х и ME непригодны, Window 2000 может использоваться с дополни­тельной настройкой).

Технология гиперконвейерной обработки

Технология гиперконвейерной обработки повышает пропускную способность кон­вейера, обеспечивая увеличение производительности и тактовой частоты. Так, один из основных конвейеров МП — конвейер предсказания ветвлений/возвра­тов ветвления, имеет глубину конвейерной обработки в 31 шаг (против 20 шагов в микропроцессорах Pentium 4 с суперконвейерной обработкой).

Поддержка системной шины с частотой до 800 МГц

Поддерживается самая производительная на 2004 год шина с частотой 800 МГц, обеспечивающая обмен данными между процессором и другими компонента­ми со скоростью 6,4 Гбайт/с. Это обеспечивается путем организации схемы пере­дачи данных, позволяющей передавать четырехкратно увеличенный пакет по 200-мегагерцевой шине.

Кэш-память уровня L 1 с отслеживанием выполнения команд

Поддерживается увеличенный до 16 Мбайт объем кэш-памяти данных и кэш-па­мять с отслеживанием выполнения команд, которая хранит до 12 000 микроопе­раций в порядке их выполнения. Это повышает производительность МП, в част­ности, из-за быстрого доступа к командам ветвления и ускоренного возврата из ветвлений, которые были неверно спрогнозированы.

Расширенные функции выполнения команд

Имеется микроблок улучшенного динамического выполнения команд, имеющий в том числе и усовершенствованный алгоритм предсказания ветвлений.

Расширенные функции выполнения операций

Имеется микроблок с расширенными до 128 байт регистрами операций с пла­вающей запятой и дополнительный регистр для передачи данных, что увеличи­вает производительность МП при работе с плавающей запятой и выполнении мультимедийных приложений.

Потоковые SIMD -расширения SSE 3

В SIMD-расширения SSE2 были добавлены 144 инструкции, а в SIMD-расши­рения SSE3 добавлены еще 13 инструкций, улучшающих синхронизацию муль­тимедиа потоков и повышающих производительность при работе с видео- и ау­дио-информацией, в том числе с речью и графикой.

Технология RAID

Большинство новых микропроцессоров поддерживают технологию IntelRAID (RedundantArrayIntensiveDisk — массив недорогих дисков с избыточностью). Достоинством этой технологии является простота организации RAID-массивов, то есть поддержка функционирования нескольких параллельно работающих и дублирующих друг друга винчестеров: два диска содержат зеркальную копию информации друг друга, уменьшая таким образом вероятность потери данных и обеспечивая сохранность важной информации. Переключение между дисками выполняется очень быстро и незаметно для пользователя: все заботы по синхро­низации и верификации данных система берет на себя.

Новая маркировка МП фирмы Intel

Начиная с 2004 года фирма Intel вводит новую маркировку своих микропроцес­соров. Вводимый фирмой единый трехзначный номер процессора будет учиты­вать сразу несколько характеристик: базовую архитектуру, тактовую частоту процессора и частоту системной шины, объем кэш-памяти и др.

В частности, базовая архитектура МП отображается старшим разрядом (предла­гается ввести три серии):

□ ЗХХ — процессоры Celeron, CeleronM, CeleronM со сверхнизким энергопо­треблением;

□ 5ХХ — процессоры Pentium 4 для настольных и мобильных ПК (в том числе и с технологией HyperTreading);

□ 7ХХ — процессоры PentiumM с низким и сверхнизким энергопотреблением.

Микропроцессоры Over Drive

МП OverDrive, по существу, являются своеобразны­ми сопроцессорами, обеспечивающими для МП 80486 режимы работы и эффек­тивное быстродействие, характерные для МП Pentium, а для МП Pentium — увеличение их производительности (в частности, OverDrive 125, 150 и 166, соответственно, для Pentium 75, 90 и 100, увеличивающие их внутреннюю часто­ту до указанных для OverDrive величин).

ПРИМЕЧАНИЕ

В сфере выпуска микропроцессоров с фирмой Intel постоянно конкурирует фирма AMD. Микропроцессоры фирмы AMD выпуска 2003- 2004 годов (AthlonXP, Athlon 64) мало в чем уступают процессорам Pentium 4, а в некоторых режимах работы даже превосходят последние по быстродействию. Но, как и прежде, МП AMD сильнее греются (их штатная температура — 55-80 °С, в то время, как у МП Pentium 30-60 С С), поэтому для них необ­ходим мощный вентилятор и надежная система защиты от катастрофического перегрева. Все МП Pentium такой системой снабжены: у них имеется датчик, который при превыше­нии температуры 120-130 °С мгновенно выключает МП, спасая его от «сгорания». У МП Pentium 4 есть еще более совершенная систем; ThermalMonitor, принудительно замед­ляющая работу микропроцессора при превыше га допустимой температуры Микропро­цессоры AMD подобной системы пока не имеют, в связи с этим их рекомендуется использовать на системных платах, оснащенных надежной системой температурного кон­троля.

Микропроцессоры типа RISC

Микропроцессоры типа RISC содержат только набор простых, чаще всего встре­чающихся в программах команд. При необходимости выполнения более сложных команд в микропроцессоре производится их автоматическая сборка из простых. В этих МП все простые команды имеют одинаковый размер и на выполнение ка­ждой из них тратится один машинный такт (на выполнение даже самой корот­кой команды из системы CISC обычно тратится четыре такта). Один из первых МП типа RISC — ARM (на его основе был создан ПК IBMPCRT): 32-разряд­ный МП, имеющий 118 различных команд. Современные 64-разрядные RISC-микропроцессоры выпускаются многими фирмами: Apple (PowerPC), IBM (PPC), DEC (Alpha), HP (PA), Sun (UltraSPARC) ит.д. '

Микропроцессоры PowerPC (PerformanceOptimizedWithEnhancedPC) весьма перспективны и уже сейчас широко применяются в машинах-серверах и в ПК типа Macintosh. Микропроцессоры PowerPC имеют тактовую частоту до 800 МГц, а микропроцессоры Alpha — тактовую частоту 1800 МГц. Микропроцессоры типа RISC характеризуются очень высоким быстродействием , но они программно не совместимы с CISC-процессорами: при выполнении программ, разработанных для ПК типа IBMPC, они могут лишь эмулировать (моделировать, имитиро­вать) МП типа CISC на программном уровне, что приводит к резкому уменьше­нию их эффективной производительности.

Микропроцессоры типа VLIW

Это сравнительно новый и весьма перспективный тип МП. Микропроцессоры типа VLIW в 2004 году выпускают фирмы:

□ Transmeta — это микропроцессор Crusoe моделей ТМ3120, ТМ5400, ТМ5600 (технология 0,18 мкм, тактовые частоты до 700 МГц);

□ Intel — модель Mersed (торговая марка Itanium, 800 МГц);

□ Hewlett-Packard (HP) — модель McKinley.

Следует заметить, что при более глубоком анализе технология EPIC (ExplicitlyParallelInstructionComputing — вычисления с явной параллельностью инструк­ций), которой придерживаются фирмы Intel и HP, незначительно отличается от технологии VLIW, принятой за основу фирмой Transmeta. Но эти отличия несу­щественны, поэтому микропроцессоры VLIW и EPIC можно отнести к одной группе.

МП Merced — первый процессор, использующий полный набор 64-битовых ин­струкций (IntelArchitecture-64, IA-64; именно эта технология называется EPIC). Микропроцессор с тактовой частотой 1200 МГц изготавливается по техноло­гическим нормам 0,18 мкм. К VLIW-типу можно отнести и ожидавшийся в 2002 году МП Elbrus 2000 — Е2К, разработанный российской компанией «Эль­брус». И хотя Е2К пока существует в виде компьютерной модели, этот процес­сор оставил «российский след» в американских проектах — о схожести опреде­ленных черт Е2К и процессора Crusoe компании Transmeta, а также архитектуры IA-64 (Intel и HP) много писалось в прессе.

Программисты доступа к внутренним VLIW-командам не имеют: все програм­мы (даже операционная система) работают поверх специального низкоуровневого программного обеспечения (CodeMorphing), которое ответственно за трансля­цию команд CISC-микропроцессоров в команды VLIW. МП типа VLIW вместо сложной схемной логики, обеспечивающей в современных суперскалярных мик­ропроцессорах параллельное исполнение команд, опираются на программное обеспечение. Упрощение аппаратуры позволило уменьшить габариты МП и по­требление энергии (эти МП иногда называют «холодными»).

Архитектура CISC появилась в 1978 году. Тогда процессоры представляли собой скалярные устройства (то есть могли в каждый момент времени выполнять толь­ко одну команду), при этом конвейеров практически не было. Процессоры со­держали десятки тысяч транзисторов. МП RISC были разработаны в 1986 году, когда технология суперскалярных конвейеров только начала развиваться. Про­цессоры содержали сотни тысяч транзисторов. В конце 90-х наиболее совершенные процессоры уже содержат миллионы, десятки миллионов транзисторов. Первые МП архитектуры IA-64 содержат десятки миллионов транзисторов. В дальней­ших модификациях их число, вероятно, увеличится до сотен миллионов.

Архитектура IA-64 не является ни 64-разрядным расширением архитектуры CISC, ни переработкой архитектуры RISC. IA-64 представляет собой новую архитекту­ру, использующую длинные слова команд (LIW), предикаты команд (instructionpredication), исключение ветвлений (branchelimination), предварительную за­грузку данных (speculativeloading) и другие ухищрения для того, чтобы обеспе­чить больший параллелизм выполнения программ. Но тем не менее, IA-64 — это компромисс между CISCи RISC, попытка сделать их совместимыми: существу­ют два режима декодирования команд — VLIW и старый CISC. Программы ав­томатически переключаются в необходимый режим исполнения. Для работы

с VLIW операционные системы должны содержать и 64-разрядную часть на IA-64, и старую 32-разрядную.

Все новые МП создаются на основе технологий, обеспечивающих формирование элементов с линейным размером порядка 0,015 мкм и ниже (традиционные МП 80486 и Pentium использовали элементы 0,8 мкм).

Уменьшение размеров элементов обеспечивает возможность:

□ увеличения тактовой частоты МП до сотен мегагерц и выше;

□ уменьшения перегрева МП, что позволяет использовать пониженное напря­жение питания 1-2 В (вместо 5 В).

еще рефераты
Еще работы по информатике