Реферат: Архитектура процессора

ТехническийуниверситетМолдовы


РЕФЕРАТПО ПРОГРАММИРОВАНИЮ

ТЕМА: Памятьи архитектурапроцессора


Факультет CIM


Группа С — 092


Подготовил ПлисВладимир.


Кишинёв1999 г.


План:

Введение.

Историческая ретроспектива.

Архитектурное развитие.

Процесс производства.

Программная совместимость.

Обзор процессоров.

БудущиеразработкиIntel.


Процессор, или более полномикропроцессор, а также частоназываемыйЦПУ (CPU — central processing unit) являетсяцентральнымкомпонентомкомпьютера.Это разум, которыйуправляет, прямо или косвенно, всем происходящимвнутри компьютера.

Когдафон Нейманвпервые предложилхранить последовательностьинструкций, так называемыепрограммы, втой же памяти, что и данные, это была поистиненоваторскаяидея. Опубликованаона в «First Draft of a Report on theEDVAC» в 1945 году. Этототчет описывалкомпьютерсостоящим изчетырех основныхчастей: центральногоарифметическогоустройства, центральногоуправляющегоустройства, памяти и средствввода-вывода.

Сегодня, более полувекаспустя, почтивсе процессорыимеют фон-неймановскуюархитектуру.

Историческаяретроспектива

Какизвестно, всепроцессорыперсональныхкомпьютеровоснованы наоригинальномдизайне Intel. Первымприменяемымв PC процессоромбыл интеловскийчип 8088. В это времяIntel располагалвыпущеннымранее болеемощным процессором8086. 8088 был выбранпо соображениямэкономии: его8-битная шинаданных допускалаболее дешевыесистемныеплаты, чем 16-битнаяу 8086. Также вовремя проектированияпервых PC большинстводоступныхинтерфейсныхмикросхемиспользовали8-битный дизайн.Те первые процессорыдаже не приближаютсяк мощи, достаточнойдля запускасовременныхприложений.

Втаблице нижеприведеныосновные группыинтеловскихпроцессоровот первой генерации8088/86 до шестогопоколенияPentium Pro и Pentium II:

Тип/
Поколение

Дата

Ширина шины данных/
адреса

Внутренний кэш

Скорость шины памяти
(MHz)

Внутренняя частота
(MHz)

8088/ First 1979 8/20 bit None 4.77-8 4.77-8 8086/ First 1978 16/20 bit None 4.77-8 4.77-8 80286/ Second 1982 16/24 bit None 6-20 6-20 80386DX/ Third 1985 32/32 bit None 16-33 16-33 80386SX/ Third 1988 16/32 bit 8K 16-33 16-33 80486DX/ Fourth 1989 32/32 bit 8K 25-50 25-50 80486SX/ Fourth 1989 32/32 bit 8K 25-50 25-50 80486DX2/ Fourth 1992 32/32 bit 8K 25-40 50-80 80486DX4/ Fourth 1994 32/32 bit 8K+8K 25-40 75-120 Pentium/ Fifth 1993 64/32 bit 8K+8K 60-66 60-200 MMX/ Fifth 1997 64/32 bit 16K+16K 66 166-233 Pentium Pro/ Sixth 1995 64/36 bit 8K+8K 66 150-200 Pentium II/ Sixth 1997 64/36 bit 16K+16K 66 233-300

Третьепоколениепроцессоров, основанныхна Intel 80386SX и 80386DX, былипервыми применяемымив PC 32-битнымипроцессорами.Основным отличиеммежду ними былото, что 386SX был32-разряднымтолько внутри, поскольку онобщался с внешниммиром по 16-разряднойшине. Это значит, что данныемежду процессороми остальнымкомпьютеромперемещалисьна вполовинуменьшей скорости, чем у 486DX.

Четвертаягенерацияпроцессоровбыла также32-разрядной.Однако все онипредлагалиряд усовершенствований.Во-первых, былполностьюпересмотренвесь дизайн486 поколения, что само посебе удвоилоскорость. Во-вторых, все они имели8kb внутреннегокэша, прямо упроцессорнойлогики. Такоекэшированиепередачи данныхот основнойпамяти значило, что среднееожидание процессоразапросов кпамяти на системнойплате сократилосьдо 4%, поскольку, как правило, необходимаяинформацияуже находиласьв кэше.

Модель486DX отличаласьот 486SX толькопоставляемымвнутри математическимсопроцессором.Этот отдельныйпроцессорспроектировандля проведенияопераций надчислами с плавающейточкой. Он малоприменяетсяв каждодневныхприложениях, но кардинальноменяет производительностьчисловых таблиц, статистическогоанализа, системпроектированияи так далее.

Важнойинновациейбыло удвоениечастоты, введенноев 486DX2. Это значитчто внутрипроцессорработает наудвоенной поотношению ковнешней электроникескоростью.Данные междупроцессором, внутреннимкэшем и сопроцессоромпередаютсяна удвоеннойскорости, приводяк сравнимойприбавке впроизводительности.486DX4 развил этутехнологиюдальше, утраиваячастоту довнутренних75 или 100MHz, а такжеудвоив объемпервичногокэша до 16kb.

Pentium, определив пятоепоколениепроцессоров, значительнопревзошел впроизводительностипредшествующие486 чипы благодарянесколькимархитектурнымизменениям, включая удвоениеширины шиныдо 64 бит. P55C MMX сделалдальнейшиезначительныеусовершенствования, удвоив размерпервичногокэша и расширивнабор инструкцийоптимизированнымидля мультимедиаприложенийоперациями.

PentiumPro, появившисьв 1995 году какнаследникPentium, был первымв шестом поколениипроцессорови ввел несколькоархитектурныхособенностей, не встречавшихсяранее в миреPC. Pentium Pro стал первыммассовым процессором, радикальноизменившимспособ выполненияинструкцийпереводом ихв RISC-подобныемикроинструкциии выполнениемих в высокоразвитомвнутреннемядре. Он такжезамечателензначительноболее производительнымвторичным кэшемотносительновсех прежнихпроцессоров.Вместо использованиябазирующегосяна системнойплате кэша, работающегона скоростишины памяти, он используетинтегрированныйкэш второгоуровня на своейсобственнойшине, работающейна полной частотепроцессора, обычно в трираза быстреекэша на Pentium-системах.

Следующийновый чип послеPentium Pro Intel представилспустя почтиполтора года- появился PentiumII, давший оченьбольшой эволюционныйшаг от Pentium Pro. Этораспалилоспекуляции, что одна изосновных целейIntel в производствеPentium II был уход оттрудностейв изготовлениидорогогоинтегрированногокэша второгоуровня в Pentium Pro.АрхитектурноPentium II не оченьотличаетсяот Pentium Pro с подобнымэмулирующимx86 ядром и большинствомсхожих особенностей.

PentiumII улучшил архитектуруPentium Pro удвоениемразмера первичногокэша до 32kb, использованиемспециальногокэша для увеличенияэффективности16-битной обработки,(Pentium Pro оптимизировандля 32-битныхприложений, а с 16-битным кодомне обращаетсястоль же хорошо)и увеличениемразмеров буферовзаписи. Однакоо основнойтемой разговороввокруг новыхPentium II была егокомпоновка.Интегрированныйв Pentium Pro вторичныйкэш, работающийна полной частотепроцессора, был замененв Pentium II на малуюсхему, содержащуюпроцессор и512kb вторичногокэша, работающегона половинечастоты процессора.Собранныевместе, онизаключены вспециальныйодносторонийкартридж (single-edgecartridge — SEC), предназначенныйдля вставленияв 242-пиновый разъем(Socket 8) на новогостиля системныхплатах Pentium II.

Основнаяструктура

Основныефункциональныекомпонентыпроцессора

Ядро: Сердце современного процессора — исполняющий модуль. Pentium имеет два параллельных целочисленных потока, позволяющих читать, интерпретировать, выполнять и отправлять две инструкции одновременно.

Предсказатель ветвлений: Модуль предсказания ветвлений пытается угадать, какая последовательность будет выполняться каждый раз когда программа содержит условный переход, так чтобы устройства предварительной выборки и декодирования получали бы инструкции готовыми предварительно.

Блок плавающей точки. Третий выполняющий модуль внутри Pentium, выполняющий нецелочисленные вычисления

Первичный кэш: Pentium имеет два внутричиповых кэша по 8kb, по одному для данных и инструкций, которые намного быстрее большего внешнего вторичного кэша.

Шинный интерфейс: принимает смесь кода и данных в CPU, разделяет их до готовности к использованию, и вновь соединяет, отправляя наружу.

/>


Всеэлементы процессорасинхронизируютсяс использованиемчастоты часов, которые определяютскорость выполненияопераций. Самыепервые процессорыработали начастоте 100kHz, сегоднярядовая частотапроцессора- 200MHz, иначе говоря, часики тикают200 миллионовраз в секунду, а каждый тиквлечет за собойвыполнениемногих действий.Счетчик Команд(PC) — внутреннийуказатель, содержащийадрес следующейвыполняемойкоманды. Когдаприходит времядля ее исполнения, УправляющийМодуль помещаетинструкциюиз памяти врегистр инструкций(IR). В то же самоевремя Счетчиккоманд увеличивается, так чтобы указыватьна последующуюинструкцию, а процессорвыполняетинструкциюв IR. Некоторыеинструкцииуправляют самимУправляющимМодулем, такесли инструкциягласит 'перейтина адрес 2749', величина2749 записываетсяв Счетчик Команд, чтобы процессорвыполнял этуинструкциюследующей.

МногиеинструкциизадействуютАрифметико-логическоеУстройство(ALU), работающеесовместно сРегистрамиОбщего Назначения- место длявременногохранения, котороеможет загружатьи выгружатьданные из памяти.Типичной инструкциейALU может служитьдобавлениесодержимогоячейки памятик региструобщего назначения.ALU также устанавливаетбиты РегистраСостояний(Status register — SR) при выполненииинструкцийдля храненияинформациио ее результате.Например, SR имеетбиты, указывающиена нулевойрезультат, переполнение, перенос и такдалее. МодульУправленияиспользуетинформациюв SR для выполненияусловных операций, таких как 'перейтипо адресу 7410 есливыполнениепредыдущейинструкциивызвало переполнение'.

Этопочти все чтокасается самогообщего рассказао процессорах- почти любаяоперация можетбыть выполненапоследовательностьюпростых инструкций, подобных описанным.

Архитектурноеразвитие

Всоответствиис законом Мура(сформулированнымв 1965 году ГордономМуром (Gordon Moore), однимиз создателейIntel), CPU удваиваетсвою мощностьи возможностикаждые 18-24 месяцев.В последниегоды Intel настойчивоследовал этомузакону, оставаясьлидером нарынке и выпускаяболее мощныечипы процессоровдля PC, чем любаядругая компания.В 1978 году 8086 работална частоте4.77MHz и содержалменее миллионатранзисторов, на конец 1995 годаих Pentium Pro вмещалуже 21 миллионтранзисторови работал на200MHz.

Законыфизику ограничиваютразработчиковв непосредственномувеличениичастоты, и хотячастоты растуткаждый год, только это неможет дать тогоприростапроизводительности, что мы используемсегодня. Вотпочему инженерыпостоянно ищутспособ заставитьпроцессорвыполнятьбольше работыза каждый тик.Одно развитиесостоит в расширениишины данныхи регистров.Даже 4-битныепроцессорыспособны складывать32-битные числа, правда выполнивмассу инструкций,- 32-битные процессорырешают этузадачу в однуинструкцию.Большинствосегодняшнихпроцессоровимеют 32-разряднуюархитектуру, на повесткеуже 64-разрядные.

Вдавние временапроцессор могобращатьсятолько с целымичислами. Единственнойвозможностьюбыло написаниепрограмм, использующихпростые инструкциидля обработкидробных чисел, но это быломедленно. Фактическивсе процессорысегодня имеютинструкциидля непосредственногообращения сдробными числами.

Говоря, что 'нечто происходитс каждым тиком', мы недооцениваемкак долго насамом делепроисходитвыполнениеинструкции.Традиционно, это занималопять тиков — один для загрузкиинструкции, другой для еедекодирования, один для полученияданных, одиндля выполненияи один для записирезультата.В этом случаеочевидно 100MHzпроцессор могвыполнитьтолько 20 миллионовинструкцийв секунду.

Большинствопроцессоровсегодня применяютпоточную обработку(pipelining), котораябольше похожана фабричныйконвейер. Однастадия потокавыделена подкаждый шаг, необходимыйдля выполненияинструкции, и каждая стадияпередает инструкциюследующей, когда она выполниласвою часть. Этозначит, что влюбой моментвремени однаинструкциязагружается, другая декодируется, доставляютсяданные длятретьей, четвертаяисполняется, и записываетсярезультат дляпятой. При текущейтехнологииодна инструкцияза тик можетбыть достигнута.

Болеетого, многиепроцессорысейчас имеютсуперскалярнуюархитектуру.Это значит, чтосхема каждойстадии потокадублируется, так что многоинструкциймогут передаватьсяпараллельно.Pentium Pro, примером, может выполнятьдо пяти инструкцийза цикл тика.

Процесспроизводства

Чтоотличаетмикропроцессорот его предшественников, сконструированныхиз ламп, отдельныхтранзисторов, малых интегральныхсхем, такимикакими они былипервое времяот полногопроцессорана едином кремниевомчипе.

Кремнийили силикон- это основнойматериал изкоторого производятсячипы. Это полупроводник, который, будучиприсажен добавкамипо специальноймаске, становитсятранзистором, основным строительнымблоком цифровыхсхем. Процессподразумеваетвытравливаниетранзисторов, резисторов, пересекающихсядорожек и такдалее на поверхностикремния.

Спервавыращиваетсякремневаяболванка. Онадолжна иметьбездефектнуюкристаллическуюструктуру, этотаспект налагаетограничениена ее размер.В прежние дниболванкаограничиваласьдиаметром в2 дюйма, а сейчасраспространены8 дюймов. Наследующейстадии болванкаразрезаетсяна слои, называемыепластинами(wafers). Они полируютсядо безупречнойзеркальнойповерхности.На этой пластинеи создаетсячип. Обычно изодной пластиныделается многопроцессоров.

Электрическаясхема состоитиз разных материалов.Например, диоксидкремния — этоизолятор, изполисиликонаизготавливаютсяпроводящиедорожки. Когдапоявляетсяоткрытая пластина, она бомбардируетсяионами для создания транзисторов- это и называетсяприсадкой.

Чтобысоздать всетребуемыедетали, на всюповерхностьпластины добавляетсяслои и лишниечасти вытравливаютсявновь. Чтобысделать это, новый слойпокрываетсяфоторезистором, на которыйпроектируетсяобраз требуемыхдеталей. Послеэкспозициипроявлениеудаляет течасти фоторезистора, которые выставленына свет, оставляямаску, черезкоторую проходиловытравливание.Оставшийсяфоторезисторудаляетсярастворителем.

Этотпроцесс повторяется, по слою за раз, до полногосоздания всейсхемы. Излишнеговорить, чтодетали размеромв миллионнуюдолю метраможет испортитьмельчайшаяпылинка. Такаяпылинка можетбыть повсюду, размером отмикрона до ста- а это в 3-300 разбольше детали.Микропроцессорыпроизводятсяв сверхчистойсреде, где операторыодеты в специальныезащитные костюмы.

Впрежние временапроизводствополупроводниковприводило кудаче или неудачес отношениемуспеха менее50% работающихчипов. Сегоднявыход результатанамного выше, но никто неожидает 100%. Кактолько новыйслой добавляетсяна пластину, каждый чиптестируетсяи отмечаетсялюбое несоответствие.Индивидуальныечипы отделяютсяи с этой точкизовутся матрицами.Плохие бракуются, а хорошиеупаковываютсяв PGA (Pin Grid Arrays) корпус- керамическийпрямоугольникс рядами штырьковна дне, именнотакой корпусбольшинстволюдей принимаютза процессор.

4004использовал10-микронныйпроцесс: наименьшиедетали составлялиодну 10-миллионнуюметра. По сегодняшнимстандартамэто чудовищно.Если предположить, что Pentium Pro изготовленпо такой технологиион был бы размером14x20 сантиметров, и был бы медленным- быстрые транзисторымалы. Большинствопроцессоровсегодня используют0.25-микронныетехнологию, и 0.1-микронныйпроцесс — среднесрочнаяперспективадля многихпроизводителей.

Программнаясовместимость

Назаре компьютерноговека многиелюди писалисвои программы, а точный наборисполняемыхинструкцийпроцессоране был существенен.Сегодня, однако, люди ждут возможностьиспользоватьготовые программы, так что наборинструкцийпервостепенен.Хотя ничегонет магическогос техническойточки зренияв архитектуреIntel 80x86, она уже давностала индустриальнымстандартом.

Когдасторонниепроизводителиделают процессорс другимиинструкциями, он не будетработать спринятым стандартнымпрограммнымобеспечением, и в результатене продается.В дни 386-х и 486-хкомпании, напримерAMD, клонировалиинтеловскиепроцессоры, но это всегдабыло с отставаниемна поколение.Cyrix 6x86 и AMD K5 были конкурентамиинтеловскогоPentium, но это былине чистые копии.K5 имел собственныйнабор инструкцийи транслировалинструкции80x86 во внутренниепри загрузке, так что K5 нетребовал припроектированиипредварительногосоздания Pentium.Многое в действительностисоздавалосьпараллельно, сдерживалатолько схематрансляции.Когда K5 наконецпоявился, онперепрыгнулPentium в отношениипроизводительностипри одинаковыхчастотах.

Другойпуть, по которомупроцессорыс разной архитектуройотносительноединообразнык внешнемумиру, — это стандартнаяшина. В этомотношениивведенная в1994 году шина PCI — один из наиболееважных стандартов.PCI определяетнабор сигналов, разрешающихпроцессоруобщаться сдругими частямиPC. Он включаетшины адресаи данных, плюснабор управляющихсигналов. Процессоримеет своисобственныешины, так чточипсет используетсядля преобразованияиз этой «частной»шины в «публичную»PCI.

--PAGE_BREAK--

Pentium

ВведениеPentium в 1993 году революционизировалорынок PC, вложивв корпус среднегоPC больше мощи, чем имела NASA вкондиционируемыхкомпьютерныхпомещенияхначала 60-х. АрхетектураPentium представляетшаг вперед от486.

Этобыл основанныйна CISC чип с более3.3 миллионамитранзисторов, произведенныйпо 0.35-микроннойтехнологии.Внутри процессориспользовал32-разряднуюшину, но внешняяшина данныхбыла 64-разрядна.Внешняя шинатребоваладругих материнскихплат, и для ихподдержки Intelвыпустил специальныйчипсет длясвязи Pentium с 64-разряднымвнешним кэшеми шиной PCI.

БольшинствоPentium (75MHz и выше) работаютна 3.3V с 5V вводом-выводом.У Pentium двойнойпотоковыйсуперскалярныйдизайн, позволяющийему выполнятьбольше инструкцийза тик. Пятьстадий (загрузка, декодирование, генерацияадреса, выполнениеи выгрузка) приисполнениицелочисленныхинструкцийостаются, какв 486, но Pentium имеетдва параллельныхцелочисленныхпотока, позволяющихему читать, интерпретировать, выполнять, изаписыватьдве операцииодновременно.Так проводятсятолько целочисленныеоперации — сдробными числамиобращаетсяотдельныймодуль плавающейточки.

Pentiumтакже используетдва 8-килобайтныхассоциативныхбуфера, болееизвестных какпервичный илипервого уровнякэш) — один дляинструкцийи другой дляданных. Объемкэша удвоенпо сравнениюс предшественником,486. Этот кэш добавляетк производительности, посколькудействует каквременноехранилищеинформациидля данных, доставляемыхиз медленнойосновной памяти.

БуферВетвлений (BTB)обеспечиваетдинамическоепредсказаниеветвлений. Онулучшает выполнениеинструкцийзапоминаниемспособа ветвленияи применениемтой же ветвипри следующемвыполненииинструкции.Когда BTB делаетправильноепредсказание, производительностьувеличивается.80-точечный МодульПлавающей Точкиобеспечиваетарифметическоесредство дляобращения с«вещественными»числами.


Обзорпроцессоров

Pentium Pro

ИнтеловскийPentium Pro, выпущенныйв конце 1995 годас ядром CPU, состоящимиз 5.5 миллионовтранзисторов, плюс 15.5 миллионовтранзисторовво вторичномкэше, изначальнопредназначалсядля рынка серверови high-end рабочихстанций. Этотсуперскалярныйпроцессорвключает особенностипроцессороввысшей категориии оптимизированпод 32-битныеоперации.

PentiumPro отличаетсяот Pentium'а наличиемвстроенноговторичногокэша размеромот 256kb до 1mb, работающегона внутреннейчастоте. Помещениевторичногокэша на чипе, а не на системнойплате, позволяетпередаватьданные по 64-битномуканалу, а не по32-битной системнойшине у Pentium. Такаяфизическаяблизость такжедобавляет кросту производительности.Эта комбинациянастолькомощна, что 256kbвстроенногокэша эквивалентны2mb на системнойплате.

Дажебольшим факторомв производительностиPentium Pro являетсякомбинациятехнологий, известных как«динамическоевыполнение».Оно включаетпредсказаниеветвлений, анализ потокаданных и спекулятивноевыполнение.Их комбинированиепозволяетпозволяетпроцессоруиспользоватьпропадающиеиначе циклытиков, производяпредсказанияпрограммногопотока выполненияинструкцийвперед.

PentiumPro был также первымпроцессоромв семействеx86 с применениемсверх поточности(superpipelining), этот потоквключает 14 стадий, делящихся натри секции.Очереднаяподготовительнаясекция, обрабатывающаядекодированиеи вывод инструкции, состоит извосьми стадий.Внеочередноеядро, выполняющееинструкцию, имеет три стадиии очередноезавершениесостоит из трехфинальныхстадий.

Другим, более важнымотличием Pentium Proявляется егообращение синструкциями.Он получаетCISC (Complex Instruction Set Computer) x86 инструкции, и преобразовываетих во внутреннийRISC (Reduced Instruction Set Computer) микрокод.Преобразованиеспроектированотак, чтобы избежатьнекоторыеограничения, унаследованныеот набора инструкцийx86, таких какнерегулярноедекодированиеинструкцийи арифметическиеоперациирегистр-в-память.Микрокод затемпересылаетсяво внеочереднойисполнительинструкций, который определяет, готова ли инструкцияк выполнению, и, если нет, передвигаеткод по кругу, чтобы предотвратитьзастопорениепотока.

Умиграции всторону RISC естьсвои минусы.Во-первых, преобразованиеинструкцийзанимает время, пусть оно дажемеряется внано- или микросекундах.В результатеPentium Pro неизбежнотратит производительнуюмощь на обработкуинструкций.Второй минусв том, что внеочереднойдизайн можетчастично влиятьна 16-битный код, приводя кзастопориванием.Это может бытьпричиной частичногообновлениярегистра, происходящегодо полногочтения регистра, и налагатьстрогие производственныеиздержки досеми цикловтика.

PentiumPro был первыммикропроцессором, не использующимпочтенныйSocket 7, требуя большего242-контактногоинтерфейсаSocket 8 и ново годизайнасистемных плат.

MultiMedia eXtensions

ПроцессорIntel’s P55C MMX с мультимедиарасширениемвыпускаетсяс начала 1997 года.Он представилнаиболее значительноеизменениебазисной архитектурыпроцессоровPC за последниедесять лет иобеспечивалтри главныхулучшения:

встроенный кэш первого уровня стандартного Pentium удваивался до 32kb

добавлено 57 новых инструкций, предназначенных специально для более эффективного манипулирования видео, аудио и графическими данными

был развит новый процесс, названный SIMD (Single Instruction Multiple Data — Одна Инструкция Много Данных) и позволяющий выполнять одинаковую инструкцию ко многим экземплярам данных одновременно.

Большийпервичный кэшзначит, чтопроцессор имеетпод рукой большеданных, уменьшаянужду в полученииданных из кэшавторого уровня, что положительноотражаетсяна всех программах.Новые инструкции, применяемыев совокупностис SIMD и восемьюрасширенными(64-битными) регистрами, значительноиспользуютпараллелизм, когда восемьбайт данныхможно обработатьза один цикл, а не по одномуза цикл. Получаетсяспециальноепреимуществодля мультимедиа-и графическихприложений, таких как аудиои видео де/кодирование, масштабированиеобразов иинтерполяция.Вместо перемещениявосьми пикселейграфическихданных процессоромпо одному зараз, эти восемьпикселей могутбыть передвинутыкак один 64-битныйпакет, и обработаныза один цикл.

ПоутверждениямIntel, эти усовершенствованиядают 10-20% увеличениескорости дляне-MMX приложений, и более 60% ускорениядля MMX приложений.

Tillamook

ЗаметноеотсутствиеMMX версии дляноутбуков Intelисправил вконце 1997 годаобъявлениеммобильныхверсий процессорас кодовым названиемTillamook, по именинебольшогогорода в Opегоне.Новые процессорыс частотой 200и 233MHz и технологиейMMX на некотороевремя выдвинулиноутбуки науровень настольныхсистем. 226MHz версиябыла выпущенапозже в 1998 году.

Tillamook- это первыйпроцессор, построенныйна развитомIntel Mobile Module для ноутбуков(MMO). Модуль держитпроцессор,512kb вторичногокэша, регуляторнапряжениядля питанияпроцессораот высшеговнешнего напряжения, часы, и новый«северный мост»430TX PCI. Соединяетсяс системнойплатой рядомиз 280 разъемов, подобно SEC картриджуPentium II.

Наибольшимотличием всамом чипе былоприменение0.25-микроннойтехнологиипо сравнениюс применявшейсяраннее Intel в мобильныхчипах 0.28. Меньшиймикрон фактороказал влияниена частоту инапряжение: транзисторыв процессоре(с электрическиминулями и единицами)ближе примыкались, и скоростьавтоматическиувеличивалась.Так как транзисторысближались, напряжениеуменьшалось, чтобы избежатьразрушенийот сильныхэлектрическихполей. Предыдущиеверсии мобильныхинтеловскихпроцессоровпитались от2.45v на ядре, а уTillamook оно было опушенодо 1.8v. Регуляторнапряжениятребовалсядля защиты чипаот шин PCI и памяти, которые работалина 3.3v. От уменьшениянапряженияна процессорезначительноэкономиласьэнергия.

Pentium II

Выпущенныйс середины 1997года, Pentium II ввелряд большихизменений вмир процессоровPC.

Во-первых, чип и системныйкэш второгоуровня соединялисьпо выделеннойшине, способнойработать начастоте шиныпроцессор-система.

Вовторых, процессор, вторичный кэши тепло отводбыли смонтированына небольшойплате, вставлявшейсяв разъем насистемнойплате, что большенапоминалокарту расширения, чем традиционнуюсхему процессор/гнездо.Intel окрестил этоSingle Edge Contact cartridge (SEC) — одностороннеконтактныйкартридж. Вэтом картридженаходятся шестьотдельныхкомпонент — процессор, четыре индустриальностандартныхburst-static-cache RAM и один tag RAM.Дизайн SEC картриджанаделял важнымипреимуществами.PGA-компоновкаPentium Pro требовала387 контактов, в то время какSEC-картридж — только242. Уменьшениена треть числаконтактовпроизошлоблагодаряналичию в картриджедискретныхэлементов, таких как замыкающиерезисторы иконденсаторы.Эти элементыобеспечиваютрасщеплениесигналов, чтозначит намногоменьшее числотребуемыхразъемов питания.Разъем SEC-картриджаиспользуеттак называемыйSlot 1 и воспринимаетсякак принимающийэстафету ууходящегоSocket 7.

Третьеизменение — вбольшем синтезе, так как Pentium II объединяетDual Independent Bus (DIB) от Pentium Pro c технологиейMMX от Pentium MMX, формируяновый вид — гибридPentium Pro/MMX. Таким образом, внешне оченьотличный отпредыдущихинтеловскихпроцессоров,Pentium II внутреннеявляет собойсмесь новыхтехнологийи улучшенийстарых чипов.

Инаконец, в отличиеот Pentium Pro, работающегона 3.3v, Pentium II питаетсяот 2.8v, позволяяIntel пускать егона большихчастотах безчрезмерногоувеличениятребованиек мощности. Вто время, как200MHz Pentium Pro с 512kb кэшапотребляет37.9 ватт, 266MHz Pentium II с 512kbкэша сжигает37.0 ватт.

ПодобноPentium Pro, Pentium II применяетинтеловскуюТехнологиюДинамическогоИсполнения.Когда программнаяинструкциясчитываетсяв процессори декодируется, она попадаетв исполняемыйпул. ТехнологияДинамическогоИсполненияпринимает триосновных подходак оптимизацииспособа обращенияпроцессорас кодом. МножественныеПредсказанияВетвленийпроверяютпрограммныйпоток вдольнесколькихветвей и предсказывают, где в памятинаходитсяследующаяинструкция.

Когдапроцессорчитает, он такжепроверяетследующиеинструкциив потоке, ускоряяв результатерабочее течение.Анализ ПотокаДанных оптимизируетпоследовательность, в которой инструкциибудут выполняться, проверяядекодированныеинструкциии определяя, готовы ли онидля обработкиили зависятот других инструкций.СпекулятивноеВыполнениеувеличиваетскорость такихинструкцийпросмотромвперед от текущейинструкциии обработкойдальнейшихинструкций, которые вероятномогут понадобится.Эти результатыхранятся какспекулятивныедо тех пор, покапроцессор неопределит, какие ему нужны, а какие — нет.С этой точкиинструкциявозвращаетсяв нормальнуюочередь и добавляетсяк потоку.

УТехнологииДинамическогоИсполненияесть два основныхпреимущества: Инструкцииобрабатываютсябыстрее иэффективнее, чем обычно, и, в отличие отCPU с применениемRISC архитектуры, программы ненадо перекомпилироватьдля извлечениявыгод процессора.Процессор вседелает на лету.

Значительнойновой особенностьюявляется удалениевторичногокэша из собственнопроцессорана отдельнуюкремниевуюпластину вкартридже.Процессорчитает и пишетданные в кэшеиспользуяспециализированнуювысокоскоростнуюшину. Называемаязадней (backside) шиной, она отделенаот системнойшины процессор-память(сейчас называемойпередней (frontside)шиной). Процессорможет использоватьобе шины одновременно, но архитектурадвойной независимойшины имеетдругие преимущества.

Хотяшина междупроцессороми кэшем второгоуровня работаетмедленнее, чемна обычномPentium Pro (на половинескорости процессора), она чрезвычайномасштабируема.Чем быстреепроцессор, тембыстрее кэш, независимоот 66MHz переднейшины. Вдобавок, передняя шинаможет бытьувеличена с66 до 100MHz без влиянияна шину кэшавторого уровня.Также очевидно, что наличиепамяти на одномкристалле спроцессоромнегативносказываетсяна процентевыхода годных512kb Pentium Pro, сохраняявысокими цены.
Pentium II опираетсяна GTL+ (gunning-transceiver-logic) логикухост-шины, допускающуюестественнуюподдержку двухпроцессоров.Во время выходаэто обеспечивалостоимостноэффективноеминималистскоедвухпроцессорноерешение, допускаемоесимметричноймультипроцессорностью(SMP). Двухпроцессорноеограничениеналагалосьне самим Pentium II, аподдержкойчипсета. Изначальноеограничениечипсета двухпроцессорнойконфигурациейпозволяло Intelи поставщикамрабочих станцийпредлагатьдвухпроцессорныесистемы каквременное иэкономичноерешение, чтопо другому ине было возможно.Это ограничениебыло снято ссередины 1998 годас выходом чипсета450NX, поддерживающегоот одного дочетырех процессоров.Чипсет 440FX, содержащийчипы PMC и DBX, не допускалчередования(interleaving) памяти, ноподдерживалEDO DRAM, позволяяулучшатьпроизводительностьпамяти уменьшениеможидания.

КогдаIntel проектировалPentium II, он также взялсяза слабую 16-битнуюпроизводительностьего предшественника.Pentium Pro роскошноработает сполностью32-битным обеспечением, таким как Windows NT, но опускаетсяниже стандартногоPentium'а, обрабатывая16-битный код.Это влечетхудшую чемPentium производительностьпод Windows 95, большиечасти которойпока 16-битны.Intel решил этупроблемуиспользованиемпентиумногокэша с дескрипторамисегментов вPentium II.

Каки Pentium Pro, Pentium II чрезвычайнобыстр в арифметикеплавающейточки. В сочетаниис Accelerated Graphics Port (AGP) это делаетPentium II мощным решениемдля высокопроизводительной3D графики.

Deschutes

333MHzвоплощениеPentium II под кодовымназваниемDeschutes (по реке, текущейв Орегоне), былоанонсированов начале 1998 годас планируемымив течение года400MHz и выше. ИмяDeschutes в действительностиотносится кдвум разнымлиниям CPU.

Версиядля Slot 1 — ничегоболее, чем слегкаэволюционировавшийPentium II. Архитектураи физическийдизайн идентичны, за исключениемтого, что Deschutes Slot 1частью сделанс использованием0.25-микроннойтехнологии, введеннойосенью 1997 годас ноутбучнымпроцессоромTillamook, по сравнениюс 233-300MHz версиями, выполненнымипо 0.35-микронномупроцессу. Применение0.25-микрон означает, что транзисторына матрицефизически ближемежду собойи CPU потребляетменьше энергии, а следовательнорассеиваетменьше теплана данной частоте, позволяя ядрутикать на большихчастотах.

Всеиное у Slot 1 Deschutes идентичнообычному Pentium II.Смонтированныйна основаниеи заключенныйв SEC картридж, он поддерживаетнабор инструкцийMMX и общаетсяс 512kb вторичногокэша на половиннойчастоте ядра.Он имеет тотже конечныйконнектор, иработает натех же системныхплатах с темиже чипсетами.Как таковойон работаетс 440FX или 440LX на внешнейчастоте 66MHz.

Свесны 1998 годабольшой шагв производительностипришел со следующимвоплощениемDeschutes, когда вышелновый чипсет440BX, допускающий100MHz передачу посистемной шине, уменьшаязакупориваниеданных и поддерживаячастоты от 350до 400MHz.

Другойпроцессор, зовущийсяDeschutes, относитсяк Slot 2, выпущен ссередины 1998 годакак Pentium II Xeon. Intel разбилSlot 1 и Slot 2 Deschutes на взаимодополняющиетоварные линии, где Slot 1 предназначендля массовогопроизводства, а Slot 2 нацелен наhigh-end серверы итуда, где ценавторична поотношению кпроизводительности.

МобильныйPentium II

Естественноепродвижениемаломощного(в смысле энергопотребления/рассеивания)семействаPentium II Deschutes на рынокпортативныхPC осуществилосьс выпускомлинейки мобильныхPentium II в апреле 1998года. Новыйпроцессор иего компаньонмобильный 440BXчипсет, изначальнобыли доступныв 233 и 266MHz вариантах, скомпонованныев существующиймобильныймодуль (MMO) илиновый мини-картриджформат. Intel ожидаетк концу 1998 годаболее половиныиз снаряженныхего мобильнымипроцессорамиPC будут уже PentiumII, а срок мобильныхPentium II Tillamook окончитсяк середине 1999года.

Celeron

Впопытке лучшегоудовлетворениясектора дешевыхPC, до настоящеговремени вотчиныпроизводителейклонов, AMD и Cyrix, продолжающихразвиватьунаследованнуюархитектуруSocket 7, Intel выпустилсвой ряд процессоровCeleron в апреле 1998 года.

Основанныйна той же P6 архитектуре, что и Pentium II, и используятот же 0.25-микронныйпроцесс, Celeron-системыпредлагаютполный комплектпоследнихтехнологий, включая поддержкуAGP графики, ATA-33 жесткихдисков, SDRAM и ACPI.Celeron будет работатьна любом интеловскомPentium II чипсете, поддерживающим66MHz системнойшины, включая440LX, 440BX и новый 440EX, специальноспроектированныйдля рынка 'базовых'PC. В отличие отPentium II с его SEC картриджем,Celeron не имеет защитногопластикогопокрытия вокругкарт процессора, что Intel называетSingle Edge Processor Package (SEPP). Он полностьюсовместим соSlot1, что позволяетиспользоватьсуществующиеплаты, но механизмкрепления длякарты CPU не адаптировандля форм фактораSEPP.

Первые266 и 300MHz Celeron'ы без кэшавторого уровнявстретили малоэнтузиазмана рынке, ненеся или несямало преимуществнад системами-клонамиSocket 7. В августе1998 года Intel пополнилряд Celeron семействомпроцессором, названныхMendocino. Снабженный128kb вторичногокэа на матрице, работающегона полной частотепроцессора, и соединяясьчерез внешнюю66MHz шину, новыйCeleron стал намногоболее живым, чем его вялыйпредшественник.Отчасти путано, две доступныеверсии получилиназвания Celeron 333и 300a. Первый являетсяосновной версией, совместимыйс существующейинтеловскойархитектурой, в то время каквторой патентуетPin 370 socket, отличныйот Socket 7 и Socket 1, нацеленныйна дешевыеlow-end машины.

Pentium II Xeon

Виюне 1998 года Intelпредложил свойпроцессорPentium II Xeon. ТехническиXeon представляеткомбинациютехнологийPentium Pro и Pentium II и спроектирован, чтобы предложитьвыдающуюсяпроизводительностьв критическихприложенияхрабочих станцийи серверов.Используя новыйинтерфейс Slot2, Xeon приблизительновдвое большеразмера Pentium II, восновном из-заувеличениякэша второгоуровня.

Каки 350 и 400MHz Pentium II CPU, передняяшина работаетна 100MHz для увеличенияобмена. Наиболеезначительнымотличием отстандартногоPentium II являетсято, что кэш второгоуровня работаетна полной частотеядра CPU, в отличиеот дизайна Slot1, ограничивающеговторичный кэшполовинойчастоты ядра, что позволяетIntel использоватьдешевый готовыйburst SRAM как вторичныйкэш, а не производясвой собственныйзаказной SRAM.Намного болеедорогой заказнойполноскорстнойкэш служитглавной причинойразницы в ценахмежду Slot 1 и Slot 2 решениями.

Чиппоставляетсяс тремя размерамивторичногокэша. Рабочиестанции снабжаются512kb версией. 1mb версия, выпущеннаяпозднее, используетсядля серверов, до тех пор, пока2mb версия ожидается(позднее в этомгоду). Системакэша второгоуровня подобнатипу, используемомув Pentium Pro, это однаиз основныхсоставляющихстоимости Xeon.Другая состоитв том, что корректирующийошибки (ECC) SRAM сталстандартомво всех Xeon-ах.

ДругимпреодоленнымXeon'ом ограничениемстал дуальныйSMP (symmetric multiprocessor). Невозможностьзапуска мультипроцессорныхPentium II систем с болеечем двумяпроцессорамибыло основнойпричиной выживанияPentium Pro в сектореhigh-end серверов, когда требуетсячетыре, шестьили восемьпроцессоров.Slot 2 обеспечиваетчетырехстороннююмультипроцессорность.

ХотяIntel решил направитьXeon на оба рынка- рабочих станцийи серверов, онразработалразные чипсетысистемных платдля каждогоиз них. 440GX построенвокруг архитектурыядра 440BC чипсетаи предназначендля рабочихстанций. 450NX, сдругой стороны, спроектированспециальнодля рынка серверов.

БудущиеразработкиIntel

Intelсейчас имеетв разработкеряд процессоров

Katmai, названный в честь вулкана на Аляске, отмечен как новая версия Pentium II. Katmai будет основан на P6 архитектуре, начатой Pentium Pro. Подобно Deschutes, этот чип строится на интеловском 0.25-микронном процессе. Наиболее значительным отличием будет ревизия MMX расширения поднятием до MMX2. MMX2 содержит больше 32-битных инструкций — существующий MMX во многом 16-битен — и значительно улучшает производительность 3D графики. Другие изменения включают 100MHz внешнюю шину, увеличенный Level 1 кэш и новую логику ядра чипсета, спроектированную для преодоления 500MHz рубежа скорости Pentium II. Katmai наиболее вероятно увидит свет в начале 1999 года.

Dixon, следующий представитель семьи Mendocino, обещается во второй половине 1999 года. Вероятно, он будет включать больше кэша второго уровня (192 или 256kb) и Katmai New Instructions (KNI), наконец полностью вытиснившие MMX.

Willamette, названный по другой орегонской реке, — изменение поступи Intel. С развитым ядром Pentium Pro и возможностью 100MHz внешней шины, Willamette ожидается более чем на 50% быстрее существующих Pentium II. Willamette по слухам усилит производительность плавающей точки и поддержку 3D геометрии. Он найдет свой путь на рынок в конце 1999 года, но не станет массовым в настольных системах до 2000-го.

Merced, названый по калифорнийской реке, отметит конец процессоров, использующий x86 архитектуру. Результат совместного проекта исследований Hewlett-Packard и Intel, Merced станет первым процессором, использующим полный 64-битный IA-64 набор инструкций. Это должно привести к производительности, превосходящей старые RISC и CISC процессоры. Merced, однако, еще будет способен выполнять x86 инструкции, но не без ущерба в производительности. Merced, появление которого ожидается к середине 2000 года, позиционируется как новая эра в вычислительной мощи. Он, вероятно, будет обслуживать в основном рынок серверов и рабочих станций, в то время как Willamette, по существу обрезанная версия Mersed, будет работать в high-end персональных компьютерах.



еще рефераты
Еще работы по информатике