Реферат: Процессор AMD. История развития

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ

ЧЕРКАССКИЙГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ

КАФЕДРАКОМПЬЮТЕРНЫХ СИСТЕМ














РЕФЕРАТ

По дисциплинеИнформатика и компьютерная техника

На тему: ПроцессорAMD. Историяразвития.

Выполнил:

Студент 2-го курсаФИТИС

Группа ЕК-08

Кондратенко В. В.

ЧЕРКАССЫ

2001

<img src="/cache/referats/11440/image001.gif" align=«left» hspace=«10» v:shapes="_x0000_s1027">ОбAMD AMD — мировойпоставщик интегральных микросхем для рынка персональных и сетевых компьютеров икоммуникаций, чьи производственные мощности расположены в Соединенных Штатах,Европе, Японии и Азии. AMD производит микропроцессоры, устройства флэш-памяти ивспомогательные микросхемы для коммуникационных и сетевых приложений. КомпанияAMD, основанная в 1969 году со штаб-квартирой в г. Саннивейл(шт. Калифорния), в 2000 году имела оборот 4,6 млрд. долл. (NYSE: AMD).

Первым процессором,который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году.Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Каквсегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте ипроизводительности, AMD не смогла тогда завоевать расположения пользователей.

После этого провала AMDприобрела забытую сейчас фирму NexGen, еще одногонезависимого разработчика x86 процессоров, который обладал передовой на товремя технологией и в небольших количествах выпускал кристаллы безарифметического сопроцессора. Используя эти наработки, AMD спроектировала новоепоколение своих CPU — K6. По операциям с целыми числами эти процессоры сталипревосходить аналоги от Intel, однако блок операций сплавающей точкой все еще оставлял желать лучшего.

AMD не сдавалась и длянужд компьютерных игр предложила использовать не сопроцессор, а специальноспроектированный набор SIMD-инструкций 3DNow!.. Так появился процессор AMD K6-2,в котором к обычному ядру K6 добавился еще один блок операций с числамиодинарной точности с плавающей точкой. Благодаря тому, что он мог выполнятьоднотипные вычисления с четырьмя парами операндов одновременно, на специальнооптимизированных под 3DNow! приложениях K6-2 показывал неплохуюпроизводительность.

В скоре AMD к своемупроцессору K6-2 добавила интегрированный в ядро кешвторого уровня, работающий на частоте кристалла. Это спасло производительность- полученный K6-III мог успешно конкурировать с аналогами.

Находясь в состоянииценовой войны, Intel и AMD пришли к тому, что самыедешевые Intel Celeronпродаются практически по себестоимости, если не ниже, а на рынке дорогихпроцессоров обосновался другой продукт от Intel — Pentium III. Единственный оставшийся шанс выжить дляизмотанной и порастерявшей в борьбе свои капиталы AMD- вылезти на рынок дорогих и производительных процессоров. Причем, закрепитьсяна нем не за счет цены — этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнееAMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив нарынок процессор нового поколения — Athlon.

Развитие семейства K-6

<img src="/cache/referats/11440/image002.jpg" v:shapes="_x0000_i1025">

AMD K6

Clockspeeds (MHz)                          166,200, 233

Level one(L1) cache                         32Kinstruction, 32K data

Level two(L2) cache                         Controlledby chip set

L2 cachespeed                                  Sameas bus

Type of bus                                       Socket7

Bus speed(MHz)                               66

Instructionsper clock cycle               2

MMX units                                        1

PipelinedFPU                                   N

Out-of-orderexecution                      Y

Processtechnology                            0.35µCMOS

Die size                                              162mm2

Transistors                                         8.8million

AMD K6-2

<img src="/cache/referats/11440/image003.jpg" align=«left» hspace=«10» v:shapes="_x0000_s1029">Этот процессор являетсялогическим продолжением линейки K6 и отличается от предшественника только добавленним в ядро нового модуля, обрабатывающего«3D-инструкции» и носящего название 3DNow!.. По сути — это еще одинсопроцессор по типу MMX, но умеющий выполнять 21 новую инструкцию. Эти новыеинструкции призваны, прежде всего, ускорить обработку данных, связанных стрехмерной графикой. Поэтому в набор инструкций 3DNow! включены команды,работающие с вещественночисленными аргументамиодинарной точности. Именно поэтому, технология ММХ не пошла в жизнь — ММХработает с целыми числами, а при расчете трехмерных сцен оперировать приходитсяс вещественными. Как и ММХ, 3DNow! использует те же регистры, что исопроцессор, это связано с тем, что операционные системы должны сохранять исбрасывать все регистры процессора при переключении задач.

Теоретически, 3DNow!должен заменить сопроцессор при расчетах трехмерной геометрии и существенноускорить выполнение этих вычислений. Модуль 3DNow! может выполнять до четырехSIMD (Single Instruction Multiple Data) инструкций (изсвоего 21-командного набора) параллельно, что при грамотном использовании можетдать небывалый прирост производительности. Хорошей иллюстрацией этого тезисаможет послужить Quake2, работающий на процессорах K6 в полтора раза медленней,чем на Pentium той же частоты. Однако, вопрекираспространенному мнению, это связано не с тормознутостьюAMD-шного сопроцессора, а с тем что Intel реализовалв своем кристалле возможность параллельной работы процессора с арифметическимсопроцессором. В Quake2, код оптимизирован с учетом этой особенности, поэтомуесли процессорные и сопроцессорные инструкции не могут выполняться одновременно(как на AMD K6), производительность получается крайне низкая. K6-2 долженрешить эту проблему, но другим путем — за счет конвейеризации 3D вычислений вмодуле 3DNow! Однако, вопрос распараллеливания вычислений должен решатьсяпрограммистом, что вызывает определенные трудности при реализации алгоритмов,тем более, что процесс вычисления геометрии 3D-сцен далеко не линейный.Поэтому, теоретическая производительность К6-2, значительно превышающаяскорость всех современных PII-процессоров, достигнута быть не может.

Таким образом, чтобы от3DNow! был хоть какой-то эффект, необходимо, чтобы приложение использовало тесамые 21 инструкцию. Причем не как-нибудь, а с учетом конвейерной структурыэтого модуля процессора.

AMD K6-2 3DNow!

<img src="/cache/referats/11440/image004.jpg" align=«left» hspace=«10» v:shapes="_x0000_s1028"> AMDвновь надеется сократить отрыв от Intel'а, на этотраз с помощью технологий высокого уровня и заточенных под процессор 3Dдрайверов. Названная «K6-2 3DNow!», эта серия процессоров должнаразбить иллюзию, что пользователи должны покупать процессоры Intel Pentium II для достижениямаксимально возможного 3D быстродействия.

Выйдя в 300 и 333Мгцверсиях, линия K6-2 содержит некоторые улучшения, по сравнению с уже знакомойпользователям линии K6. Улучшенный сопроцессор, более высокие скорости работыядра, поддержка 100Мгц кэша 2 уровня, и наборинструкций, известный как 3Dnow!, — вот качества, вознесшие K6-2 на вершинупредлагаемых AMD процессоров.

3DNow!, говорячеловеческим языком, — это улучшенный процесс вычислений, ускоряющий обсчитывание сцены для 3D графики. Cyrellisуже раньше упоминал, что одним из главных препятствий для ускорителей 3Dграфики является конфликт между медленным созданием сцены типичным процессором Intel/AMD и возможностями родного процессора 3D карты. Видеокарта должна дождаться, пока CPU завершит свою работу,и только тогда ее 3D-процессор будет в состоянии выжать требуемое намколичество кадров в секунду. 3DNow! обещает изменить такое положение вещей,проносясь сквозь генерацию сцены на максимальной скорости, тем самымзначительно повышая производительность.

Вот как это выглядит:

<img src="/cache/referats/11440/image005.jpg" v:shapes="_x0000_i1026">

Как вы видите, процессорзагружен работой, даже если 3D-ускоритель берет на себя генерациютреугольников, как например это делает чипсетVoodoo2.

Технология3DNow!

Технология3DNow!, предложенная AMD в своем новом процессоре K6-2 (кодовое имя было K63D), представляет собой развитие применяемой повсеместно технологии MMX. MMX — это дополнительные 57 инструкций процессора и 8 дополнительных регистров,которые призваны увеличить производительность мультимедийных приложений. Еслипрограмма использует эти возможности, то это вносит немалый вклад в скорость еевыполнения. MMX была введена в процессорах фирмы Intel,но к настоящему моменту все x86-процессоры, включая AMD, IDT и Cyrix, поддерживают ее. Однако, несмотря на повсеместнуюподдержку, MMX используется недостаточным числом приложений, поэтомупреимущества от наличия поддержки MMX пока невелики.

Послевнедрения MMX, инициатива по внедрению новых инструкций неожиданно перешла кAMD. Правда, в ответ на этот шаг, Intel анонсировалнабор команд MMX2, который появился в процессоре Katmai. Дополнительная система команд от AMD,названная 3DNow! (кодовое имя было AMD-3D Technology),представляет собой набор инструкций для ускорения операций трехмерной графики.Этот набор включает, в частности, быстрое деление вещественных чисел,выполняемое за 3 такта процессора, и вычисление обратной величины к квадратномукорню, выполняемое также за 3 такта. По мнению AMD, использование в 3D-играхтехнологии 3DNow! позволит 300-мегагерцовому K6-2 догнать по производительностиPentium II 400 МГц.

AMD K6-III

<img src="/cache/referats/11440/image006.gif" align=«left» hspace=«10» v:shapes="_x0000_s1030">Вслед за выходом очередногопроцессора от Intel, PentiumIII, появилась новинка и от AMD — процессор K6-III. Этот процессор должен былпозволить AMD подняться из ниши дешевых систем и начать конкуренцию с Intel на рынке более дорогих машин, подготавливая почву длянанесения решающего удара по позициям микропроцессорного гиганта блокбастером K7. Долгое ожидание, чтение спецификаций ипервые впечатления от AMD K6-III давали все основания для того, чтобы надеятьсяна то, что позиции Intel пошатнутся. Но, традиционно,AMD выступает в роли догоняющего, а для победы в этом случае, согласно военнойтактике, требуется немалое превосходство в силе. Но, тем не менее, новый раундсражения AMD против Intel, Socket7 против Slot1,Давид против Голиафа, начался.

Вот технические данныепроцессора AMD K6-III:

Чип, производимый по технологии 0.25 мкм; Ядро CXT, представляющее собой обычное ядро K6-2 с возможностью пакетной записи; Работает в Socket-7-системных платах, но требует обновления BIOS; Кэш первого уровня — 64 Кбайта, по 32 Кбайта на код и данные; Имеет встроенный кэш второго уровня объемом 256 Кбайт; Кэш материнской платы работает как кэш третьего уровня; Напряжение питания 2.3-2.5В (есть разные партии); Набор из 21 SIMD-команды 3DNow! Имеется 2 конвейера, оперирующие с двумя парами вещественных чисел одинарной точности; Частоты — 350, 400, 450 и 475 МГц. Системная шина 100 МГц (для модели 475 МГц — 95 МГц). Возможна работа и на 66МГц системной шине; 3DNow! поддерживается в DirectX 6.0 и выше.

Как видно изспецификации, AMD K6-III — это AMD K6-2 плюс 256 Кбайт кэшавторого уровня, интегрированного в ядро и работающего на его частоте. Помня,какие чудеса производительности показывает Intel Celeron, от AMD K6-III ожидается также немалый прирост вбыстродействии, тем более, что шина памяти — главное узкое место в системе,хоть она и работает на частоте 100 МГц. К тому же L2 кэш eК6-III имеет размер в два раза больший, чем у Celeronи в два раза более быстрый (хотя и вдвое меньший), чем у PentiumII. Не следует к тому же забывать и про кэш, установленный на материнской плате- он становится кэшем третьего уровня и добавляет ещенесколько процентов производительности.

Надо уделить внимание иеще одному факту, а именно буквам CXT в названии ядра. Это ядро появилось впроцессорах K6-2 совсем недавно и отличается от предшествующего наличиемфункции пакетной записи в память Write Allocate. То есть, новое ядро позволяет передавать данныепо шине не как придется, а по мере накопления 8-ми байтовыми пакетами, что даетнебольшой выигрыш в производительности при передаче данных по 64-битной шине.Правда, новой эту функцию назвать нельзя, так как WriteAllocate имеется и в интеловскихпроцессорах еще со времен Pentium Pro.

Что касается 3DNow!, тотут по сравнению K6-2 все осталось совсем без изменений. Однако, надоконстатировать, что приложений использующих эту технологию на рынке не много, аподдержка 3DNow! в драйверах видеокарт и DirectX не дает практически ничего. Также как и в случае сSSE, для получения значимого прироста в быстродействии, необходимоиспользование SIMD-инструкций при расчете геометрии 3D-сцены, так как функции,оптимизированные в DirectX работают недостаточнобыстро и не используются разработчиками.

Отметим тот факт, чтодля поддержки новых K6-III подойдут и старые Socket7 системные платы, длякоторых есть BIOS с поддержкой ядра CXT и имеющие возможность выставлениянапряжения питания ядра 2.3-2.5В. Однако, если в руководстве к системной платене указан способ выставления этих напряжений, отчаиваться рано. В большинствеслучаев существуют недокументированные установки для такого напряжения питания.

AMD K7

<img src="/cache/referats/11440/image008.jpg" align=«left» hspace=«12» v:shapes="_x0000_s1041">К7 — первый из семействамикропроцессоров х86 7-го поколения, в котором присутствуют конструктивныерешения, до сих пор не применявшиеся в процессорах архитектуры х86 и сулящиевыигрыш в быстродействии даже при одинаковых тактовых частотах. Наиболеевпечатляющим из них является, конечно, 200-мегагерцовая системная шина, однакоесть и другие, менее заметные на первый взгляд новшества, ставящие К7 вышепроцессоров 6-го поколения.

·  Новая архитектура узла вычислений сплавающей точкой (fpu). К7 содержит 3 узлавычислений с плавающей точкой (fpu), любой из которыхспособен принимать на вход инструкции каждый такт работы процессора. При этомодин узел предназначен исключительно для выполнения команды FSTORE! Назначениеэтого узла — обеспечивать обмен между регистрами и памятью в то время, какпроцессор выполняет другие инструкции. Такой подход, хотя и не повышает пиковуюпроизводительность, позволяет достичь более высокой средней производительности,что во многих случаях важнее. Остальные два fpuсостоят из блока сложения (adder) и блока умножения (multiplier). Оба блока используют конвейеры (fully pipelined). Архитектуракаждого fpu такова, что он может принимать на входкаждый такт одну инструкцию сложения и одну умножения, что дает пиковуюпроизводительность 1000MFLOPS при 500МГц. Ближайшим аналогом с точки зренияархитектуры является Pentium II, у которого такжеприсутствуют adder и multiplier.Однако существуют два основных отличия. Во-первых, у PII только adder является полностью конвейеризованным (fully pipelined), multiplier же может принимать инструкцию на вход толькокаждый второй такт. Во-вторых, каждый узел fpu PIIможет принимать только одну инструкцию за такт, таким образом, пиковаяпроизводительность составляет 500MFLOPS при 500МГц. Вышесказанное ни в коемслучае не является нападками на достойную архитектуру семейства Р6, которое до сихпор остается единственным семейством процессоров с конвейерным fpu. Да, чуть не забыл… RisemP6, возможно, будет иметь архитектуру fpu, похожуюна ту, что используется в К7 (как во всем, что связано с компанией Rise, здесь полно тумана, но компания уверенно заявляет,что fpu их процессора способен выполнять 2 инструкциих87 за такт), однако максимальная тактовая частота в 200МГц не позволяет этомупроцессору претендовать на место не только в «высшем обществе», нодаже и в «среднем классе», поэтому сравнивать mP6 с К7 некорректно.

·  Огромный кэш L1. Если помните, Pentium MMX-166 показывал такую же производительность наприложениях, не использующих инструкции ММХ, как и классический Pentium-200. Вчем причина? А причина в том, что чип ММХ имел в 2 раза больше кэша L1 (32К против 16К). Это также объясняет, почемуК6-200 приблизительно равен по производительности PentiumMMX-233 — он имеет 64К кэша. К чему это я? К тому,что в К7 кэш L1 увеличился еще в 2 раза — до 128К. Это еще не гарантируетэффективного роста производительности процессора с увеличением тактовойчастоты, но, по крайней мере, устраняет опасность простоя, из-за обмена спамятью.

·  Модернизируемый кэш L2. У К7кэш L2 будет размещен, по примеру PII, в картридже, а не интегрирован вкристалл, как у К6-3. Результатом этого является возможность«модернизации» кэша. Первоначально егочастота будет составлять 1/3 частоты процессора. В дальнейшем планируетсявыпуск версий с кэшем L2, работающим на частотепроцессора, и, возможно, на половинной частоте. То же и с размером. К7 можетнести кэш L2 размером от 512К в «нижних» моделях до 8МВ в серверныхмоделях «high-end» (впечатляюще, Xeon на сегодня имеет до 2МВ, но цена...).

AMD Duron 650

В то время, когдапопулярность Socket 7 платформ находилась на самомпике, и оба крупнейших микропроцессорных производителя и Intel,и AMD делали процессоры под этот разъем, мы привыкли к тому что AMD предлагаламенее производительные, но и более дешевые решения. Однако, год назад этоположение коренным образом изменилось. Анонсировав Athlon,который архитектурно превосходит Intel Pentium III, AMD удалось на какое-то время захватитьлидерство в производительности процессоров. И хотя Intelвпоследствии удалось усовершенствовать ядро своих процессоров, в которое былдобавлен встроенный кеш второго уровня, AMD прочнообосновалась на рынке скоростных CPU, где и по сей день продолжает укреплятьсвои позиции.

В настоящий момент AMDприменяет против Intel два средства. Первое — агрессивная ценовая политика, в результате которой процессоры Athlon оказались намного дешевле своих соперников, Intel Pentium III, работающих нааналогичной частоте. И второе — благодаря своей архитектуре AMD удаетсяповышать частоту своих процессоров несколько легче, чем Intel.В результате, на настоящий момент, например, AMD уже серийно продает свои гигагерцовые CPU.

Однако, есть у AMD и проблемы. Самая большая головная боль сAthlon — это кеш второгоуровня, выполненный в виде микросхем SRAM, которые до недавнего временирасполагались на процессорной плате и производились сторонними производителями.Младшие модели Athlon имели L2-кеш, работающий наполовинной частоте ядра процессора, однако по мере роста частот производителиSRAM не поспевали за AMD и не могли обеспечить поставки микросхем кеша, работающих на 1/2 частоты процессора. В результате,начиная с частоты 750 МГц Athlon стал снабжаться кеш-памятью, работающей на 2/5 частоты процессора, аначиная с частоты 900 МГц — и вовсе работающей на 1/3 частоты. Таким образом,получилась парадоксальная ситуация, когда самый быстрый L2-кеш оказался у700-мегагерцового Athlon. AMD же, естественно, такаяситуация устроить не могла, так как медленная кеш-памятьвторого уровня начала сдерживать рост производительности процессоров.

Поэтому, решениенаконец-то переместить L2-кеш AMD Athlon с внешнейпроцессорной платы внутрь ядра выглядит вполне логично. Тем более, что обазавода AMD и в Остине и в Дрездене успешно освоилитехнологию 0.18 мкм, что позволило при переходе со старой 0.25 мкм технологииуменьшить площадь ядра Athlon на 82 кв.мм.

В результате, линейкаAMD Athlon получила продолжение в лице процессоров наядре Thunderbird, имеющих кешпервого уровня размером 128Кбайт и 256-килобайтный интегрированный в ядро кеш второго уровня, работающий на полной частоте CPU. Этосемейство новых AMD Athlon с частотой 750 МГц и вышебыло анонсировано более двух недель назад.

Однако, этим AMD неограничилась. Еще год назад при представлении Athlonкомпания заявила о намерении производства различных модификаций своего CPU, рассчитанныхна различные сектора рынка. И вот, наконец, теперь она начала осуществлять своипланы, представив и семейство процессоров AMD Duronориентированное на low-end сектор и являющееся прямымконкурентом Intel Celeron.

<img src="/cache/referats/11440/image010.jpg" v:shapes="_x0000_i1027"><img src="/cache/referats/11440/image012.jpg" v:shapes="_x0000_i1028">

Итак, посмотрим, что жепредставляют из себя процессоры Duron с точки зренияих основных характеристик:

Чип, производимый по технологии 0.18 мкм с использованием медных соединений Ядро Spitfire, основанное на архитектуре Athlon. Содержит 25 млн. транзисторов и имеет площадь 100 кв.мм Работает в специальных материнских платах с 462-контактным процессорным разъемом Socket A Использует высокопроизводительную 100 МГц DDR системную шину EV6 Кеш первого уровня 128 Кбайт — по 64 Кбайта на код и на данные Интегрированный кеш второго уровня 64 Кбайта. Работает на полной частоте ядра Напряжение питания — 1.5В Набор SIMD-инструкций 3DNow! Выпускаются версии с частотами 600, 650, 700 МГц

<img src="/cache/referats/11440/image014.jpg" align=«right» hspace=«10» v:shapes="_x0000_s1040">Итак, с точки зрения архитектуры,Duron ничем не отличается от обычного Athlon, кроме встроенного в ядро 64-Кбайтного кеша второго уровня. Если же сравнить Duronс новыми Athlon на ядре Thunderbird,то различия между ними будут заключаться в размере интегрированного L2 кеша (у Thunderbird он 256 Кбайтпротив 64 Кбайт у Duron) и в частотах (Thunderbird выпускаются с частотами начиная с 750МГц, а Duron — с частотами до 700 МГц). В остальном же,архитектурно и старые и новые Athlon и Duron ничем не отличаются. При этом, все же необходимоиметь в виду, что все же новые процессоры Duron и Thunderbird имеют обновленное и технологическиусовершенствованное ядро, выпускаемое по технологии 0.18 мкм. В результате,например, даже получается, что ядро Duron свстроенным L2-кешем по площади даже меньше, чем ядро K75 (0.18 мкм Athlon).

И отдельно хочетсякоснуться нового форм-фактора и процессорного разъема, который теперьиспользует AMD для своих CPU. Поскольку микросхем SRAM, используемых длявнешнего L2-кеша у новых процессоров Duron и Thunderbird теперь нет, AMD вслед за Intelвновь обратила внимание на процессорный разъем типа socket.Это не только более выгодно из экономических соображений (нет необходимости впроцессорной плате, картридже и т.п.), но и более рационально с точки зренияорганизации лучшего охлаждения. В качестве такого разъема AMD решилаиспользовать 462-контактный Socket A, который посвоим размерам, да и по внешнему виду похож как на Socket7, так и на Socket 370. Поэтому, с Socket A процессорами AMD можно использовать старые Socket 7 и Socket 370 кулеры. Единственное, не следует при этом забывать, чтотепловыделение Duron несколько превосходит количествотепла, отдаваемое Celeron, поэтому они нуждаются внесколько лучшем охлаждении. Например, Duron 650выделяет тепла примерно столько же, сколько и Intel Pentium III 733.

У AMD Duron с системной шиной все в порядке. Поскольку этотпроцессор, как и остальные из семейства Athlonиспользует 100-мегагерцовую DDR шину EV6, пропускная способность этого звенаоказывается 1,6 Гбайт/с. Кеш первого уровня Duron современ выпуска первых Athlon не претерпел никакихизменений — его размер составляет 128 Кбайт. Кеш первого уровня Duron делится на две части — для кешированияданных и для кеширования инструкций.

Что же касается кеша второго уровня, то тут нас ждет небольшой сюрприз.Нетрудно заметить, что у Duron он в два раза меньшечем L1 кеш. Зачам он тогданужен? Ответ на этот вопрос кроется в алгоритме работы L2 кешаDuron и, кстати, Thunderbird.Кеш второго уровня этих процессоров является эксклюзивным, что означает, чтоданные, хранящиеся в L1 кеше в нем не дублируются.Такой метод работы L2 кеша реализован пока только вновых процессорах AMD, все же интеловские процессорыимеют обычный inclusive L2 кеш,данные из L1 кеша в котором дублируются. Поэтому общийобъем эффективной кеш-памяти у AMD Duron составляет 128+64=192 Кбайта, в то время как у Celeron он всего 128 Кбайт (32 Кбайта L2 кеша занято копией данных, имеющихся в L1 кеше).

Чтобы проиллюстрироватьвсе вышесказанное приведу графики, показывающие скорость записи в память блоковданных различного размера для процессоров AMD Duron650:

<img src="/cache/referats/11440/image016.jpg" v:shapes="_x0000_i1029">

Процессор AMD Duron удался. Это можно сказать определенно. Егопроизводительность находится на достаточно высоком уровне, чтобы не толькообогнать конкурирующий Intel Celeron,но и вообще не оставить ему никаких шансов в штатном режиме. ПроизводительностьAMD Duron 650 всего на несколько процентов меньшескорости AMD Athlon 650 и примерно соответствуетпроизводительности Intel PentiumIII 600EB. Таким образом, выход Duron, если Intel не предпримет никаких действий для улучшенияпроизводительности своего low-end процессора,означает смерть Celeron.

AMD Athlon

Если подойти кархитектуре AMD Athlon поверхностно, то основные егопараметры можно обрисовать следующим образом:

<img src="/cache/referats/11440/image017.jpg" align=«right» hspace=«10» v:shapes="_x0000_s1033"> Ядро нового поколения с кодовым именем Argon, содержащее 22 млн. транзисторов Работает в специальных материнских платах с процессорным разъемом Slot A Использует высокопроизводительную системную шину Alpha EV6, лицензированную у DEC Кеш первого уровня 128 Кбайт — по 64 Кбайта на код и на данные Кеш второго уровня 512 Кбайт. Расположен вне процессорного ядра, но в процессорном картридже. Работает на половинной частоте ядра Напряжение питания — 1.6В Набор SIMD-инструкций 3DNow!, расширенный дополнительными командами. Всего 45 команд Выпускаются версии с частотами 500, 550, 600 и 650 МГц. Версия с частотой 700 МГц появится в ближайшее время

Однако таким простымпроцессор AMD Athlon кажется только лишь на первыйвзгляд. На самом же деле за этими несколькими строками скрываютсямногочисленные архитектурные инновации, которые мы рассмотрим позднее. Однако ипростые характеристики AMD Athlon впечатляют.Например, как нетрудно заметить, Athlon превосходит Intel не только по максимальной тактовой частоте (у Intel Pentium III она 600 МГц, даи к тому же при этом он работает на повышенном до 2.05В напряжении ядра), но ипо размеру кеша первого уровня, который у Intel Pentium III всего 32Кбайта.

<img src="/cache/referats/11440/image019.jpg" v:shapes="_x0000_i1030">


<img src="/cache/referats/11440/image021.jpg" v:shapes="_x0000_i1031">

Перейдем же к болееподробному рассмотрению архитектуры AMD Athlon.

Системнаяшина

Преждечем углубляться в сам процессор, посмотрим, чем же отличается системная шинаEV6, примененная AMD, от привычной интеловской GTL+.Внешнее сходство бывает обманчиво. Хотя процессорный разъем SlotA на системных платах для процессора AMD Athlonвыглядит также как и Slot 1, перевернутый на 180градусов, шинные протоколы и назначения контактов у IntelPentium III и AMD Athlonсовершенно различны. Более того, различно даже число задействованных сигналов — Athlon использует примерно половину из 242 контактов,в то время как Pentium III всего четверть. Внешняяпохожесть вызвана тем, что AMD просто хотела облегчить жизнь производителямсистемных плат, которым не придется покупать особенные разъемы для установки наSlot A системные платы. Только и всего.

Насамом же деле, хоть EV6 и работает на частоте 100 МГц, передача данных по ней,в отличие от GTL+ ведется на обоих фронтах сигнала, потому фактическая частотапередачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 — 72 бита, 8 из которых используется под ECC (контрольную сумму), то получаемскорость передачи данных 64бита х 200 МГц = 1,6Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100 МГц в двараза меньше — 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает увеличениепропускной способности при этом только до 1,06 Гбайт/с. Казалось бы, как вслучае с GTL+, так и с EV6 получаются внушительные значения пропускнойспособности. Однако, только современная PC100 память может отожратьот нее до 800 Мбайт/с, а AGP, работающий в режиме 2x — до 528 Мбайт/с. Неговоря уже о PCI и всякой другой мелочевке. Получается, что GTL+ уже сейчасможет не справляться с передаваемыми объемами данных. У EV6 же в этом случаевсе в порядке, потому эта шина более перспективна.

Приэтом, как частота GTL+ может быть увеличена со 100 до 133 МГц, планируется, чтои частота EV6 также впоследствии достигнет значения 133 (266), а затем и 200(400) МГц. Однако планы эти могут и не осуществиться — реализовать работу наматеринской плате EV6, требующую большего количества контактных дорожек,несколько сложнее, особенно на больших частотах. Хотя если у AMD все получится,пропускная способность системной шины может достичь 2.1 и 3.2 Гбайта/с соответственно,что позволит беспрепятственно применять в Athlon-системах, например,высокопроизводительную 266-мегагерцовую DDR SDRAM.

Кеш

Преждечем переходить непосредственно к функционированию AMD Athlon,хочется затронуть тему L1 и L2 кешей.

Чтокасается кеша L1 в AMD Athlon,то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, нетолько подкрепляя высокую производительность Athlon,но и обеспечивая его эффективную работу на высоких частотах. В частности, однаиз проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращиватьбыстродействие простым увеличением тактовой частоты, как раз заключается вмалом объеме L1 кеша, который начинает захлебыватьсяпри частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.

Чтоже касается кеша L2, то и тут AMD оказалось навысоте. Во-первых, интегрированный в ядро tag дляL2-кеша поддерживает его размеры от 512 Кбайт до 16 Мбайт. PentiumIII, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кешвторого уровня. К тому же, Athlon может использоватьразличные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и 1:3. Такоеразнообразие делителей позволяет AMD не зависеть от поставщиков SRAMопределенной скорости, особенно при выпуске более быстрых моделей.

Благодарявозможности варьировать размеры и скорости кешавторого уровня AMD собирается выпускать четыре семейства процессоров Athlon, ориентированных на разные рынки.

<img src="/cache/referats/11440/image022.gif" v:shapes="_x0000_i1032">

<img src="/cache/referats/11440/image023.jpg" align=«left» hspace=«10» v:shapes="_x0000_s1034">Архитектура. Общие положения

Вотмы и подошли к рассказу о том, как же, собственно, работает Athlon.Как и процессоры от Intel с ядром, унаследованным от Pentium Pro, процессоры Athlon имеют внутреннюю RISC-архитектуру. Это означает, чтовсе CISC-команды, обрабатываемые процессором, сначала раскладываются на простыеRISC-операции, а потом только начинают обрабатываться в вычислительныхустройствах CPU. Казалось бы, зачем усложнять себе жизнь? Оказывается, естьзачем. Сравнительно простые RISC-инструкции могут выполняться процессором понесколько штук одновременно и намного облегчают предсказание переходов, темсамым позволяя наращивать производительность за счет большего параллелизма.Говоря более просто, тот производитель, который сделает более«параллельный» процессор, имеет шанс добиться превосходства впроизводительности гораздо меньшими усилиями. AMD при проектировании Athlon, по-видимому, руководствовалась и этим принципом.

<img src="/cache/referats/11440/image024.gif" align=«left» hspace=«12» v:shapes="_x0000_s1035">Athlon,как впрочем и в Intel PentiumIII, применяется дешифратор команд (декодер), который преобразует поступающийна вход процессора код. Дешифратор в AMD Athlon можетраскладывать на RISC-составляющие до трех входящих CISC-команд одновременно.Современные интеловские процессоры могут такжеобрабатывать до трех команд, однако если для Athlonсовершенно все равно, какие команды он расщепляет, PentiumIII хочет, чтобы две из трех инструкций были простыми и только одна — сложной.Это приводит к тому, что если Athlon за каждыйпроцессорный такт может переварить три инструкции независимо ни от чего, то у Pentium III отдельные части дешифратора могут простаиватьиз-за неоптимизированного кода.

Передтем, как попасть в соответствующий вычислительный блок, поступающий потокRISC-команд задерживается в небольшом буфере (InstructionControl Unit), который, чтоуже неудивительно, у AMD Athlon расчитанна 72 инструкции против 20 у Pentium III. Увеличиваяэтот буфер, AMD попыталась добиться того, чтобы дешифратор команд не простаивализ-за переполнения Instruction ControlUnit.

Ещеодин момент, заслуживающий внимания — вчетверо большая, чем у Pentium III, таблица предсказания переходов размером 2048ячеек, в которой сохраняются предыдущие результаты выполнения логическихопераций. На основании этих данных процессор прогнозирует их результаты при ихповторном выполнении. Благодаря этой технике AMD Athlonправильно предсказывает результаты ветвлений где-то в 95% случаев, что оченьдаже неплохо, если учесть, что аналогичная характеристика у IntelPentium III всего 90%.

Посмотримтеперь, что же происходит в Athlon, когда делодоходит непосредственно до вычислений.

Целочисленные операции

Сцелочисленными операциями у процессоров от AMD всегда все было в порядке. Современ AMD K6 процессоры от Intel проигрывали именнов скорости целочисленных вычислений. Тем не менее, в AthlonAMD напрочь отказалась от старого наследия.

Благодаряналичию трех конвейерных блоков исполнения целочисленных команд (Integer Execution Unit) AMD Athlon может выполнятьтри целочисленные инструкции одновременно. Что же касается PentiumIII, то его возможности ограничиваются одновременным выполнением только двухкоманд.

Отдельнохочется затронуть вопрос конвейеров. Оптимальной глубиной конвейера дляпроцессоров с современными скоростями считается 9 стадий. Увеличение этогочисла приводит к ускорению процесса обработки команд, так как скорость работыконвейера определяется работой самой медленной его стадии. Однако, в случаеслишком большого конвейера при ошибках в предсказании переходов оказывается чтобольшая часть работы по исполнению команд, уже вошедших на конвейер выполненанапрасно. Его приходится очищать и начинать процесс заново.

Потомув AMD Athlon глубина целочисленных конвейеровсоставляет 10 стадий, что близко к оптимуму. К сожалению, поклонники продукции Intel снова не услышат ничего утешительного, так какконвейер в Pentium III состоит из 12-17 стадий взависимости от типа исполняемой инструкции.

Вещественныеоперации

Сзамиранием сердца обращаем наш взгляд на блок FPU, встроенный в Athlon. Как мы все хорошо помним, для предыдущихпроцессоров AMD операции с плавающей точкой были настоящей ахиллесовой пятой.Главной проблемой было то, что блок FPU в K6, K6-2 и K6-III был неконвейеризированый. Это приводило к тому, что хотя многиеоперации с плавающей точкой в FPU от AMD выполнялись за меньшее число тактов,чем на интеловских процессорах, общаяпроизводительность была катастрофически низкой, так как следующая вещественнаяоперация не могла начать выполняться до завершения предыдущей. А что-то менятьв своем FPU AMD в то время не хотела, призывая разработчиков к отказу от егоиспользования в пользу 3DNow!..

Но,похоже, прошлый опыт научил AMD. В Athlonарифметический сопроцессор имеет конвейер глубиной 15 стадий против 25 у Pentium III. Не следует забывать, что, как уже говорилось выше,более длинный конвейер не всегда обеспечивает лучшую производительность. К томуже, существенным недостатком Intel Pentium III, которого в Athlon,естественно нет, является неконвейерезируемостьопераций FMUL и FDIV.

FPUв Athlon объединяет в себе три блока: один длявыполнения простых операций типа сложения, второй — для сложных операций типаумножения и третий — для операций с данными. Благодаря такому разделению работыAthlon может выполнять одновременно по две вещественночисленные инструкциии.А ведь такого не умеет даже Intel PentiumIII — он выполняет инструкции только последовательно!

Такчто, как это ни странно, FPU интеловских процессоровоказался не таким уж замечательным, как это принято было считать ранее.

MMX

Напервый взгляд с выполнением MMX-операций у Athlon посравнению с K6-III изменений не произошло. Однако это не совсем так. Хотя иMMX-инструкции используются в крайне небольшом числе приложений, AMD добавила вэтот набор еще несколько инструкций, которые также появились в MMX-блокепроцессора Pentium III. В их число вошли нахождениесреднего, максимума и минимума и изощренные

еще рефераты
Еще работы по компьютерам и переферийным устройствам