Реферат: Кэш-память современных микропроцессоров фирм Intel и AMD
Институт Транспорта иСвязи
Реферат
Учебная дисциплина: ,, Основы построениякомпьютеров ,,
Тема: ,, Кэш-память современныхмикропроцессоров фирм Intelи AMD.,,
Автор:Р.Великанов.
Преподаватель: Б. Цилькер.
Рига, 2004.
Оглавление.Введение.
Стратегия размещения.
Отображениесекторов ОП в кэш-памяти.
Смешанная и разделенная кэш-память.
Некоторые данные по популярным и самымновейшим процессорам от Intelи AMD.
Сводная таблица по объемам, принципаморганизации и тактовым частотам кэш-памяти у процессоров от Intelи AMD.
Сравнение некоторых новинок от Intelи AMD.
Зачем увеличивать кэш ?
Самые свежиеновости от ведущих производителей процессоров(октябрь 2004г).
Выводы.
ВведениеВ качествеэлементной базы основной памяти в большинстве ЭВМ используются микросхемыдинамических ОЗУ, на порядок уступающие по быстродействию центральномупроцессору. В результате, процессор вынужден простаивать несколько периодовтактовой частоты, пока информация из ИМС памяти установится на шине данных ЭВМ.Если же ОП выполнить на быстрых микросхемах статической памяти, стоимость ЭВМвозрастет весьма существенно.<span MS Mincho"; mso-ansi-language:RU">
Экономически приемлемое решение этой проблемывозможно при использовании двухуровневой памяти, когда между основной памятью ипроцессором размещается небольшая, но быстродействующая буферная память или кэш-память. Вместе сосновной памятью она входит в иерархическую структуру и ее действиеэквивалентно быстрому доступу к основной памяти.<span MS Mincho";mso-ansi-language:RU">
Использованиекэш-памяти позволяет избежать полного заполнения всей машины быстрой RAMпамятью. Обычно программа использует память какойлибо ограниченной области, храня нужную информацию в кэш-памяти, работа скоторой позволяет процессору обходиться без всяких циклов ожидания.В больших универсальныхЭВМ, основная память которых имеет емкость порядка 1-32 Гбайт, обычно используется кэш-память емкость 1-12Мбайт, т.е. емкость кэш-память составляет порядка 1/100-1/500 емкости основнойпамяти, а быстродействие в 5-10 раз выше быстродействия основной памяти. Выборобъема кэш-памяти – всегда компромисс между стоимостными показателями ( всравнении с ОП ) и ее емкостью, которая должна быть достаточно большой, чтобысреднее время доступа в системе, состоящей из основной и кэш-памяти,определялось временем доступа к последней. Реальная эффективность использованиякэш-памяти зависит от характера решаемых задач и невозможно определить заранее,какой объем ее будет действительно оптимальным.<span MS Mincho";mso-ansi-language:RU">Не всякая кэш-память равнозначна. Большое значение имеет тот факт, как много информации может содержать кэш-память. Чем больше кэш-память, тем больше информации может быть в нейразмещено, а следовательно, тем больше вероятность, что нужный байт будетсодержаться в этой быстрой памяти. Очевидно, что самый лучший вариант — это когдаобъём кэш-памяти соответствует объёму всей оперативной памяти. В этом случаевся остальная память становится не нужной. Крайнепротивоположная ситуация — 1 байткэш-памяти — тоже не имеет практического значения, так как вероятность того, что нужная информация окажется в этом байте, стремится к нулю.
<span MS Mincho";mso-ansi-language:RU"> В пр
оцессе работы такойсистемы в буферную память копируются те участки ОП, к которым производитсяобращение со стороны процессора. Выигрыш достигается за счет свойствалокальности, ввиду большой вероятности обращения процессором к командам,лежащим в соседних ячейках памяти.Кэш-память,состоящая из mслов, сохраняет копиине менее, чем m-слов из всех словосновной памяти. Если копия, к адресу которой был выполнен доступ ЦП,существует в кэш-памяти, то считывание завершается уже при доступе
ккэш-памяти. Отметим, что использование кэш-памяти основывается на принципахпространственной и временной локальности. В случае
пространственнойлокальности основная память разбивается на блоки с фиксированным числом слов иобмен данными между основной памятью и кэш-памятью выполняется блоками. Придоступе к некоторому адресу центральный процессор должен сначала определитьсодержит ли кэш-память копию блока с указанным адресом, и если имеется, тоопределить, с какого адреса кэш-памяти начинается этот блок. Эту информацию ЦПполучает с помощью механизма преобразования адресов. Стратегия размещения.
На сложность этого механизма существенное влияниеоказывает
стратегияразмещения, определяющая, в какое место кэш-памяти
следуетпоместить каждый блок из основной памяти.
Взависимости от способа размещения данных основной памяти в кэш-памятисуществует три типа кэш-памяти:
-<span Times New Roman"">
кэш с прямым отображением (размещением);-<span Times New Roman"">
полностью ассоциативный кэш;-<span Times New Roman"">
множественный ассоциативный кэш иличастично-ассоциативный. Кэш с прямымотображением(размещением) является самым
простымтипом буфера. Адрес памяти однозначно определяет строку
кэша, вкоторую будет помещен блок информации. При этом предпо-
лагается,что оперативная память разбита на блоки и каждому та-
кому блокув буфере отводится всего одна строка. Это простой и недорогой в реализацииспособ отображения. Основной его недостаток – жесткое закрепление заопределенными блоками ОП одной строки в кэше. Поэтому, если программапоочередно обращается к словам из двух различных блоков, отображаемых на одну иту же строку кэш-памяти, постоянно будет происходить обновление данной строки ивероятность попадания будет низкой.
Кэшс полностью ассоциативным отображением позволяетпреодолеть недостаток прямого, разрешая загрузку любого блока ОП в любую строкукэш-памяти. Логика управления выделяет в адресе ОП два поля: поле тега и полеслова. Поле тега совпадает с адресом блока ОП. Для проверки наличия копии блокав кэш-памяти, логика управления кэша должна одновременно проверить теги всехстрок на совпадение с полем тега адреса. Ассоциативное отображение обеспечиваетгибкость при выборе строки для вновь записываемого блока. Принципиальныйнедостаток этого способа – в необходимости использования дорогой ассоциативнойпамяти.
Множественно-ассоциативныйтип или частично-ассоциативный тип отображения – это один из возможныхкомпромиссов, сочетающий достоинства прямого и ассоциативного способов.Кэш-память ( и тегов и данных) разбивается на некоторое количество модулей.Зависимость между модулем и блоками ОП такая же жесткая, как и при прямомотображении. А вот размещение блоков по строкам модуля произвольное и дляпоиска нужной строки в пределах модуля используется ассоциативный принцип. Этотспособ отображения наиболее широко распространен в современныхмикропроцессорах.
Отображениесекторов ОП в кэш-памяти.
Данный типотображения применяется во всех современных ЭВМ и состоит в том, что вся ОПразбивается на секторы, состоящие из фиксированного числа последовательныхблоков. Кэш-память также разбивается на секторы, содержащие такое же количествострок. Расположение блоков в секторе ОПи секторе кэша полностью совпадает. Отображение сектора на кэш-памятьосуществляется ассоциативно, те любой сектор из ОП может быть помещен в любойсектор кэша. Таким образом, в процессе работы АЛУ обращается в поискахочередной команды к ОП, в результате чего, в кэш загружается( в случаеотсутствия там блока, содержащего эту команду), целый сектор информации из ОП,причем по принципу локальности, за счет этого достигается значительноеувеличение быстродействия системы.
Смешанная и разделеннаякэш-память.Внутренняя кэш-память использовалась ранее как дляинструкций(команд), так и для данных. Такая память называлась смешанной, а ееархитектура – Принстонской, в которой в единой кэш-памяти, в соответствии склассическими принципами фон Неймана, хранились и команды и данные.
Сравнительно недавно стало обычным разделятькэш-память на две – отдельно для инструкций и отдельно для данных.
Преимуществом смешанной кэш-памяти является то,что при заданном объеме, ей свойственна более высокая вероятность попаданий, посравнению с разделенной, поскольку в ней автоматически устанавливаетсяоптимальный баланс между инструкциями и данными. Если в выполняемом фрагментепрограммы обращения к памяти связаны, в основном, с выборкой инструкций, а доляобращений к данным относительно мала, кэш-память имеет тенденцию заполненияинструкциями и наоборот.
С другой стороны, при раздельной кэш-памяти,выборка инструкций и данных можетпроизводиться одновременно, при этом исключаются возможные конфликты. Последнееособенно существенно в системах, использующих конвейеризацию команд, гдепроцессор извлекает команды с опережением и заполняет ими буфер или конвейер.
Так, например, в процессоре Intel® 486 DX2 применялась смешанная кэш-память,
В Intel® Pentium® и в AMDAthlon™ с ихсуперскалярной организацией – раздельная. Более того, в этих процессорах помимокэш-памяти инструкций и кэш-памяти данных используется также и адреснаякэш-память. Этот вид кэша используется в устройствах управления памятью, в томчисле для преобразования виртуальных адресов в физические.
Благодаря использованию нанотехнологий, для сниженияпотребляемой мощности, увеличения быстродействия ЭВМ( что достигаетсясокращением времени обмена данными между процессором и кэш-памятью) существуетвозможность, а более того имеются реальные примеры того, что кэш-памятьреализуют в одном кристале с процессором. Такая внутренняя кэш-памятьреализуется по технологии статического ОЗУ и является наиболее быстродействующей.Объем ее обычно составляет 64-128 Кбайт, причем дальнейшее увеличение ее объемаприводит обычно к снижению быстродействия из-за усложнения схем управления идешифрации адреса.
Альтернативой, широко применяемой в настоящеевремя, является вторая (внешняя) кэш-память большего объема, расположеннаямежду внутренней кэш-памятью и ОП. В этой двухуровневой системе кэш-памяти,внутренней памяти отводится роль первого уровня L1, авнешней — второго L2. емкость L2 обычно на порядок и более выше, чем L1, а быстродействие истоимость ниже. Память второго уровня также строится обычно как статическоеОЗУ. Емкость ее может составлять от 256 Кбайт до 1 Мбайта и техническиреализуется как в виде отдельной микросхемы, однако может размещаться и наодном кристалле с процессором.
Самыесовременные процессоры от крупнейших производителей оснащаются сегоднякэш-памятью емкостью у Intel Pentium4 на ядре Northwood — 512 Кбайткэш-памяти L2,а процессоры Prescottбудут выпускаться по 0,09-микронной технологии иполучат кэш-память второго уровня удвоенного объема, который составит 1 Мбайт. Intelпродолжает широкорекламировать свой «экстремальный» игровой процессор Pentium4 ExtremeEditionна основемодифицированного серверного ядра Gallatinс тактовой частотой 3,40 ГГц и кэш-памятьютретьего уровня объемом 2 Мбайта. Онадополняет стандартный нортвудовский кэш L2 512 Кбайт и тоже работает на частоте ядрапроцессора (правда, с большей раза в два латентностью). Таким образом, в сумменовый Pentium4 ExtremeEditionимеет кэш-память объемом 2,5 Мбайт.
Дополнительная кэш-память третьего уровня ведетначало от серверных процессоров XeonMPна 0,13-микронном ядре Gallatinи не имеет ничего общего с грядущим90-нанометровым Prescott, однако этот кристалл (ядро) все же немного переработали с целью поддержкисистемной шины 800 МГц, уменьшения энергопотребления и др. и упаковали в стандартныйкорпус от текущих Pentium4. В свою очередь AMDAthlon64 и AMDOpteronработающиена более высокой частоте 2200 МГц, производятся по 0,13-микронной технологии (SOI) и содержат 105,9 млн.транзисторов и отличаются от предшествующих AthlonXPновым ядром с64-битными возможностями вычислений (наряду с улучшенными 32-битными на базепрежнего ядра AthlonXP), кэш-памятью второго уровня объемом 1 Мбайт(причем кэш у Атлонов инклюзивный, то есть полный объем с учетом 128 Кбайт L1 составляет 1152 Кбайт).
При доступе к памяти, ЦП сначала обращается к кэш-памяти первогоуровня. При промахе производится обращение к кэш-памяти второго уровня. Еслиинформация отсутствует и в L2, производится обращение к ОП, и соответствующийблок заносится сначала в L2, а затем и в L1. Благодаря такой процедуре, часто запрашиваемаяинформация может быть легко восстановлена из кэш-памяти второго уровня.
Потенциальная экономия за счет применения L2 зависит от вероятностипопаданий как в L1, так и L2. Однако, опыт Intelи AMDпоказывает, чтоиспользование кэш-памяти второго уровня существенно улучшаетпроизводительность. Именно поэтому во всех проанонсированых производителяминовейших версиях процессоров применяется двухуровневая и даже трехуровневаяорганизация кэш-памяти.
Некоторые данные по популярным иновейшим процессорам от Intelи AMD:
Pentium III
Процессор Intel® Pentium® III — процессор архитектуры P6, включает в себя: динамическое исполнениекоманд, системную шину с множественными транзакциями и технологию IntelMMX™ для обработки данныхмультимедиа. Технология изготовления с разрешающей способностью 0.25 микронпозволяет разместить на кристалле более 9.5 миллионов транзисторов. Процессор содержит32 Kб неблокируемой кэш-памяти первого уровня (16Кб/16Кб) и унифицированнуюнеблокируемую кэш-память второго уровня емкостью 512 Кб, функционирующую навдвое меньшей частоте, чем ядро. Процессор Intel® Pentium® IIIподдерживает кэширование памяти с объемомадресного пространства 4 Гб, и позволяет создавать масштабируемые системы сдвумя процессорами и физической памятью объемом до 64 Гб.
PentiumIV
Процессор Pentium4 устанавливает новый уровень производительностивысокомощных микропроцессоров.
— Системная шина счастотой 800 МГц: 3,06 ГГц, 2,80 ГГц,2,66 ГГц, 2,53 ГГц, 2,40BГГц, 2,26 ГГц
— Технологиягиперконвейерной обработки
— Механизм ускореннойобработки команд
— Кэш-память первогоуровня с отслеживанием исполнения команд
— Кэш-память с улучшеннойпередачей данных
— Улучшенная системадинамического исполнения команд
— Улучшенный блоквычислений с плавающей запятой и обработки мультимедиа
— Набор команд потоковых SIMD-расширений 2.
- У Intel Pentium4 на ядре Northwood — 512Кбайт кэш-памяти L2.
AMD-K6®-III
Процессор AMD-K6®-III, кодовое имя Sharptooth, в нем задействована встроеннаябыстродействующая кэш-память второго уровня (L2). В процессорный кристалл интегрированно 256 Кбкэш-памяти второго уровня, работающей на полной тактовой частоте процессора.
Процессор AMD-K6®-IIIсодержит 21.3 миллиона транзисторов ипроизводится по 0.25-микронной технологии на тактовые частоты 350, 380, 400 и450 МГц. Объем кэш-памятипервого уровня (L1), как у всего семейства K6, равен 64Кб. Процессор AMD-K6®-IIIможно устанавливать в те же системные платы Super7™, что и AMD-K6®-2, при этомнаходящаяся на системной плате внешняя кэш-память 2 уровня превращается вкэш-память 3 уровня (L3), с которой процессор может общаться с внешнейчастотой 100 МГц.
AMDAthlon.
В настоящее время процессор AMDAthlonявляется самым быстрым процессором в мире. Процессор имеет следующиеособенности:
Микроархитектура:Особенность процессора AMDAtlon™ — этодевятипоточная суперскалярная архитектура оптимизованная для высоких частот. AMDAthlon™ содержит девять исполняемых потоков: три для адресных операций, три дляцелочисленных вычислений, и три для выполнения команд x87 .
Архитектура кэш-памяти:AMDAthlon™имеет наибольший для платформ x86 кэш L1 (128KB) — в четыре раза превосходящий L1 кэш процессора PentiumIII(32KB). AMDAthlon™ также включает высокоскоростной, 64-битныйконтроллер кэш памяти второго уровня (L2), поддерживающий объем кэш-памяти второго уровняот 512Kб до 8Mб.
Сводная таблица по объемам, принципам организациии тактовым частотам кэш-памяти у процессоров от Intelи AMD:
<img src="/cache/referats/18211/image001.jpg" v:shapes="_x0000_i1025">
Сравнение некоторых новинок от Intelи AMD:
По утилитам у Pentium4 ExtremeEditionчетко видна кэш-память третьего уровня объемом 2Мбайт, хотя на месте и все прежние атрибуты Northwood.
Аналогичная информация показана для Athlon64. Интересно, что у нового Pentium4 меньший степпинг, нежели у последних Northwood, — 5 против 9.По графику теста латентности памяти для Pentium4 ExtremeEditionможно заключить, что граница кэш-памяти L3 лежит на 2 Мбайт, L2 — на 512 кбайт.
Итак, для двух новых процессоров Intelи AMDхарактерна преждевсего огромная кэш-память, которая в конце концов , и должна поднять производительность каждогоиз них.
Сравним процессоры:
- AMDAthlon64 FX-51 (тактовая частота2200 МГц).
- AMDAthlonXP3200+ (частота 2200МГц, FSB400МГц).
- Pentium4 (Northwood) с частотой 3,2 ГГц (FSB800 МГц).
-<span Times New Roman"">
Pentium 4 Extreme Edition c частотой 3,2 ГГц (FSB 800 МГц).В данном случае абсолютное сравнение частотпроцессоров лишено смысла, поскольку их микроархитектуры существенноразличаются ( и даже преследуют разные цели): в Pentium4 производительность должна обеспечиватьсяпреимущественно высокой тактовой частотой (для этого и увеличили до двадцатистадий вычислительный конвейер), а в Athlonупорделается на другие особенности, порой в ущерб тактовой частоте.
Разные подходы в микроархитектуре не позволяютадекватно сравнивать процессоры на одинаковой тактовой частоте.
И пример тому — разный предел частот приодинаковых технологических нормах производства: для технологии 0,13 мкммассовым пределом ядра Pentium4 является частота 3,2–3,4 ГГц, а в Athlon— 2,2–2,4 ГГц. Поэтому корректнее сравнивать процессоры по пределу ихчастоты для той или иной технологии производства — в данном случае 3,2 и 2,2ГГц.
По полосе пропускания двухканальной памятивпереди, безусловно, процессор AMD.
Хотя Пентиумы отстают от него заметно меньше, чем AthlonXP3200+ (все они используют двухканальную DDR400). Athlon64 FXближе всех подошел к теоретическому пределом 6,4 Гбайт/с — на 86%, Пентиумыпоказывают примерно три четверти в штатных режимах работы (в режимах ускорениячипсета/памяти эффективность возрастает до более чем 80%), а AthlonXPутилизирует менее половины (из-за узкой системнойшины). По скорости чтения памяти Pentium4 ExtremeEditionпочти не отличается от Northwood(небольшое падение можно связать с недостатками методаизмерения — потоки немного «застревают» в большом кэше L3), а Athlon64 FXи тут вне досягаемости. Зато по скорости записи впамять Pentium4 ExtremeEditionна голову опережает всех, включая Athlon64 FX. Видимо, благодаря именно хорошему и «большому»кэшированию. Зато по латентности памяти Athlon64 FXпоказывает простофантастические результаты — всего 56 нс. Интересно также, что строго синхронныйчипсет NVIDIAnForce2 обеспечивает порой лучшую латентность, чем Intel875P. Вместе с тем, учипсетов Intel875/865 может быть латентность в районе 66 нс — если они работают вспециальных (нештатных) низколатентных режимах .
Зачем увеличивать кэш?Первичнаяпричина увеличения объема встроенного кэша может заключаться в том, чтокэш-память в современных процессорах работает на той же скорости, что и сампроцессор. Частота процессора в этом случае никак не меньше 3200 MГц. Больший объем кэшапозволяет процессору держать большие части кода готовыми к выполнению. Такаяархитектура процессоров сфокусирована на уменьшении задержек, связанных спростоем процессора в ожидании данных. Современные программы, в том числеигровые, используют большие части кода, который необходимо извлекать изсистемной памяти по первому требованию процессора. Уменьшение промежутковвремени, уходящих на передачу данных от памяти к процессору, — это надежныйметод увеличения производительности приложений, требующих интенсивноговзаимодействия с памятью. Кэш L3 имеет немного более высокое время ожидания, чем L1 и 2, это вполне естественно.Хоть он и медленнее, но все-таки он значительно более быстрый, чем обычнаяпамять. Не все приложения выигрывают от увеличения объема или скоростикэш-памяти. Это сильно зависит от природы приложения.
Если большой объем встроенного кэша — это хорошо,тогда что же удерживало IntelиAMDот этой стратегии ранее?Простым ответом является высокая себестоимость такого решения. Резервированиепространства для кэша очень дорого. Стандартный 3.2GHzNorthwoodсодержит 55 миллионов транзисторов. Добавляя 2048КБ кэша L3, Intelидет на увеличение количества транзисторов до 167миллионов. Простой математический расчет покажет нам, что EE — один из самых дорогихпроцессоров.
Сайт AnandTechпровел сравнительноетестирование двух систем, каждая из которых содержала два процессора – IntelXeon3,6 ГГц в одном случаеи AMDOpteron250 (2,4 ГГц) – вдругом. Тестирование проводилось для приложений ColdFusionMX6.1, PHP4.3.9, и Microsoft.NET1.1. Конфигурации выглядели следующим образом:
AMD
— Dual Opteron250;
— 2 ГБDDR PC3200 (Kingston KRX3200AK2);
— системная плата TyanK8W;
— ОСWindows 2003 Server Web Edition (32 бит);
— 1 жесткийIDE 40 ГБ 7200 rpm, кэш 8 МБ
Intel
— Dual Xeon3.6 ГГц;
— 2 ГБ DDR2;
— материнская плата IntelSE7520AF2;
— ОСWindows 2003 Server Web Edition (32 бит);
— 1 жесткийIDE 40 ГБ 7200 rpm, кэш 8 МБ
На приложениях ColdFusionи PHP, не оптимизированных под ту или иную архитектуру,чуть быстрее (2,5-3%) оказались Opteron’ы, зато тест с .NETпродемонстрировал последовательную приверженностьMicrosoftплатформе Intel, что позволило паре Xeon’ов вырваться вперед на8%. Вывод вполне очевиден: используя ПО Microsoftдля веб-приложений, есть смысл выбрать процессорыIntel, в других случаяхнесколько лучшим выбором будет AMD.
Самые свежиеновости от ведущих производителей процессоров(октябрь 2004г):
Американская компания AMDофициально представила новые 64-разрядныепроцессоры для настольных компьютеров Athlon64 FX-55 и Athlon64 4000+. Чипы изготавливаются по нормам 130-нанометровой технологии иоснащаются 1 Мб кэш-памяти второго уровня. Как отмечается в пресс-релизе,кристаллы Athlon64 FX-55 ориентированы на использование, прежде всего,в мощных мультимедийных системах, тогда как процессоры Athlon64 4000+ позиционируются в качестве базы для создания решенийбизнес-класса.
Процессор Athlon64 FX-55 работает на тактовойчастоте 2,6 ГГц, тактовая частота чипов Athlon64 4000+составляет 2,4 ГГц.
Чипы Athlon64 FX-55 и Athlon64 4000+ позволяют работать как со стандартными32-разрядными приложениями, так и с 64-битными программами. Кристаллыподдерживают технологию Cool’n’Quiet, предназначенную для снижения уровня шума приработе компьютера, а также антивирусную защиту EVP(EnhancedVirusProtection) для работы которой потребуется операционнаясистема MicrosoftWindowsXPServicePack2 или WindowsXPMediaCenterEdition2005.
О намерении выпускать компьютеры на базепредставленных процессоров объявили такие известные производители как Alienware, Voodoo,HypersonicPCSystems,Shuttle, Systemax, TotallyAwesome,VelocityMicro, ViciousPC, FalconNorthwestи некоторыедругие. Поставки процессоров уже начались.
Стали известны очередныеподробности о планах Intel. Так, проясниласьситуация с выходом двухъядерных процессоров Smithfield, которые будут объединять в себе два 0,09 мкмядра, каждое из которых будет иметь 1 Мб кэша второго уровня. Таким образом,общая кэш-память будет составлять 2 Мб. Процессоры будут иметь поддержку нетолько антивирусной технологии IntelEDB(ExecuteDisableBit, бит защиты от выполнения), но 64-битныерасширения EM64T. Их выход планируется на третий квартал 2005года.
Модельный рядпроцессоров Smithfieldбудет представлен тремямоделями:
x20 – частота 2,8 ГГц, 2 Мб кэша, шина 800МГц, LGA775, поддержка XDи EM64T;
x30 – частота 3,0 ГГц, 2 Мб кэша, шина 800МГц, LGA775, поддержка XDи EM64Tи EnhancedSpeedStep;
x40 – частота 3,2 ГГц, 2 Мб кэша, шина 800МГц, LGA775, поддержка XDи EM64Tи EnhancedSpeedStep;
Примечательно, чтотолько старшие модели будут иметь поддержку технологии EnhancedSpeedStep, позволяющиединамически менять частоту процессора в зависимости от выполняемой задачи.
Также немногопрояснилась ситуация с выходом процессоров IntelPentium6XX. Да, они появятся в первом квартале следующегогода, но массовых поставок следует ожидать не ранее второй четверти 2005 г.Процессоры будут иметь 2Мб кэша второго уровня и шину 800МГц.
Каждое ядро двуядерныхпроцессоров AMDOpteronи IntelMontecito, которые должны появиться на рынке в 2005 году,будет иметь свою собственную кэш-память. Это следует из заявления КамеронаМакнэйри, исследователя корпорации Intel, и Мариуса Эверса, сотрудника AMD.<span Arial Unicode MS";mso-ansi-language:RU">
Использование несколькихядер в одном процессоре позволяет повысить вычислительную мощность чипа приодновременном ограничении потребляемой им энергии. Ранее предполагалось, чтокристаллы IntelItaniumнового поколения (кодовое название Montecito) получат 24 Мб общей кэш-памяти. Теоретически, наличиеединого кэша увеличивает объем данных, к которым может обращаться процессорноеядро. Однако разделение кэшей существенно упрощает работу по проектированиюкристаллов и, соответственно, сокращает время, необходимое для вывода конечныхпродуктов на рынок.
Вероятнее всего, каждоеядро Montecitoбудет оснащено 1 Мб кэша второго уровня и 12 Мб кэша третьего уровня.Впоследствии эти кэши могут быть объединены. Аналогично намерена поступить икомпания AMD.
Следует заметить, чтораздельные кэши для различных ядер использует и компания Sunв своих чипах UltraSparcIV.
Выводы.
Анализ изложенного выше материала позволяетсделать заключение, что в соответствии с каноническими теориями, современныепроизводители Intelи AMDшироко используют кэш-память при построении своих новейших процессоров. Вомногом, их превосходные характеристики по быстродействию достигаются именноблагодаря применению кэш-памяти второго и даже третьего уровня. Этот фактподтверждает теоретические выкладки Гарвардского университета о том, что ввидудействия принципа локальности информации в современных компьютерах применениекэш-памяти смешанного типа позволяет добиться превосходных результатов впроизводительности процессоров и снижает частоту необходимых обращений косновной памяти.
Налицо широкие перспективы дальнейшего применениякэш-памяти в машинах нового поколения, однако существующая проблематиканевозможности бесконечного увеличения кэша, а также высокая себестоимостьизготовления кэша на одном кристалле с процессором, ставит перед конструкторамивопросы о некоем качественном, а не количественном видоизменении или скачке впринципах, либо огранизации кэш-памяти в процессорах будущего.
К сожалению, никакой справочной или рекламнойинформации об использовании дисковой кэш-памяти от Intelи AMDобнаружить не удалось, поэтому данному подразделув работе не уделено достаточного внимания.