Интел пентиум 5. Температурный режим и энергопотребление

27.03.2019

За более чем 5 лет было выпущено множество ядер и моделей Pentium 4, основанных на них. Причем с выходом новой модели к названию процессора добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и другое; всё это существенно запутывает идентификацию конкретной модели.

Процессор Pentium 4 построен на совершенной новой архитектуре - NetBurst. Ниже приведены некоторые отличительные особенности оригинальной архитектуры NetBurst (некоторые из них в последующем были изменены).

  • . Длина конвейера была увеличена до 20 шагов, то есть для завершения одной команды процессору требовалось 20 циклов. Данный шаг позволял значительно легче наращивать тактовую частоту, кроме того, в перспективе это позволяло значительно повысить быстродействие, но производительность в расчете на 1 МГц была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая производительность Pentium 4, работающего на низких частотах. Так же в результате такого нововведения увеличилось и время ожидания.
  • Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки применения длинного конвейера инженеры Intel улучшили схему предсказания ветвлений, в результате правильность перехода предсказывалась с вероятностью до 95 %.
  • Системная шина. В Pentium 4 используется совершенно новая 128-битная с двумя 64-битными линиями. Частота новой шины() составляет 100 МГц (у последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет передачи за 1 такт одновременно 4 пакетов (QPB - Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная способность шины составляла 3200 Мб/с.
  • Арифметико-логическое устройство ( или ALU). В АЛУ обрабатываются целочисленные команды. В новом процессоре АЛУ работает на удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции выполняются за половину такта. В Pentium 4 используются два АЛУ.
  • первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и для данных. В кэше теперь хранятся декодированные команды и располагаются в порядке их выполнения (технология Trace Cache), что увеличивает производительность.
  • Математический (). Математический сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную вычислительную работу выполняет лишь один модуль - это операции сложения (FADD) и умножения (FMUL), второй модуль выполняет операции обмена между и памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает производительность в 1,4 . К примеру, в процессорах используется сопроцессор, состоящий из трех модулей (один для операций типа FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
  • SIMD-расширения. В процессор Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с плавающей запятой).

В целом, архитектура была нацелена для работы на высоких частотах, где в полную силу смог бы заработать длинный конвейер.

Willamette

Впервые это ядро «засветилось» в роадмэпе () Intel еще в 1998 году. Предполагалось, что оно должно прийти на смену и покорить частоту 1 ГГц. Но процессоры на этом ядре были анонсированы только в 2000 году как Pentium 4. Выпущенные года, процессоры устанавливались в разъём Socket 423 и выпускались в корпусе тип FC-PGA2. Процессоры для Socket 423 не пользовались популярностью, так как Intel сразу заявила, что этот разъем является переходным, кроме того системы на базе Pentium 4 стоили очень дорого (сами процессоры в момент анонса стоили $644 и $819 за Pentium 4 1,4 и 1,5 ГГц соответственно). Так как процессор изготавливался с использованием 180 нм техпроцесса, то на кристалле удалось разместить лишь 256 Кбайт кэша L2. Большинство экспертов расценило 1,4 и 1,5 ГГц версии промежуточными - процессор Athlon набирал всё большую популярность, и превосходил по быстродействию Pentium III, а дальнейшее усовершенствование архитектуры Pentium III тогда было ещё не возможно. Терять свою долю рынка Intel не была намерена, поэтому она и выпустила эти процессоры («сырая» технология производства не позволила тогда выпустить более быстрые модели). Несмотря на непопулярность 1,4 и 1,5 ГГц версий, Intel года анонсирует 1,3 ГГц версию Pentium 4, которая стоила $409. В различных тестовых испытаниях эти процессоры проигрывали как Pentium III, так и Athlon`ам (а в некоторых случаях и `ам), работавшим на более низких частотах. Однако уже в апреле 2001 года выходит Pentium 4 с частотой 1,7 ГГц, а в августе этого года выходит 2 ГГц версия, а так же «новые-старые» процессоры для Socket 478, который просуществовал более чем 2 года, в этом же месяце выходит новый чипсет от Intel (i845). Новый чипсет теперь поддерживал память стандарта PC133 SDRAM, что позволило значительно снизить цены на системы на базе Intel Pentium 4, однако использование данного типа памяти несколько уменьшало быстродействие (иногда весьма существенно) системы. Intel для увеличения продаж активно продвигала данный процессор - его рекламу можно было увидеть как по телевизору, так и в газетах/журналах. Продажи Pentium 4 увеличивались, процессор начинал пользоваться всё большей популярностью. Вскоре многие производители системной логики представили свои чипсеты для Pentium 4 с поддержкой памяти , а в начале года Intel выпускает свои чипсеты с поддержкой данного типа памяти. Процессор начинает замещать собой Pentium III, а по производительности он фактически сравнялся с Athlon`ом. Intel, державшая пальму первенстве в течение 16 лет, а затем довольно быстро потерявшая её, сейчас вновь начинает отвоёвывать своё. А начавшиеся проблемы с отсутствием производственных мощностей у AMD и выпуск Pentium 4 на ядре Northwood закрепили лидирующие позиции Intel, правда, ненадолго.

Процессоры Pentium 4 на ядре Willamette
Тактовая частота ядра (ГГц) Дата анонса процессора для Socket 423 Дата анонса процессора для Socket 478 Начальная стоимость процессора ($)
1,3 3 января 2001 409 - ?
1,4 20 ноября 2000 644 27 сентября 2001
1,5 819 27 августа 2001
1,6 2 июля 2001 294
1,7 23 апреля 2001 352
1,8 2 июля 2001 562
1,9 27 августа 2001 375 375
2,0 562 562

Northwood

Первые процессоры на данном ядре анонсированы года. Ядро мало чем отличается от своего предшественника, разве что использованием более совершенного тех процесса - 130 нм, что позволило разместить на кристалле 512Кб кэша L2 и снизить тепловыделение процессора. Переход на новый техпроцесс позволил ещё больше наращивать тактовую частоту (до 3,4ГГц). Чтобы отличать процессоры на ядре Northwood от аналогичных моделей на ядре Willamette, было решено в конце названия новых процессоров приписывать букву «A» (например Pentium 4 2,0A построен на ядре Northwood).

Prescott

Mobile Pentium 4

Первые версии Pentium 4 для ноутбуков и лэптопов были анонсированы года, были построены на ядре Northwood и носили имя Mobile Pentium 4-M. От настольных версий эти процессоры отличались заниженным напряжением питания (1,2-1,3 В) и поддержкой технологии . Частота системной шины у всех процессоров составляла 400 МГц. Были выпущены модели с частотами 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0; 2,2; 2,4; 2,5; 2,6, TDP у последней модели составляет 35 Вт.

Prescott 2M

Первые слухи о новом ядре Prescott 2 появились в начале 2005 года. Предполагалось, что оно будет иметь 2 Мбайт кэша L2 и частоту FSB равную 266 МГц (эффективная частота 1066 МГц). Процессоры на основе этого ядра были анонсированы . От ядра Prescott это ядро отличается только наличием 2 Мбайт кэш-памяти L2. Новые процессоры получили и новую маркировку: 6x0. 21 февраля 2005 года были анонсированы модели Pentium 4 630, 640, 650, 660 с частотами 3,0; 3,2; 3,4; 3,6 ГГц, позднее была представлена модель 670, работающая на частоте 3,8 ГГц.

Cedar Mill

Анонс процессоров, построенных на новом ядре, запланирован на вторую половину января . Ядро Cedar Mill представляет собой одноядерную модификацию ядра известного под кодовым именем . Cedar Mill изготовлен с использованием новейшей 65 нм технологии. По сути, ядро представляет собой ядро Prescott 2M, даже не изменилась серия процессора, процессоры без поддержки технологии виртуализации Vanderpool имеют маркировку вида 6x1, с поддержкой Vanderpool имеют маркировку вида 6x3. Процессоры первоначально будут иметь частоту от 3,0 ГГц до 3,8 ГГц. Более подробно о причине выхода Cedar Mill рекомендуется читать здесь .

Ядро Cedar Mill является последним в линейке Pentium 4. Следующие поколения процессоров, в частности Conroe, будут продвигаться под новым брэндом, название которого, пока, не анонсировано.

Tejas, Jayhawk и другие

Intel возлагала на архитектуру NetBurst большие надежды. В 2001-2003 в роадмэпах Intel встречались такие ядра, как Tejas, который должен был использовать шину 1066 МГц и работать на частотах от 4,4 до 9,2 ГГц и должен был бы быть поступить в продажу во второй половине 2004 года и называться Pentium 6. Nehalem, как предполагалось, этот процессор должен был использовать системную шину 1200 МГц и работать на частотах свыше 10 ГГц, и должен был поступить в продажу в 2005 году. Jayhawk, процессор серии Xeon, который должен был иметь кэш L1 для данных объемом 24 Кб и для 16 тысяч микроопераций. Однако все эти процессоры в 2004 году были отменены.

Intel предполагала с помощью процессоров основанных на архитектуре NetBurst достичь частоты в 10ГГц, но, не дойдя и до 4 ГГц, эта архитектура столкнулась с неразрешимыми до сих пор (и похоже уже никогда) тепловыми проблемами. Данная проблема подтолкнула Intel к разработке новой архитектуры и к закрытию всех проектов по разработке ядер на архитектуре NetBurst.

Взглянув назад, Pentium 4 оставляет двойственное впечатление. С одной стороны это был одни из самых популярных процессоров, его продвижение в , и, как следствие, огромная популярность в народе, позволили Intel надолго занять большую часть рынка. С другой стороны Pentium 4 имел не самую удачную архитектуру. Он так ни разу и не закрепил своё лидирующее положение в плане производительности, по уровню TDP (тепловыделение) он практически всегда проигрывал конкурентным процессорам AMD Athlon, впрочем также, как и по стоимости. А архитектура Pentium III, которую когда-то Intel посчитала менее перспективной, чем NetBurst вновь появилась в процессорах .

Технические характеристики различных ядер

Данные относящиеся ко всем моделям

  • Разрядность : 32
  • Разрядность внешней шины: 128

Willamette

  • Дата анонса первой модели: 20 ноября 2000 года
  • Тактовые частоты (ГГц): 1,3; 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0
  • Эффективная частота системной шины (FSB) (МГц): 400
  • Размер кэша L2(Кбайт): 256
  • Напряжение питания: 1,7 В или 1,75 В
  • Количество транзисторов (млн.): 42
  • Площадь кристалла (кв. мм): 217
  • Максимальное TDP (расчетное тепловыделение): 75,3 Вт
  • Техпроцесс (нм): 180
  • Разъём: Socket 423, позже Socket 478
  • Корпус: 423-контактный FC-PGA2 или 478-контактный mPGA
  • Поддерживаемые технологии: IA32, SSE2

Northwood

  • Дата анонса первой модели: 7 августа 2001 года
    • Процессоры с частотой FSB равной 400МГц: 1,6; 1,8; 2,0; 2,2; 2,4; 2,5; 2,6; 2,8
    • Процессоры с частотой FSB равной 533МГц: 2,26; 2,4; 2,53; 2,67; 2,8; 3,06
    • Процессоры с частотой FSB равной 800МГц: 2,4; 2,6; 2,8; 3,0; 3,2; 3,4
  • Эффективная частота системной шины (FSB) (МГц): 400, 533, 800
  • Размер кэша L1: 8Кбайт (для данных)+12 тысяч операций
  • Размер кэша L2(Кбайт): 512
  • Напряжение питания: 1,475-1,55 (в зависимости от модели)
  • Количество транзисторов (млн.): 55
  • Площадь кристалла (кв. мм): 146, позже 131
  • Максимальное TDP (расчетное тепловыделение): 89 Вт
  • Техпроцесс (нм): 130
  • Разъём: Socket 478
  • Корпус: 478-контактный mPGA
  • Поддерживаемые технологии: IA32, MMX, SSE, SSE2, HT (не все модели)

Pentium I
В конце 1991 года, когда была завершен макет процессора, инженеры смогли запустить на нем программное обеспечение. Проектировщики начали изучать под микроскопом разводку и прохождение сигналов по подложке с целью оптимизации топологии и повышения эффективности работы.

Проектирование в основном было завершено в феврале 1992 года. Началось всеобъемлющее тестирование опытной партии процессоров, в течение которого испытаниям подвергались все блоки и узлы. В апреле 1992 года было принято решение, что пора начинать промышленное освоение Pentium процессора. В качестве основной промышленной базы была выбрана 5 Орегонская фабрика. Более 3 миллионов транзисторов были окончательно перенесены на шаблоны. Началось промышленное освоение производства и доводка технических характеристик, завершившиеся через 10 месяцев, 22 марта 1993 года широкой презентацией Pentium процессора.
Объединяя более, чем 3.1 миллион транзисторов на одной кремниевой подложке, 32-разрядный Pentium процессор характеризуется высокой производительностью с тактовой частотой 60 и 66 МГц. Его суперскалярная архитектура использует усовершенствованные способы проектирования, которые позволяют выполнять более, чем одну команду за один период тактовой частоты, в результате чего Pentium в состоянии выполнять огромное количество PC-совместимого программного обеспечения быстрее, чем любой другой микропроцессор. Кроме существующих наработок программного обеспечения, высокопроизводительный арифметический блок с плавающей запятой Pentium процессора обеспечивает увеличение вычислительной мощности до необходимой для использования недоступных ранее технических и научных приложений, первоначально предназначенных для платформ рабочих станций.
Многочисленные нововведения - характернаяособенность
Pentium процессора в виде уникального сочетания высокой производительности, совместимости, интеграции данных и наращиваемости. Это включает:- Суперскалярную архитектуру;
- Раздельное кэширование программного кода и данных;
- Блок предсказания правильного адреса перехода;
- Высокопроизводительный блок вычислений с плавающей запятой;
- Расширенную 64-битовую шину данных;
- Поддержку многопроцессорного режима работы;
- Средства задания размера страницы памяти;
- Средства обнаружения ошибок и функциональной избыточности;
- Управление производительностью;
- Наращиваемость с помощью Intel OverDrive процессора. Cуперскалярная архитектура Pentium процессора представляет
собой совместимую только с Intel двухконвейерную индустриальную архитектуру, позволяющую процессору достигать новых уровней производительности посредством выполнения более, чем одной команды за один период тактовой частоты. Термин "суперскалярная" обозначает микропроцессорную архитектуру, которая содержит более одного вычислительного блока. Эти вычислительные блоки, или конвейеры, являются узлами, где происходят все основные процессы обработки данных и команд.
Появление суперскалярной архитектуры Pentium процессора представляет собой естественное развитие предыдущего семейства процессоров с 32-битовой архитектурой фирмы Intel. Например, процессор Intel486 способен выполнять несколько своих команд за один период тактовой частоты, однако предыдущие семейства процессоров фирмы Intel требовали множество циклов тактовой частоты для выполнения одной команды.
Возможность выполнять множество команд за один период тактовой частоты существует благодаря тому, что Pentium процессор имеет два конвейера, которые могут выполнять две инструкции одновременно. Так же, как и Intel486 с одним конвейером, двойной конвейер Pentium процессора выполняет простую команду за пять этапов: предварительная подготовка, первое декодирование (декодирование команды), второе декодирование (генерация адреса), выполнение и обратная выгрузка.
В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество команд может быть выполнено за одно и то же время.
Другое важнейшее революционное усовершенствование, реализованное в Pentium процессоре, это введение раздельного кэширования. Кэширование увеличивает производительность посредством активизации места временного хранения для часто используемого программного кода и данных, получаемых из быстрой памяти, заменяя по возможности обращение ко внешней системной памяти для некоторых команд. Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти, используемой одновременно для кэширования программного кода и данных.
Проектировщики фирмы Intel обошли это ограничение использованием дополнительного контура, выполненного на 3.1 миллионах транзисторов Pentium процессора (для сравнения, Intel486 содержит 1.2 миллиона транзисторов) создающих раздельное внутреннее кэширование программного кода и данных. Это улучшает производительность посредством исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем это было возможно ранее. Например, во время фазы предварительной подготовки, используется код команды, полученный из КЭШа команд. В случае наличия одного блока кэш-памяти, возможен конфликт между процессом предварительной подготовки команды и доступом к данным. Выполнение раздельного кэширования для команд и данных исключает такие конфликты, давая возможность обеим командам выполняться одновременно. Кэш-память программного кода и данных Pentium процессора содержит по 8 KB информации каждая, и каждая организована как набор двухканального ассоциативного КЭШа - предназначенная для записи только предварительно просмотренного специфицированного 32-байтного сегмента, причем быстрее, чем внешний кэш. Все эти особенности расширения производительности потребовали использования 64-битовой внутренней шины данных, которая обеспечивает возможность двойного кэширования и суперскалярной конвейерной обработки одновременно с загрузкой следующих данных. Кэш данных имеет два интерфейса, по одному для каждого из конвейеров, что позволяет ему обеспечивать данными две отдельные инструкции в течение одного машинного цикла. После того, как данные достаются из КЭШа, они записываются в главную память в режиме обратной записи. Такая техника кэширования дает лучшую производительность, чем простое кэширование с непосредственной записью, при котором процессор записывает данные одновременно в кэш и основную память. Тем не менее, Pentium процессор способен динамически конфигурироваться для поддержки кэширования с непосредственной записью.
Таким образом, кэширование данных использует два различных великолепных решения: кэш с обратной записью и алгоритм, названный MESI (модификация, исключение, распределение, освобождение) протокол. Кэш с обратной записью позволяет записывать в кэш без обращения к основной памяти в отличие от используемого до этого непосредственного простого кэширования. Эти решения увеличивают производительность посредством использования преобразованной шины и предупредительного исключения самого узкого места в системе. В свою очередь MESI-протокол позволяет данным в кэш-памяти и внешней памяти совпадать - великолепное решение в усовершенствованных мультипроцессорных системах, где различные процессоры могут использовать для работы одни и те же данные.
Блок предсказания правильного адреса перехода - это следующее великолепное решение для вычислений, увеличивающее производительность посредством полного заполнения конвейеров командами, основанное на предварительном определении правильного набора команд, которые должны быть выполнены.
Pentium процессор позволяет выполнять математические вычисления на более высоком уровне благодаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвейер и аппаратно реализованные основные математические функции. Четырехтактовые конвейерные команды вычислений с плавающей запятой дополняют четырехтактовую целочисленную конвейеризацию. Большая часть команд вычислений с плавающей запятой могут выполняться в одном целочисленном конвейере, после чего подаются в конвейер вычислений с плавающей запятой. Обычные функции вычислений с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью ускорения вычислений.
В результате этих инноваций, Pentium процессор выполняет команды вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростных численных вычислений, являющихся неотъемлемой частью таких усовершенствованных видеоприложений, как CAD и 3D-графика.
Pentium процессор снаружи представляет собой 32-битовое устройство. Внешняя шина данных к памяти является 64-битовой, удваивая количество данных, передаваемых в течение одного шинного цикла. Pentium процессор поддерживает несколько типов шинных циклов, включая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.
Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенно повышает скорость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Эта расширенная шина данных способствует высокоскоростным вычислениям благодаря поддержке одновременной подпитки командами и данными процессорного блока суперскалярных вычислений, благодаря чему достигается еще большая общая производительность Pentium процессора по сравнению с процессором Intel486 DX.
Давая возможность разработчикам проектировать системы с управлением энергопотреблением, защитой и другими свойствами, Pentium процессор поддерживаем режим управления системой (SMM), подобный режиму архитектуры Intel SL.
Вместе со всем, что сделано нового для 32-битовой микропроцессорной архитектуры фирмы Intel, Pentium процессор сконструирован для легкой наращиваемости с использованием архитектуры наращивания фирмы Intel. Эти нововведения защищают инвестиции пользователей посредством наращивания производительности, которая помогает поддерживать уровень продуктивности систем, основанных на архитектуре процессоров фирмы Intel, больше, чем продолжительность жизни отдельных компонентов. Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в уже существующих системах с помощью простой инсталляции средства однокристального наращивания производительности. Например, первое средство наращивания - это OverDrive процессор, разработанный для процессоров Intel486 SX и Intel486 DX, использующий технологию простого удвоения тактовой частоты, использованную при разработке микропроцессоров Intel486 DX2.
Первые модели процессора Pentium работали на частоте 60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-битовой шине данных, работающей на полной скорости процессорного ядра. Hо если скорость процессора Pentium растет, то системному разработчику все труднее и дороже обходится его согласование с материнской платой. Поэтому быстрые процессоры Pentium используют делитель частоты для синхронизации внешней шины с помощью меньшей частоты. Hапример, у 100 МГц процессора Pentium внешняя шина работает на 66 МГц, а у 90 МГц - на 60 МГц. Процессор Pentium использует одну и ту же шину для доступа к основной памяти и к периферийным подсистемам, таким как схемы PCI.

Intel Pentium II (произносится: Интел Пентиум два) - процессор архитектуры x86, анонсированный 7 мая 1997 года. Ядро Pentium II представляет собой модифицированное ядро P6 (впервые использованное в процессорах Pentium Pro). Основными отличиями от предшественника являются увеличенный с 16 до 32 Кб кэш первого уровня и наличие блока SIMD-инструкций MMX (появившихся немногим ранее в Pentium MMX), повышена производительность при работе с 16-разрядными приложениями. В системах, построенных на базе процессора Pentium II, повсеместное применение нашли память SDRAM и шина AGP.

Процессор Pentium II представляет собой картридж SECC или SECC2 (отличающийся более простой конструкцией), содержащий процессорную плату («субстрат») с установленными на ней ядром процессора, микросхемами кэш-памяти BSRAM и tag-RAM. Кэш-память второго уровня работает на половине частоты ядра. Процессор предназначен для установки в 242-контактный щелевой разъём Slot 1.
Существует также вариант Pentium II OverDrive в корпусе PGA (устанавливается в гнездовой разъём Socket 8) с полноскоростным кэшем второго уровня, предназначенный для замены Pentium Pro.Первые процессоры Pentium II (Klamath) были предназначены для рынка настольных персональных компьютеров и производились по 350 нм техпроцессу. Дальнейшим развитием семейства десктопных Pentium II стало 250 нм ядро Deschutes. Через некоторое время вышли процессоры Mobile Pentium II, предназначенный для установки в ноутбуки, и Xeon, ориентированный на высокопроизводительные системы и серверы. На базе ядра Deschutes выпускались также процессоры Celeron (Covington), предназначенные для использования в недорогих компьютерах. Они представляли собой Pentium II, лишённый картриджа и кэша второго уровня.

Процессоры Pentium III с тактовыми частотами 766, 800, 850, 866 и 1 ГГц (1000 MГц) и выше, являлись самыми совершенными и наиболее мощными процессорами корпорации Intel (до выпуска процессоров Intel Pentium 4) для настольных ПК и обладали производительностью Internet-приложений следующего поколения, а также качеством, надежностью и совместимостью.
Процессор Pentium III идеально соответствует требованиям активных пользователей ПК, любителей компьютерных игр и Internet. Этот процессор полностью реализует мультимедийные возможности ПК, прежде всего, в области работы полноэкранного видео и высококачественной графики и восприятия Internet. В процессоре Pentium III воплощено все лучшее от процессоров Intel® и реализованы новейшие технологии. Среди них, в частности, 70 новых команд, обеспечивающих широкие возможности при работе с новым программным обеспечением и путешествиях по Internet.
Поставляемые версии процессоров имеют тактовую частоту системной шины либо 133 МГц, либо 100 МГц и поддерживают работу с чипсетами Intel R 840, 820, 815, 810e, 440GX и 440BX и их аналогами.
Процессоры Pentium III доступны в двух различных типах корпусов: Картридж с одним рядом контактов типа 2 (Single Edge Contact Cartridge 2 - S.E.C.C .2) и Корпус с перевернутым кристаллом и с матрицей штырьковых выводов (Flip-Chip Pin Grid Array - FC-PGA). Корпус FC-PGA разработан для нового поколения персональных компьютеров с низким профилем корпуса.
Pentium III процессор имеет два отдельных 16 КБ-х кэша первого уровня (L1), один для команд и один для данных. Кэш L1 обеспечивает быстрый доступ к недавно использованным данным, увеличивая общие эксплуатационные показатели системы. 256 КБ-й кэш второго уровня (L2) с улучшенной передачей данных (Advanced Transfer Cache-ATC). Кэш ATC содержит ряд микро архитектурных усовершенствований, для обеспечения более скоростного интерфейса между кэшем L2 и ядром процессора, и работает с частотой ядра процессора. Особенностью ATC является:
Не блокирующий, полно скоростной кэш второго уровня
Ассоциативность набора с 8 путями
256-разрядная шина данных
Интерфейс с уменьшенным временем ожидания по сравнению с дискретными кэшами

Pentium 4 (произносится: Пентиум четыре) - x86-совместимый процессор, разработанный Intel. Микроархитектура процессора была полностью изменена, по сравнению с предыдущими поколениями процессоров. Новая микроархитектура получила новое название - NetBurst. Оригинальный Pentium 4 носил кодовое имя «Willamette», работал на частотах 1,4 и 1,5 ГГц и был анонсирован 20 ноября 2000 года (изначально анонс был запланирован на октябрь, однако дата анонса была перенесена) и предназначался для установки в разъём Socket 423. Первые процессоры, основанные на новой архитектуре, вызвали множество нареканий. Во-первых - это производительность, производительность Pentium 4 была ниже чем у Pentium III, работающего на частоте в 1,5 раза меньшей. Во-вторых, для работы нового процессора требовалась материнская плата, основанная на чипсете i850, которая стоили весьма недёшево. В-третьих, все материнские платы предназначались для работы с дорогой памятью Rambus (RDRAM). В-четвертых, для работы материнской платы требовалась замена блока питания, а иногда и корпуса.
За более чем 5 лет было выпущено множество ядер и моделей Pentium 4, основанных на них. Причем с выходом новой модели к названию процессора добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и другое; всё это существенно запутывает идентификацию конкретной модели.
Процессор Pentium 4 построен на совершенной новой архитектуре - NetBurst. Ниже приведены некоторые отличительные особенности оригинальной архитектуры NetBurst (некоторые из них в последующем были изменены).
Конвейер. Длина конвейера была увеличена до 20 шагов, то есть для завершения одной команды процессору требовалось 20 циклов. Данный шаг позволял значительно легче наращивать тактовую частоту, кроме того, в перспективе это позволяло значительно повысить быстродействие, но производительность в расчете на 1 МГц была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая производительность Pentium 4, работающего на низких частотах. Так же в результате такого нововведения увеличилось и время ожидания.
Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки применения длинного конвейера инженеры Intel улучшили схему предсказания ветвлений, в результате правильность перехода предсказывалась с вероятностью до 95 %.
Системная шина. В Pentium 4 используется совершенно новая 128-битная системная шина с двумя 64-битными линиями. Частота новой шины(FSB) составляет 100 МГц (у последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет передачи за 1 такт одновременно 4 пакетов (QPB - Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная способность шины составляла 3200 Мб/с.
Арифметико-логическое устройство (АЛУ или ALU). В АЛУ обрабатываются целочисленные команды. В новом процессоре АЛУ работает на удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции выполняются за половину такта. В Pentium 4 используются два АЛУ.
Кэш-память первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и для данных. В кэше теперь хранятся декодированные команды и располагаются в порядке их выполнения (технология Trace Cache), что увеличивает производительность.
Математический Сопроцессор (FPU). Математический сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную вычислительную работу выполняет лишь один модуль - это операции сложения (FADD) и умножения (FMUL), второй модуль выполняет операции обмена между регистрами и памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает производительность в 1,4 GFLOPS. К примеру, в процессорах Athlon используется сопроцессор, состоящий из трех модулей (один для операций типа FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
SIMD-расширения. В процессор Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с плавающей запятой).

Итак, сегодня компания Intel выпустила, по всей видимости, последний процессор семейства Pentium 4, теперь всему миру остается ждать появления Intel Pentium 5 Prescott. Насколько нам известно, сегодняшний Intel Pentium 4 3.20 GHz будет последним процессором линейки собранным по 130 нм техпроцессу.
Intel, как известно, будет выпускать процессоры Prescott по 90 нм технологии, а со следующего года поменяет и собственно процессорный разъем. Нынешние Pentium 4, с технологией Netbust, тем не менее, будут производиться еще около года, Netbust останется и в Pentium 5.


4. AMD

AMD - мировой поставщик интегральных микросхем для рынка персональных и сетевых компьютеров и коммуникаций, чьи производственные мощности расположены в Соединенных Штатах, Европе, Японии и Азии. AMD производит микропроцессоры, устройства флэш-памяти и вспомогательные микросхемы для коммуникационных и сетевых приложений. Компания AMD, основанная в 1969 году со штаб-квартирой в г. Саннивейл (шт. Калифорния), в 2000 году имела оборот 4,6 млрд. долл. (NYSE: AMD).

Первым процессором, который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году. Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Как всегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте и производительности, AMD не смогла тогда завоевать расположения пользователей.

После этого провала AMD приобрела забытую сейчас фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU - K6. По операциям с целыми числами эти процессоры стали превосходить аналоги от Intel, однако блок операций с плавающей точкой все еще оставлял желать лучшего.

AMD не сдавалась и для нужд компьютерных игр предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!. Так появился процессор AMD K6-2, в котором к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность.

Находясь в состоянии ценовой войны, Intel и AMD пришли к тому, что самые дешевые Intel Celeron продаются практически по себестоимости, если не ниже, а на рынке дорогих процессоров обосновался другой продукт от Intel - Pentium III. Единственный оставшийся шанс выжить для измотанной и порастерявшей в борьбе свои капиталы AMD - вылезти на рынок дорогих и производительных процессоров. Причем, закрепиться на нем не за счет цены - этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнее AMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив на рынок процессор нового поколения - Athlon.

Начиная с 1995 г. Intelприступила к выпуску серийногоCISC-процессораP6 шестого поколенияi 686 под торговой маркойPentiumProс напряжением питания около 3 В. Он содержит 5 500 тысяч транзисторов на кристалле и изготовлен по 0,35 мкм технологии в корпусе с 387 выводами. В создании этого процессора разработчики воспользовались всеми техническими решениями, ранее применяемыми в суперЭВМ. К таким решениям относятся включение в структуру процессора устройств динамического определения порядка выполнения команд и нескольких многоступенчатых конвейеров. В отличии от двух 5-ступенчатых конвейеровPentium,P6 имеет три 10-ступенчатых. Увеличение числа конвейеров и ступеней обработки команд в них позволило увеличить внутреннюю тактовую частоту синхронизации, которая стала равной 133, 166, 180, 200 МГц и более. ВPentiumProдля повышения производительности вычислений за счет увеличения внутренней тактовой частоты внедрены следующие структурные дополнения в семейство х86:

Применено динамическое исполнение команд, при котором команды, не зависящие от вычислений ранних операций в программе, выполняются в измененном сдвоенном порядке с передачей результатов в закрепленном в программе порядке;

Использован тыльный кэш-2 с двумя раздельными системными шинами обмена: скоростной короткой для обмена между МП и кэш-2; традиционной процессорной с частотой синхронизации 66,6 МГц;

Внешний кэш-2 емкостью 256 или 512 Кб размещен в корпусе МП;

Внедрены дополнительные средства контроля ECCпри обмене в системной шине, кэш-2, ОЗУ и возможность контроля дублированием вычислений вторым МП в режимеFRC;

Системная шина с программируемым контроллером и интерфейсом APICобеспечивает мультипроцессорную обработку до 4 МП, объединенных в единую систему.

Увеличение частоты синхронизации позволяет повысить быстродействие обработки команд, что, в свою очередь, требует повышения скорости обмена с внешним ОЗУ. Чтобы исключить задержки обмена с ОЗУ, в кристалле процессора смонтирована буферная память второго уровня (кэш-2) емкостью 256 Кб. Блок кэш-2 связан внутри процессора через интерфейс памяти собственной синхронной внутренней 64-разрядной шиной данных, работающей на тактовой частоте процессора.

С целью эффективного вычисления последовательности команд в PentiumProиспользуется буфер предсказания ветвлений ВТВ0, ВТВ1 на 512 входов. Использование этих блоков позволило разработчикам добиться наибольшей загрузки двух блоков целочисленной арифметики (АЛУ), сопроцессора (FPU), блоков записи и загрузки, увеличив производительность по сравнению сPentiumна 35 – 45 %. Эта производительность оказалась всего лишь в 1,5 раза меньше, чем у самого быстрогоRISC-процессораDECAlpha21164. Схема МПPentiumProпоказана на рис. 2.13. ПроцессорPentiumProвыполняет вычисления в конвейере в следующей последовательности. Операционная система загружает из ОЗУ через системную шину в кэш-2 массивы данных и набор команд для выполнения программ, которые образуют очередь с приоритетами и привилегиями. Первая программа из очереди одновременно загружается в кэш-1 команд, а операнды, с которыми она работает, передаются в кэш-1 данных. Адреса команд и данных располагаются в блоке тэгов обоих кэш-1, и в случае промаха при обращении к кэш-1 недостающие команды или данные постоянно доизвлекаются чаще всего из кэш-2 и реже, при отсутствии в нем, из основного ОЗУ. На первой ступени дешифрирования (DC) три команды динамически распределяются на параллельную обработку во вторую ступень дешифрацииID1 (распределение на параллельную обработку в целочисленные АЛУ иFPU). В результате после второй ступени дешифрации в каждом такте могут появляться одновременно до шести микроопераций, подлежащих выполнению в операционном блоке (Port0 - 4) ядра процессора.

Эти микрооперации закрепляются за регистрами в блоке переименования регистров и выделения ресурсов RAT. Блок переименования регистровRATпозволяет закрепить для выполнения операций более восьми РОН, используемых для программирования. При наличии нескольких конвейеров это даёт возможность одновременно выполнять несколько команд, ссылающихся на одни и те же регистры в разных конвейерах по мере их освобождения.

После RATнабор микроопераций направляется в блок резервированияRSи буфер переупорядочивания чтенияROBRd, который осуществляет вычисление адресов операндов и загрузку ими переименованных регистров РОН в двух целочисленных АЛУ.

После выполнения микроопераций ROBRdудаляет их из блока резервированияRS. БлокRSявляется начальной ступенью произвольной обработки в ядре МП. В нем микрооперации могут ожидать операнды или устройства для выполнения операции. Если операнды доступны и устройства свободны, микрооперация направляется на исполнение через один из портовPort0 - 4 минуя такты ожидания. Результаты выполнения микроопераций передаются в переупорядочивающий буфер записиROBwbи файл регистровRRF, способный принимать за один такт три операнда. В этом блоке результаты окончания операций ожидают освобождения ШД для записи в кэш и ОЗУ. Для чего им восстанавливается порядок, соответствующий порядку результатов при выполнении закодированной программы.

Для PentiumProIntelразработала два чипсетаPCI: 82450GX(для серверов) и 82450FХ (для рабочих станций) и специальное программное обеспечение, обеспечивающее параллельную обработку команд в конвейере с 32 - разрядными числами. ХотяPentiumProпрограммно совместим с предыдущими моделями микропроцессоровx86, эффективное его использование в персональных компьютерах сдерживалось дороговизной ЭВМ и недостаточным количеством необходимого программного обеспечения.

5.2. Процессор Pentium II

Процессор PentiumII, ранее носивший названиеKlamath, характеризуется дальнейшим увеличением быстродействия процессоровPentium, совместимых с архитектуройx86. Объединив технологиюMMXи архитектуру ядра МПPentiumPro, фирмаIntelс мая 1997 года начинает производить процессорPentiumIIпо 0.35-мкм КМОП-технологии с четырьмя слоями металлизации. Центральное ядро содержит 7.5 млн транзисторов и располагается на площади 203 мм 2 .

Кристалл PentiumIIразмещается в пластмассовом корпусеPLGA, имеющем матрицу из 528 миниатюрных контактных площадок. Этот корпус устанавливается на одной процессорной мини-плате, уменьшающей отбраковку МП при производстве, вместе с кэш второго уровня и микросхемой памяти для хранения тэговTagRAM. Он закрыт в картридже общей крышкой, которая и охлаждается специальным вентилятором. Картридж с односторонним расположением контактов (S.E.C.С.) устанавливается в специально разработанный фирмойIntelразъёмSlot1 на системной плате. Картридж может быть легко модифицирован с появлением новых промышленных кристаллов МП, кэш-2, памяти тэгов и контроллера кэша. Используя размер стока транзистора 0.28 мкм,Intelудалось повысить предельное быстродействие и достигнуть тактовой частоты от 233 до 450 МГц. На частоте 266 МГцPentiumIIпотребляет до 38 Вт электроэнергии.

Внешняя тактовая частота процессора остается 66,6 МГц, что не позволяет более эффективное использование SDRAM, предназначенной для работы на частотах 83 и 100 МГц. С использованием двухпроцессорного режимаSMPи интерфейсаAPICвозможна работа МП как в режиме параллельной обработки информации, так и в режиме контроля одного процессора другим в системеFRC.

В процессорах PentiumProиPentiumIIдля расширения адресного пространства используется шина запроса памятиREQ(3,0). В режиме обмена с памятью, дополняя ША до 36 бит, она позволяет работать МП с памятью до 64 Гб.

Архитектура ядра PentiumIIмало отличается от архитектурыPentiumPro. Традиционная система команд х86 реализуется с использованием методов, заимствованных уRISC-процессоров. При этом каждая операция преобразуется в последовательность простых микрокоманд. Эти простейшие микрокоманды выполняются с использованием принципов множественного предсказания переходов, исполнения команд по предположению и с изменением последовательности способа переименования регистров, что позволяет организовать параллельную конвейерную обработку нескольких команд.

Однако архитектуры PentiumIIиPentiumProимеют два существенных отличия.PentiumIIспециально создан для скоростной обработки мультимедиа-приложений, сочетает использование до 40 Мб видеопамяти с выполнением высококачественных ускоренных графических процессов, включающих до 512 Мб ОЗУSDRAM, и обменом через новую шинуAGPс профессиональным графическим ускорителем и поддержкой разрешения 1600х1280 при 16.7 млн цветов. МП поддерживает мультимедийное расширение набора команд (MMX). Для исполнения команд ММХ ядромPentiumProвPentiumIIвведены порты:

Кроме того, PentiumIIимеет средства переименования сегментных регистров. Использование этих средств ускоряет работу процессора под управлением 16-разрядных программ. При выполнении вPentiumProранее разработанных 16-разрядных программ изменение содержимого сегментных регистров происходит часто. При этом обновление содержимого сегментного регистра требует очистки конвейера от команд, то есть необходимо выполнить все команды, использующие текущее значение сегментного регистра, до его обновления. С учетом времени, необходимого на передачу результатов для записи, полученная задержка составит почти 30 тактов.

PentiumIIв этом режиме выполняет запись в регистры по предположению, что позволяет командам, использующим старое значение сегмента, сосуществовать с командами, использующими новое значение сегмента. Ускорение работы 16-разрядных приложений может составить до 50% на той же частоте по сравнению с процессоромPentiumPro.

PentiumIIможет обрабатывать 57MMX-команд, при этом используется 8 адресуемых 64-разрядных регистров ММХ. Наличие команд поддержки режимаMMXпозволяет ускорить обработку мультимедиа-приложений при соответствующем программном обеспечении.

Для компенсации относительно медленной работы кэш второго уровня размер внутреннего кэш был увеличен вдвое: с 16 Кб до 32 Кб (16 Кб для хранения команд и 16 Кб – для данных), где кэш-1 данных разбит на 8 чередующихся банков. Увеличение объема внутреннего кэша позволяет снизить частоту обращений к внешней памяти. Для установки PentiumIIразработаны материнские платы с набором ИС 440LX, конструктивно несовместимые с ранее выпускавшимися процессорами.

В январе 1998 г. Intel представила, кроме МП Pentium II 233, 266 и 300 МГц, четвертый по счету процессор семейства Pentium II, имеющий тактовую частоту 333 МГц на кристалле, содержащем 7.5 млн транзисторов (каждый транзистор в 400 раз меньше диаметра человеческого волоса). Он выпущен с применением передовой тогда 0,25 мкм производственной технологии Intel. ПроцессорPentium II 333 МГц имеет наивысшую производительность по сравнению с предыдущими моделями при выполнении целочисленных операций и при работе с мультимедиа (для обработки звука, видео, оцифрованных изображений и поддержки видеоконференций).

Процессор Pentium II 333 МГц имеет все те же характеристики, что и ранее выпущенные версии процессора Pentium II, в том числе: архитектуру двойной независимой шины (DIB), режим динамического исполнения, набор мультимедийных команд технологии Intel MMX и шину кэш-памяти второго уровня (L2) 512 Kб, работающую на частоте, в два раза меньшей тактовой частоты процессора. Для процессора Pentium II 333 МГц частота шины кэш-памяти L2 составляет 166.5 МГц.

При работе со стандартными офисными приложениями процессор Pentium II 333 МГц превосходит процессор Pentium II 300 МГц по производительности на 10 % . Более ощутимо преимущество процессора Pentium II 333 МГц при его сравнении с процессором Pentium MMX, имеющим тактовую частоту 233 МГц. Притом что разница тактовых частот этих процессоров составляет 42 %, Pentium II 333 МГц превосходит его по производительности на 50 – 80 %.

Характеристики процессора Pentium II представлены в табл. 2.4, из которой видно, что в дальнейшем было выпущено еще несколько его модификаций вплоть до Pentium II 450 МГц.

Вторичный кэш в PentiumIIмедленнее, чем вPentiumPro. Он построен по четырёхканальной множественно-ассоциативной синхронной структуре без блокирования на элементах статической памятиSRAMи работает в пакетном режиме. Частота тыльного кэш второго уровня в два раза ниже, чем внутренняя частота процессора. Емкость кэш второго уровня составляет 512 Кб, однако в других вариантах процессораPentiumIIможет устанавливаться кэш меньшей емкости (256 Кб).

5.3. Процессор Pentium III

Процессор Pentium II, как описано в п. 2.5.(«ПроцессорPentiumII»), изготовлен на основе ядраKlamathпо технологии 0,35 мкм с частотой внешней шины 66 МГц. Затем на основеKlamathфирмойIntelбыло разработано ядроDeschutesдля 0,25 мкм технологии и изготовлен PentiumIIс частотой шины 100 МГц и PentiumIIXeon(Зеон), отличающиеся более высоким быстродействием и емкостью кэш-2, и дешевыйCeleron(в начале без кэш-2 с частотой внешней шины 66 МГц). Позже на базеDeschutesбыло разработано ядро с интегрированным в тот же корпус быстрым кэш-2Mendocino, на базе которого выпускались всеCeleron«А» (с внутренним кэш-2 емкостью 128 Кб). ЗатемIntelразработала МПDixonс емкостью 256 Кб встроенного кэш-2. ЭтоCeleronс увеличенным кэш-2 вдвое. Но так как он работает как PentiumII, то имеет другое название. В начале 1999 г. на основе ядраKatmaiизготовленыPentiumIIIиPentiumIIIXeon(Tanner). В конце 1999 г. на базе ядраCoppermineпо 0,18 мкм технологии изготовленPentiumIIIиPentiumIIIXeon(Cascades), имеющие какMendocinoбыстрый интегрированный кэш-2. С 2001 г.Pentium III выпускается по 0,13 мкм (металлизацияCu) технологии на базе ядраTualatinс частотой шины 1400 МГц и дешевыйCeleron(1.2 и 1.3 ГГц).

Так, ядро Coppermineимеет кэш-2 емкостью 256 Кб, который работает синхронно с МП. Организация внутреннего кэш-2 изменена. Он представляет собой 8-канальный ассоциативный буфер с 256-разрядной шиной ядра. Обмен МП с кэш-2 требует новых протоколов, то есть обновленнойBIOS. В процессореPentiumIIIоптимизирована схема внутренней буферизации (4 буфера с обратной записью; 6 буферов заполнения; 8 входов очереди шины). Оптимизация привела к сокращению времени ожидания данных из кэш-2 и увеличению производительности МП на той же частоте на 10 – 20 %. Повышение тактовой частоты до 1000 МГц достигнуто за счет уменьшения технологических норм, добавления 6 слоя алюминиевой металлизации и улучшения внутренней разводки цепей МП. Согласующие резисторы и конденсаторы, которые ранее устанавливались на плате процессорного модуля дляSlot1, перенесены в кристалл СБИС. Напряжение питания ядра понижено до 1.1 – 1.65 В.

Таким образом, начиная с 1999 г. фирма Intelосуществляет серийный выпуск процессора PentiumIIIразных модификаций по 0.25 и 0.13 мкм технологии с внутренней частотой синхронизации от 450 до 1400 МГц. PentiumIIIв зависимости от модификации ядра изготавливается на кристалле, содержащем от 9.5 до 42 млн транзисторов. Он ориентирован на применение в настольных (PentiumIII450/500/533ЕВ/…/1400), портативных (MobillPentiumIII400/500/600) ПК, а также для работы в серверах (PentiumIIIXeon600B/667B//1000B). С индексом ”В” процессоры используются в материнских платах с частотой системной процессорной шины FSB 133 МГц. Процессоры Pentium III с индексом ”Е” имеют напряжение питания 1.6 В и изготовлены по 0.18 мкм технологии с внутренним кэш-2 емкостью 256 Кб, размещённым в кристалле процессора. В связи с этим Pentium III Е выпускается как в виде картриджа S.E.C.C.2 с разъёмом Slot 1, так и в виде одной СБИС в новом корпусе FCPGA с разъёмом Socket 370. С появлением Celeron, а затем Pentium III и Xeon осуществлялся переход спецификации процессорной шины и стандарта разъёма МП Slot 1 на Socket 370, а затем на Socket FCPGA. Для Xeon был разработан свой стандарт разъёма Slot 2.

Mobill Pentium III питается от источника с пониженным напряжением 1.35 В и тактового генератора с частотой 100 МГц. Он оснащен встроенным в МП кэш-2 емкостью 256 Кб и блоком SSE.

У Pentium III 0.25 мкм технологии кэш-2 емкостью 512 Кб размещается на процессорной плате. Обычный Pentium III поддерживает двухпроцессорную конфигурацию, а Хеоn до 4 МП. Хеоn может взаимодействовать с внешним тыльным кэш-2 емкостью до 2 Мб, работающим на частоте процессора, что позволяет намного увеличить его быстродействие вычислений по сравнению с обычным Pentium III .

Новый картридж процессора Pentium III, заключенный в корпус с односторонним расположением контактов SECC2, упрощает конструкцию системных плат, предназначенных для работы с этим процессором, облегчает массовое их производство, безопасность при использовании и обеспечивает единый форм-фактор процессоров будущего. SECC2 – некое промежуточное звено между стандартным SECC и его полным отсутствием. В нём радиатор, обдуваемый вентилятором, соприкасается не с железной пластиной, прижатой к ядру, а непосредственно с микросхемой, обеспечивая лучший отвод тепла от кристалла, помещенного в новый органический сплав на основе меди OLGA.

Pentium III имеет следующие особенности:

1.Обеспечивает одновременно технологии потоковых SIMD-расширений SSE для Internet, динамического исполнения команд и технологию MMX.

2.Имеет архитектуру независимой двойной шины DIB, что увеличивает пропускную способность и производительность его по сравнению с процессорами с единственной шиной данных.

3.Содержит функцию серийного номера процессора для расширения степени управляемости ЭВМ.

4.Имеет неблокируемую кэш-1 первого уровня емкостью 32 Kб (16 Кб/16 Кб) и унифицированную неблокируемую кэш-2 второго уровня емкостью 512 Кб, что обеспечивает ускоренный доступ к часто используемым данным.

5.Поддерживает кэширование памяти с объемом адресного пространства 4 Гб.

6.Позволяет создавать масштабируемые системы с двумя процессорами и физической памятью объемом до 64 Гб.

7.Поддерживает тестирование и мониторинг производительности.

8.Совместим по кодам с существующим программным обеспечением и процессорами предшествующих поколений на базе архитектуры Intel.

Потоковые SIMD-расширения SSE для Internet (MMX2) представляют собой 70 новых команд, сгруппированных в следующие категории:

1.Команды копирования данных movaps ,…, movss . Команды этой группы выполняют операции параллельного копирования упакованных элементов данных (PS), а также скалярного (SS) копирования только младшего элемента операнда. Действия производятся над операндами, расположенными в XMM‑регистрах или в памяти.

2.Арифметические команды SIMD выполняют сложение (addps ,addss ), вычитание, умножение (mulps ,mulss ), деление (divps ,divss ) и другие операцииданных одинарной точности с плавающей точкой. Входной (второй) операнд этих команд может располагаться либо в SIMD‑регистре, либо в памяти. Выходной (первый) операнд должен находиться в SIMD-регистре. Арифметические команды поддерживают как параллельные, так и скалярные операции.

3.Команды сравнения cmpps , cmpss и другие попарно сравнивают все четыре соответствующих FP‑элемента двух операндов (для скалярного (SS) варианта команд – только младшие элементы), устанавливают соответствующие флаги в регистре EFLAGS и проверяют выполнение арифметического условия, специфичного для каждой команды. Если для сравниваемой пары условие выполняется, то в соответствующие 32 разряда выходного операнда записывается маска из всех единиц. В противном случае – маска из нулей. Получаемая в результате двоичная маска обычно используется при логических операциях с объектами.

4.Команды преобразования типов данных выполняют преобразования данных из 32-разрядного целочисленного представления со знаком в FP-представление и обратно. Эти команды производят преобразование упакованных и скалярных данных между 128‑битными SIMD регистрами с плавающей точкой и также с 64-битными целыми MMX регистрами или 32-битными целыми регистрами IA-32.

5.Логические команды andps, andnps, orps иxorps часто используются для вычисления абсолютной величины (модуля) чисел; изменения знакового разряда (инверсии знака); действий с маской из нулей и единиц.

6.Дополнительные целочисленные SIMD-команды, команды перестановки, управления состоянием, управления кэшированием.

В Pentium III введён еще один блок, подобный MMX, только оперирующий с вещественными числами. Основной тип данных SSE это 128-разрядное значение, содержащее 4 последовательно расположенных (“упакованных”) 32-разрядных числа одинарной точности с плавающей точкой SPFP, как показано на рис. 2.14.

Рис. 2.14. Упакованное простое число с плавающей точкой

Каждое 32-разрядное число с плавающей точкой (см. рис. 1.2.) имеет 1 знаковый бит, 8 битов порядка и 23 бита мантиссы, что соответствует стандарту IEEE-754 на формат представления чисел одинарной точности с плавающей запятой. SIMD-инструкции оперируют в новом модуле SSE со специальными 128-битными регистрами XMM0-XMM7 и улучшают работу с приложениями трехмерной графики, потокового аудио, видео и распознавания речи. Каждый из этих регистров хранит 4 вещественных числа одинарной точности (ОТ). Потоковое расширение SIMD архитектуры Intel поддерживает 2 типа операций над упакованными данными с плавающей точкой – параллельные и скалярные.

Параллельные операции (ОР), как правило, действуют одновременно на все четыре 32-разрядных элемента данных в каждом из 128-разрядных операндов, как показано на рис. 2.15. В именах команд, выполняющих параллельные операции, присутствует суффикс ps . Например, командаaddps складывает 4 пары элементов данных и записывает полученные 4 суммы в соответствующие элементы первого операнда.

Скалярные операции действуют на младшие (занимающие разряды (31,0)) элементы данных двух операндов, как это показано на рис. 2.16. Остальные 3 элемента данных в выходном операнде не изменяются (исключение составляет команда скалярного копирования movss ). В имени команд, выполняющих скалярные операции, присутствует суффиксss (например, командаaddss ).

Рис. 2.15. Упакованные (параллельные) операции

Большинство команд двухадресные и оперируют с двумя операндами. Данные, содержащиеся в первом операнде, могут использоваться командой, а после ее выполнения, как правило, замещаются результатами. Данные второго операнда в команде после ее выполнения не изменяются. Для всех команд адрес операнда в памяти должен быть выровнен по 16-байтной границе, кроме невыровненных команд сохранения и загрузки.

Рис. 2.16. Скалярные операции

Таким образом, выполняя операцию над двумя регистрами, блок SSE фактически оперирует с четырьмя парами чисел. Благодаря этому процессор может выполнять до 4 одинаковых операций одновременно. Однако для выполнения четырех параллельных операций программист должен использовать специальные команды, а также позаботиться о помещении и извлечении данных из 128-битных регистров. Поэтому для использования всех вычислительных мощностей Pentium III необходима целенаправленная оптимизация.

Внедрение потоковых SIMD-расширений позволяет существенно увеличить скорость и качество работы в реальном времени приложений, использующих:

Трехмерную графику и 3D-моделирование, расчет освещенности с использованием вычислений с плавающей запятой;

Обработку сигналов и моделирование процессов с широким диапазоном изменения параметров (вычисления с плавающей запятой);

Генерацию трехмерных изображений в программах реального времени, не использующих целочисленный код;

Алгоритмы кодирования и декодирования видеосигнала, обрабатывающие данные блоками;

Численные алгоритмы фильтрации, работающие с потоками данных.

Использование потоковых SIMD-расширений позволяет получить более высокое разрешение и качество изображений на дисплее, более высокое качество звука, видео и возможности параллельного кодирования и декодирования в формате сжатия цифровых кодов на оптический диск MPEG2, а также снизить загрузки процессора при распознавании речи и увеличить точность и быстродействие вычислений.

Как указывалось выше, технология динамического исполнения команд в архитектуре Р6 обеспечивает предсказание ветвлений и прогнозирует исполнение программы по нескольким ветвям, позволяет осуществить анализ потока данных, оптимизацию и реорганизацию последовательности исполнения команд на основе используемых в них данных. Допускает спекулятивное исполнение команд на основе оптимизированной последовательности, которая увеличивает загрузку РОН и блоков процессора, что ведет к повышению общей производительности PentiumIII. Кроме того, технология MMX обеспечивается вPentiumIIIнабором 57 команд общего назначения для целочисленных операций, легко применимых к широкому спектру мультимедийных и коммуникационных приложений. Здесь также используются SIMD-инструкции, которые исполняются в восьми 64-разрядных регистрах MMX0-ММХ7.

Серийный номер процессора – это электронный номер, позволяющий идентифицировать конкретную систему в больших компьютерных сетях.

Тестирование и мониторинг производительности в Pentium III содержит следующие функции:

Встроенный механизм самотестирования BIST обеспечивает постоянный контроль зависаний и сбоев в микрокоде и больших логических матрицах, а также тестирование кэш команд и кэш данных, буферов TLB и сегментов памяти ROM;

Механизм стандартного порта доступа к тестированию и периферийному сканированию IEEE 1149.1 дает возможность осуществлять проверку каналов связи между процессором Pentium III и системой через стандартный интерфейс;

Встроенные счетные устройства следят за показателями производительности и ведут подсчет событий.

ВведениеЕщё в прошлом году компания Intel говорила о грядущей смене приоритетов в создании новых процессоров. Ввиду возникших трудностей на пути наращивания тактовых частот процессоров Pentium 4, компания решила сосредоточить основные усилия не на увеличении их производительности, а на расширении функциональности. В течение прошлого года были сделаны первые подвижки в этом направлении: например, CPU стали маркироваться при помощи процессорного рейтинга, а тактовая частота в маркировке была отодвинута на второй план. Однако, реальные шаги, направленные на придание процессорам новых функций, были запланированы на этот, 2005 год. Поэтому, первых в этом году анонсов процессоров мы ждали с особым нетерпением.
И вот, свершилось. Сегодня компания Intel представляет на суд потребителей новые процессоры в семействе Pentium 4, в основе которых лежит обновлённое ядро, известное под кодовым именем Prescott 2M. Хотя, взятый Intel курс на внедрение в настольные системы двуядерных процессоров пока никак не отразился в новинках, новые Pentium 4, обладающие рейтингами вида 6XX, наделены рядом новых и интересных возможностей. Именно поэтому процессоры Pentium 4 6XX на базе ядра Prescott 2M и являются столь интересными объектами для изучения: в этих CPU мы сталкиваемся с увеличенной кеш-памятью второго уровня и с новыми для сектора настольных компьютеров технологиями Enhanced Memory 64 Technology и Enhanced Intel SpeedStep.
Параллельно с линейкой Pentium 4 6XX Intel выводит на рынок и ещё один процессор, нацеленный на энтузиастов. Этот CPU, входящий в семейство Pentium 4 Extreme Edition, в отличие от линейки Pentium 4 6XX, призван поднять планку производительности и стать наиболее быстрым CPU от Intel на сегодняшний день. А потому, новый Pentium 4 Extreme Edition, хотя и лишён некоторой функциональности Pentium 4 6XX, имеет большую тактовую частоту и работает при более высокой частоте шины.
Впрочем, подходить к новым продуктам Intel можно и с другой стороны. На фоне несомненных успехов основного конкурента, компании AMD, процессоры Pentium 4 смотрелись до сегодняшнего дня не лучшим образом. Старшие модели Athlon 64 превосходили аналогичные продукты Intel как по быстродействию, так и по поддерживаемым функциям. Теперь же, очевидно, Intel предпринимает очередную попытку настичь конкурента. Увеличение кеш-памяти второго уровня в процессорах на новом ядре Prescott 2M имеет под собой цель поднять их производительность. А внедрение в Pentium 4 6XX новых технологий Enhanced Memory 64 Technology и Enhanced Intel SpeedStep можно рассматривать как ответ Intel на имеющиеся в процессорах Athlon 64 технологии AMD64 и Cool"n"Quiet.
В данном обзоре мы попробуем оценить новинки от Intel со всех сторон. Мы посмотрим как на то, какие новые возможности способны привнести новые технологии, появившееся в процессорах с ядром Prescott 2M, так и на то, насколько изменилась производительность новых CPU семейств Pentium 4 6XX и Pentium 4 Extreme Edition, и смогут ли они составить достойную конкуренцию старшим моделям процессоров Athlon 64 и Athlon 64 FX. Однако, по традиции, практическое исследование новинок предваряет небольшая теоретическая часть.

Новые процессоры Pentium 4 6XX и Pentium 4 Extreme Edition 3.73 ГГц

Итак, сегодня, 20 февраля 2005 года компания Intel официально объявила новые процессоры Pentium 4 Extreme Edition 3.73 ГГц и Pentium 4 серии 6XX. Все эти процессоры основываются на одном и том же процессорном ядре Prescott 2M, основным отличительным признаком является увеличенная кеш-память второго уровня, которая имеет объём 2 Мбайта. В остальном же, включая и 90 нм технологический процесс с использованием растянутого кремния, ядро Prescott 2M подобно своему предшественнику, ядру Prescott, которое уже давно используется в процессорах Pentium 4 серии 5XX.
Сходство между Prescott и Prescott 2M видно даже на фотографиях этих ядер:

PrescottPrescott 2M


Как видим, кеш память у Prescott 2M действительно стала в два раза больше. В остальном, видимых отличий между ядрами не наблюдается.
Семейство процессоров Pentium 4 6XX состоит на сегодняшний день из нескольких моделей с частотами от 3.0 до 3.6 ГГц. Все эти процессоры, как и их предшественники, используют шину Quad Pumped Bus с частотой 800 МГц. Младшая модель имеет процессорный номер 630, модель с частотой 3.2 ГГц – 640, 3.4-гигагерцовый процессор – 650 и CPU с частотой 3.6 ГГц – 660. Следует заметить, что частота старшего процессора в линейке "шестисотых", Pentium 4 660, меньше частоты старшего процессора на базе обычного ядра Prescott, Pentium 4 570, составляющей 3.8 ГГц. Однако при этом Pentium 4 6XX имеют по сравнению со своими младшими братьями ряд преимуществ.
Во-первых, процессоры семейства Pentium 4 6XX поддерживают технологию Enhanced Memory 64 Technology (EM64T) – 64-битные расширения архитектуры x86, являющиеся аналогом расширений AMD64. Благодаря этому все процессоры Pentium 4 6XX совместимы с операционной системой Windows XP Professional x64 Edition, которой немногим ранее мы посвятили отдельную статью . Благодаря совместимости с этой операционной системой, Pentium 4 6XX теперь могут похвастаться целым рядом преимуществ, знакомым нам по процессорам Athlon 64. В числе оных в первую очередь следует отметить одновременную совместимость с 32-битным и 64-битным программным обеспечением, а также поддержку объёмов памяти, превышающих 4 Гбайта.
Второй плюс процессоров Pentium 4 6XX - это поддержка ими технологии Enhanced Intel SpeedStep (EIST). Данная технология является полным аналогом аналогичного механизма, реализованного в мобильных процессорах Intel. Суть данного механизма заключается в том, что процессоры Pentium 4 6XX могут снижать свою частоту в моменты, когда от них не требуется высокая производительность. При помощи данного метода достигается существенное снижение тепловыделения и энергопотребления.
При этом все CPU семейства Pentium 4 6XX поддерживают технологию Execute Disable Bit (XD bit), появившуюся в Pentium 4 5XX с выходом старшей модели с частотой 3.8 ГГц и процессорным номером 570.
Таким образом, несмотря на свою более низкую тактовую частоту, процессоры Pentium 4 семейства 6XX по числу поддерживаемых функций превосходят своих предшественников, Pentium 4 5XX.
Следует напомнить, что Intel отказался от выпуска процессоров на базе ядра Prescott с частотами 4 ГГц и выше. Это относится и к CPU, в основе которых лежит ядро Prescott 2M. То есть, старшая модель в линейке 5XX, Pentium 4 570 с частотой 3.8 ГГц так и останется самой быстрой моделью CPU на базе ядра Prescott. В линейке же 6XX на сегодня старшая модель процессора с номером 660 имеет частоту 3.6 ГГц. Соответственно, более быстрые процессоры в этом семействе появляться могут. Так, во втором квартале текущего года Intel собирается объявить Pentium 4 670 с тактовой частотой 3.8 ГГц.
Впрочем, вопрос относительно того, какой из процессоров Intel является самым быстрым на сегодняшний день, решается не в пользу ни Pentium 4 660, не в пользу Pentium 4 570. На эту роль претендует ещё один процессор на базе ядра Prescott 2M, анонсированный сегодня и отнесённый к семейству Pentium 4 Extreme Edition. Данная новинка обладает тактовой частотой 3.73 ГГц и рассчитана на работу при частоте шины 1066 МГц. При этом, хотя большинство характеристик Pentium 4 Extreme Edition 3.73 ГГц повторяет характеристики серии Pentium 4 6XX, этот процессор не поддерживает технологию EIST. Технологии же XD bit и EM64T в этом CPU включены.
А вот какую информацию выдаёт о новых процессорах Pentium 4 Extreme Edition 3.73 ГГц и Pentium 4 660 диагностическая утилита CPU-Z:


Intel Pentium 4 660


Intel Pentium 4 Extreme Edition 3.73 ГГц


Подводя итог, приведём формальные характеристики анонсированных сегодня процессоров Pentium 4 6XX и Pentium 4 Extreme Edition. В таблице ниже для сравнения также приведены характеристики процессоров Pentium 4 5XX.


Что касается теплового пакета новых процессоров, то их тепловыделение укладывается в те же самые рамки, что и у процессоров серии 5XX. Соответственно Pentium 4 6XX c частотами до 3.4 ГГц включительно вписываются в TDP в 84 Вт, старшие же модели, а также новый Pentium 4 Extreme Edition 3.73 ГГц имеют TDP в 115 Вт.
Таким образом, новые процессоры могут использоваться в тех же самых материнских платах, что и предшествующие LGA775 Pentium 4. Единственное требование: поддержка новых CPU со стороны BIOS материнской платы.
А вот как выглядят новые процессоры:






Слева-направо: Pentium 4 570, Pentium 4 660,
Pentium 4 Extreme Edition 3.73 ГГц

Ядро Prescott 2M: изменения в кеш-памяти

Так как одним из основных нововведений, произошедших с процессорами Pentium 4 при их переводе на использование нового ядра Prescott 2M, стало увеличение кеш-памяти второго уровня, следует уделить немного внимания организации L2 кеш-памяти в новом ядре. Чтобы понять, как же устроена кеш-память второго уровня в новом ядре Prescott 2M, мы вновь воспользовались диагностической утилитой CPU-Z. Для сравнения, мы приводим и аналогичную информацию, относящуюся к более старому ядру, Prescott:

Как видим, у Prescott 2M и Prescott кеш-память второго уровня (да и первого тоже) организована совершенно одинаково. Различие только в размере. Кеш второго уровня у обоих ядер имеет 8 зон ассоциативности и оперирует строками длиной 64 байт. Однако наличие одинакового количества зон ассоциативности у кеш-памяти разного объёма автоматически означает, что поиск данных в более ёмком кеше должен выполняться дольше. Соответственно, L2 кеш процессоров на базе ядра Prescott 2M должен быть более медленным, чем L2 кеш процессоров, в основе которых лежит обычное ядро Prescott.
Чтобы проверить эту гипотезу, мы вооружились утилитой Cache Burst 32. Тестовая система, на которой мы проводили измерения, основывалась на материнской плате Intel Desktop Board D925XECV2 на чипсете i925XE Express и была снабжена двухканальной DDR2-533 SDRAM с таймингами 4-4-4-11. Для опытов мы использовали процессоры Pentium 4 560 и Pentium 4 660 на ядрах Prescott и Prescott 2M соответственно.












Как показывают результаты теста, действительно, скорость чтения из кеш-памяти второго уровня у нового процессора Pentium 4 660 ниже, чем у аналогичного Pentium 4 560 с меньшим объёмом кеш-памяти. При этом скорость записи и латентность кешей у этих CPU совпадает. Однако при копировании данных мы видим, что кеш-память процессора на ядре Prescott 2M работает несколько быстрее, чем кеш-память CPU с ядром Prescott.
Таким образом, мы вынуждены констатировать, что увеличение кеш-памяти второго уровня у процессоров Pentium 4 6XX повлекло за собой и некоторые глубинные изменения, в результате которых скорость работы с данными в L2 кеше изменилась. Причём, не в лучшую сторону. Отметим, что подобное же явление уже один раз происходило с NetBurst архитектурой при переходе от ядра Northwood к ядру Prescott. Так что мы вновь должны заметить, что увеличение объёма кеш-памяти второго уровня не лучшим образом отражается на её быстродействии.

Подробности о Demand Based Switching

С вводом в процессорах Pentium 4 6XX технологии Enhanced Intel SpeedStep (EIST) эти процессоры стали обладателями сразу трёх технологий, попадающих под собирательное название Demand Based Switching (переключение по потребностям). Первые две технологии мы уже рассматривали, обзирая процессор Pentium 4 570J, который был основан на ядре Prescott степпинга E0. С появлением этого степпинга ядра процессоры Pentium 4 получили в свое распоряжение новый механизм термального мониторинга TM2 и новый режим для снижения энергопотребления C1E. EIST дополнила эти технологии в новом ядре Prescott 2M и теперь новые процессоры Pentium 4 6XX могут похвастать ещё более низким средневзвешенным энергопотреблением и тепловыделением.
Технология EIST предназначается для управления частотой процессора и его напряжением в зависимости от степени загрузки, как это делается в мобильных компьютерах. В настольном сегменте аналогом EIST является технология Cool"n"Quiet от AMD, реализованная в процессорах семейства Athlon 64. Можно сказать, что EIST позволяет более рационально использовать ресурсы процессора: при работе в приложениях, не загружающих процессор на 100% его максимальная тактовая частота никому не нужна, в такие моменты её можно спокойно снизить, параллельно уменьшив тепловыделение и энергопотребление CPU. Если же приложение требует от процессора максимальной производительности, то он увеличит частоту до номинальной отметки, попутно подняв напряжение на ядре до нужной величины.
Включается технология EIST абсолютно также, как и Cool"n"Quiet. В Windows XP, например, на закладке Power Option Properties необходимо изменить схему питания компьютера со стандартной Home/Office Desk на Minimal Power Management. После этой установки процессор начнёт снижать свою частоту в моменты низкой загрузки. Необходимый для работы этой технологии процессорный драйвер входит в Service Pack 2, поэтому технология EIST становится совместимой с Windows XP после установки SP2.
На первый взгляд, EIST не вызывает никаких вопросов, однако эта достаточно интересная технология таит в себе и немало сюрпризов. Дело в том, что все три технологии семейства Demand Based Switching, C1E, TM2 и EIST используют один и тот же механизм. Именно поэтому мы решили ещё раз вернуться к рассказу о том, как же на самом деле работают эти технологии.
Функционирование C1E, TM2 и EIST основано на том факте, что процессоры Pentium 4 с ядром Prescott, начиная со степпинга E0, умеют изменять свой коэффициент умножения и Vid "на лету". Конкретнее, процессоры с ядрами Prescott и Prescott 2M при необходимости могут снижать свой множитель до 14x (а это – минимальное значение для ядра Prescott), уменьшая при этом своё напряжение питания примерно на 0.25В. Сочетание этих характеристик и определяет повсеместно эксплуатируемый "режим пониженного энергопотребления", при котором процессор работает на частоте 2.8 ГГц со сниженным напряжением питания. Вот, например, какую информацию выдаёт утилита CPU-Z про процессор Pentium 4 660 (штатная частота 3.6 ГГц), находящийся в этом "режиме пониженного энергопотребления":


Ещё одна интересная деталь заключается в том, что для всех процессоров серии Pentium 4 6XX с разными тактовыми частотами режим пониженного энергопотребления одинаков: все они в этом режиме работают на частоте 2.8 ГГц вне зависимости от их номинальной частоты.
Важно заметить, что для обеспечения стабильности работы переход в этот режим и выход из него происходит не скачкообразно, а постепенно. Так, при входе в "режим пониженного энергопотребления" процессор сначала понижает свой множитель до 14x, а лишь потом постепенно снижет напряжение питания. Выход из этого режима происходит в обратном порядке: сначала постепенно увеличивается напряжение, а только потом устанавливается штатный множитель.


Все три технологии из серии Demand Based Switching, C1E, TM2 и EIST, используют этот режим пониженного энергопотребления. Различие же между C1E, TM2 и EIST заключается лишь в том, в какие моменты включается данный режим.
Технология C1E (Enhanced Halt State) активизирует режим пониженного энергопотребления при поступлении на процессор команды Halt, говорящей о переводе процессора в режим ожидания. Эта команда отдаётся процессору операционной системой в моменты, когда для исполнения нет никаких других инструкций. То есть, если ранее процессоры Pentium 4 при поступлении команды Halt просто переводили часть своих исполнительных устройств в режим бездействия, режим C1E позволяет ещё сильнее снизить тепловыделение и энергопотребление благодаря дополнительному уменьшению тактовой частоты, на которой работает активная часть CPU в режиме ожидания.
Технология TM2 (Thermal Monitor 2) , хотя и предназначается для защиты процессора от перегрева, использует тот же самый 2.8-гигагерцовый режим пониженного энергопотребления. TM2 переводит CPU в этот режим по команде, поступающей от встроенного в ядро процессора термодатчика. Если температура процессора превышает некоторое предельно допустимое значение температуры (а это значение калибруется индивидуально для каждого экземпляра CPU), частота процессора снижается до 2.8 ГГц и одновременно понижается напряжение питания процессорного ядра. Этот механизм позволяет снизить температуру процессора до допустимых пределов примерно на 40% быстрее, нежели при используемом раньше механизме TM1, основанном на модуляции несущей частоты.
Технология EIST (Enhanced Intel SpeedStep) , как это не покажется странным, также переводит процессор в 2.8-гигагерцовый режим пониженного энергопотребления. В рамках этой технологии переход в данное состояние инициируется операционной системой. Если драйвер процессора рапортует о низкой загрузке CPU в конкретный момент времени, операционная система через соответствующую команду ACPI переводит процессор в режим пониженного энергопотребления. То есть, благодаря EIST удаётся снизить тепловыделение процессора не только в моменты его полного простоя, но и при небольшой загрузке.
Теперь о неприятном. Поскольку минимально возможным коэффициентом умножения для процессоров на базе ядра Prescott (и его производной Prescott 2M) является 14x, использование технологий C1E, TM2 и EIST возможно только для CPU, имеющих больший множитель. Например, именно поэтому новым процессором Pentium 4 Extreme Edition 3.73 ГГц технологии C1E, TM2 и EIST не поддерживаются: штатный множитель этого CPU равен 14x. Соответственно, чем выше штатный множитель у процессора, тем больший эффект способны принести технологии семейства Demand Based Switching.

Температурный режим и энергопотребление

После того, как мы разобрались, какие новые технологии для снижения энергопотребления применил Intel в своих процессорах семейства Pentium 4 6XX, самое время посмотреть, как они проявляются на практике. Поэтому, мы изучили температурный режим и энергопотребление новых процессоров во время их реальной работы.
Для целей тестирования мы собрали тестовую систему, состоящую из следующего набора комплектующих:


Память: 1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11);


В первую очередь в этой тестовой системе мы провели измерение температурного режима LGA775 процессоров Pentium 4 6XX и Pentium 4 5XX. В качестве процессоров линейки Pentium 4 5XX использовались CPU, в основе которых лежат ядра Prescott степпинга E0, то есть поддерживающие C1E и TM2. Pentium 6XX были представлены процессорами с ядром Prescott 2M степпинга N0, эти CPU поддерживали C1E, TM2 и EIST. Частоты испытуемых процессоров устанавливались в 2.8, 3.0, 3.2, 3.4, 3.6 ГГц, а для процессора на ядре Prescott со степпингом ядра E0 – и в 3.8 ГГц. Частота шины во всех случаях была номинальной, напряжение питания ядра – тоже. Во всех опытах использовался штатный боксовый LGA775 кулер. Показания температуры процессоров снимались с встроенного в ядро CPU датчика. Измерения температуры процессорных ядер мы выполняли в двух состояниях: в режиме ожидания (idle) и при максимальной загрузке CPU, создаваемой специальной утилитой S&M версии 0.3.2, являющейся на сегодняшний день лучшим инструментом для прогрева процессоров.
Помимо результатов измерений температур Pentium 4 "пятисотой" и "шестисотой" серий, на итоговые графики мы добавили и данные, полученные при испытании процессора Pentium 4 Extreme Edition 3.73 ГГц. Хотя этот процессор и основывается на том же самом ядре Prescott 2M степпинга N0, как и все Pentium 4 6XX, он не поддерживает технологии C1E, TM2 и EIST. Поэтому, его температурный режим и энергопотребление вызывает особый интерес.






Как видим, при максимальной нагрузке на процессоры Pentium 4 5XX и Pentium 4 6XX они прогреваются примерно до одинаковой температуры при равной тактовой частоте. То есть, увеличение кеш-памяти второго уровня не привело к какому сколько-нибудь заметному изменению температурной картины. Зато работа процессоров в состоянии покоя заслуживает определённого внимания. В первую очередь заметим, что вне зависимости от частоты Pentium 4 5XX и Pentium 4 6XX показывают совершенно одинаковую температуру. Это объясняется тем, что в состоянии бездействия эти процессоры, фактически, работают в "состоянии пониженного энергопотребления" на частоте 2.8 ГГц, независимо от их номинальной частоты. Например, Pentium 4 XE 3.73 ГГц, который технологии C1E, TM2 и EIST не поддерживает, в состоянии покоя прогревается гораздо сильнее. Это неудивительно: в этом состоянии, в отличие от процессоров Pentium 4 5XX и 6XX, он продолжает работать на своей штатной частоте.
Также, помимо температуры, мы оценили и энергопотребление процессоров с ядрами Prescott и Prescott 2M. Для этого при помощи токовых клещей мы измерили ток, проходящий по 12-вольтовой цепи, по которой осуществляется питание процессора. То есть, приводимые ниже данные не учитывают КПД конвертера питания процессора, поэтому, по сравнению с реальным энергопотреблением процессоров они слегка завышены (примерно на 10%).






Качественно картина получается такая же, как и при измерении температуры. Однако мы должны отметить, что новые процессоры на базе ядра Prescott 2M, несмотря на увеличившееся количество транзисторов, обладают более низким энергопотреблением, чем процессоры на базе обычного ядра Prescott. Таким образом, резервы для наращивания тактовых частот процессоров Pentium 4 6XX ещё есть.

Разгон

Чтобы оценить эти резервы, а также понять, насколько новое процессорное ядро Prescott 2M степпинга N0 может понравиться энтузиастам-оверклокерам, мы решили провести испытания CPU Intel Pentium 4 660 со штатной частотой 3.6 ГГц на разгон. Тестовая система, используемая в этом случае, была составлена из следующего набора комплектующих:

Процессор: Intel Pentium 4 660 (3.6 ГГц);
Материнская плата: ASUS P5AD2-E Premium (LGA775, i925XE Express);
Память: 1024MB DDR2-667 SDRAM (Corsair XMS2-5300, 2 x 512MB, 4-4-4-12).
Графическая карта: PowerColor RADEON X800 XT (PCI-E x16);
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).

Для охлаждения Pentium 4 660 во время наших разгонных экспериментов мы воспользовались самым производительным воздушным кулером для LGA775 процессоров, имеющимся в нашей лаборатории: Zalman CNPS7700Cu. Напряжение питания процессора при разгоне мы не увеличивали: на старшие модели CPU с ядром Prescott 2M, как и на их предшественников, данный трюк не производит практически никакого впечатления. Разгон мы выполняли путём повышения частоты FSB свыше штатных 200 МГц, частоты шины PCI Express и PCI фиксировались при этом на номинальных значениях 100 и 33 МГц.
Перед тем, как перейти непосредственно к результатам нашего разгона, напомним, что максимальная частота, которую нам удалось достичь при оверклокинге Pentium 4 570, основанного на ядре Prescott степпинга E0, составила 4.3 ГГц. Подобных успехов от Pentium 4 660, ядро которого имеет большее число транзисторов, мы не ожидали. Однако, практика показала, что зря.
Ниже мы приводим скриншот CPU-Z, являющийся отражением наших успехов:


То есть, Pentium 4 660 со штатной частотой 3.6 ГГц разогнался до 4.33 ГГц. Это – достаточно хороший результат, подтверждающий значительный оверклокерский потенциал ядра Prescott 2M. Таким образом, младшие процессоры линейки Pentium 4 6XX могут стать весьма интересными объектами для разгона.
Мы же в очередной раз должны констатировать, что решение Intel не выпускать по 90 нм технологии процессоры с частотами 4 ГГц и более, обусловлено не достижением технологического предела, а скорее маркетинговыми причинами. Как мы вновь убеждаемся, существующие ядра Prescott и Prescott 2M степпингов E0 и N0 могут легко работать на частотах свыше 4 ГГц.

Как мы тестировали

Целью данного тестирования являлось определение уровня производительности, обеспечиваемого новыми процессорами серии Intel Pentium 4 6XX и процессором Intel Pentium 4 Extreme Edition 3.73 ГГц, а также сопоставление этого уровня с быстродействием предшествующих и конкурирующих CPU. Для наших тестовых испытаний мы выбрали две старших модели "шестисотой" серии, Pentium 4 660 со штатной частотой 3.6 ГГц и Pentium 4 650 с частотой 3.4 ГГц.

В составе тестовых систем мы использовали следующее оборудование:

Процессоры:

AMD Athlon 64 FX-55 (Socket 939, 1024KB L2, 2.6GHz);
AMD Athlon 64 4000+ (Socket 939, 1024KB L2, 2.4GHz);
AMD Athlon 64 3800+ (Socket 939, 512KB L2, 2.4GHz);
AMD Athlon 64 3500+ (Socket 939, 512KB L2, 2.2GHz);
Intel Pentium 4 570 (LGA775, 1024KB L2, 3.8 GHz);
Intel Pentium 4 560 (LGA775, 1024KB L2, 3.6 GHz);
Intel Pentium 4 550 (LGA775, 1024KB L2, 3.4 GHz);
Intel Pentium 4 660 (LGA775, 2048KB L2, 3.6 GHz);
Intel Pentium 4 650 (LGA775, 2048KB L2, 3.4 GHz);
Intel Pentium 4 Extreme Edition 3.46GHz (LGA775, 2048KB L3, FSB 1066MHz);
Intel Pentium 4 Extreme Edition 3.73GHz (LGA775, 2048KB L2, FSB 1066MHz);


Материнские платы:

EPoX 9NPA Ultra (Socket 939, NVIDIA nForce4 Ultra);
Intel Desktop Board D925XECV2 (LGA775, i925XE Express).


Память:

1024MB DDR400 SDRAM (Corsair CMX512-3200XLPRO, 2 x 512MB, 2-2-2-10);
1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11).


Графическая карта: PowerColor RADEON X800 XT (PCI-E x16).
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).

Тестирование выполнялось в операционной системе MS Windows XP SP2 с установленным пакетом DirectX 9.0c. Тестовые системы настраивались на максимальную производительность. Заметим, что в Athlon 64 мы увеличивали тайминг Cycle Time (Tras) до 10, поскольку, как показывает практика, в таком режиме контроллер памяти Athlon 64 работает более эффективно, нежели при установке этой задержки в минимально возможное значение 5.
В рамках данного тестирования мы существенно расширили набор тестовых приложений. Произошло это благодаря тому, что мы решили задействовать набор стандартных скриптов PC WorldBench 5, широко используемый в индустрии для бенчмаркинга.

Производительность

FutureMark PCMark04, 3DMark2001 SE и 3DMark05

В первую очередь мы решили привести результаты, полученные нами в популярных синтетических тестах компании FutureMark.









Тест PCMark04 активно использует технологию Hyper-Threading, благодаря чему процессоры производства компании Intel показывают лучшие результаты. Что же касается соотношения сил между различными линейками процессоров Pentium 4, то процессоры "шестисотой" серии с увеличенной до 2 Мбайт кеш-памятью лишь незначительно превосходят CPU линейки Pentium 4 5XX. Зато процессор Pentium 4 Extreme Edition 3.73 ГГц, благодаря значительному росту тактовой частоты и более новому процессорному ядру, ощутимо обгоняет своего предшественника, Pentium 4 Extreme Edition 3.46 ГГц, в основе которого использовалось ядро Gallatin.
Достаточно интересные результаты получаются и в подтесте, измеряющем скорость работы подсистемы памяти. Увеличение L2 кеша в процессорах Pentium 4 6XX увеличило скорость их работы с данными, благодаря чему этим CPU в данном бенчмарке удаётся теперь выступать на равных с процессорами Athlon 64, сильной стороной которых является интегрированный контроллер памяти. То есть, увеличенная до 2 Мбайт кеш-память второго уровня нивелирует высокие задержки DDR2 SDRAM, используемой в составе современных Pentium 4 систем.


Старый тест 3DMark2001 SE никак не теряет своей популярности, однако на сегодня он уже гораздо сильнее показывает скорость центральных процессоров, нежели современных видеокарт. Раньше в этом тесте неизменно верхние места занимали CPU семейства Athlon 64, однако теперь ситуация несколько изменилась. Увеличение в новых процессорах Pentium 4 с ядром Prescott 2M кеш-памяти второго уровня позволило этим CPU несколько нарастить свои показатели в данном тесте. Благодаря этому Pentium 4 660 удалось обогнать Athlon 64 3500+, а Pentium 4 Extreme Edition 3.73 ГГц выступает на равных с Athlon 64 3800+. Конечно, назвать такие результаты успехом для Intel явно нельзя, однако этот факт является явным предвестником того, что в игровых приложениях увеличенный кеш процессоров с ядром Prescott 2M должен сказаться положительным образом.






Результаты, полученные в самом новом тестовом пакете от Futuremark, 3DMark05 также говорят нам о том, что увеличенная кеш-память новых процессоров Pentium 4 даёт определённый эффект при работе с игровой 3D графикой. Однако индекс производительности CPU из этого теста не позволяет Pentium 4 660 опередить Pentium 4 570, работающий на 200 МГц более высокой тактовой частоте. Впрочем, это не мешает при этом выставить на первое место по данному индексу процессор Pentium 4 Extreme Edition 3.73 ГГц, которому удаётся обогнать даже Athlon 64 FX-55.

Игровые приложения















С самого момента появления процессоров Athlon 64, CPU этого типа наголову побеждают своих конкурентов семейства Pentium 4 в игровых приложениях. Появление процессоров Pentium 4 6XX и Pentium 4 Extreme Edition 3.73 ГГц эту ситуацию не изменило. Несмотря на то, что увеличение кеш-памяти второго уровня привело к росту скорости Pentium 4 в играх примерно на 3-6%, Athlon 64 в 3D играх вновь оказываются значительно более быстрыми CPU. Положение не спасает и новый Pentium 4 Extreme Edition, уступающий в приложениях этого типа по скорости даже Athlon 64 3500+.

Офисные приложения


При работе в Microsoft Office скорость процессора оказывает небольшое влияние на производительность системы в целом.


Зато рендеринг веб-страниц в одном из самых популярных броузеров Mozilla (движок которого используется и в ещё более распространенном FireFox) на процессорах семейства Athlon 64 выполняется значительно быстрее, чем на конкурирующих CPU от Intel.


Впрочем, если во время работы с броузером в фоновом режиме выполняется какой-либо другой процесс, сильно загружающий ресурсы компьютера, результаты Pentium 4 оказываются несколько лучше, благодаря поддержке этими процессорами технологии Hyper-Threading.


Как видим, производительность ещё одного распространённого приложения, Nero, предназначенного для записи CD и DVD дисков также мало зависит от производительности центрального процессора.

Сжатие данных






Скорость работы приложений для сжатия данных напрямую зависит от тех алгоритмов, которые используются в этих приложениях. Как видим, WinZip несколько лучше оптимизирован для процессоров Intel, зато в WinRAR чудеса быстродействия показывают CPU семейства Athlon 64.
Кстати, по данным WinRAR, очень чутко реагирующего на любые изменения в архитектуре системы, увеличение кеш-памяти второго уровня даёт очень небольшой эффект: всего лишь порядка 3%.

Кодирование аудио и видео















В задачах кодирования видео традиционно выигрывают процессоры семейства Pentium 4. Приложения, используемые для сжатия видео контента, хорошо оптимизированы для NetBurst архитектуры и зачатую используют набор инструкций SSE3, который реально может увеличить производительность в программах этого рода. Поэтому, мы вновь вынуждены констатировать тот факт, что равных Pentium 4 при кодировании видео нет.
Что же касается кодирования аудио в формат mp3, то с этим процессом CPU от Intel и AMD справляются примерно с одинаковой скоростью.
Хочется отметить, что в задачах кодирования аудио и видео контента процессоры Pentium 4 6XX оказываются лишь немного быстрее, чем Pentium 4 5XX. Двукратное увеличение объёма кеш-памяти второго уровня в приложениях такого рода даёт прирост производительности менее 1%.

Редактирование изображений






Соотношение производительности между процессорами и в ACDSee, обладающем простейшими пакетными функциями для редактирования изображений, и в полновесном Adobe Photoshop примерно одинакова. Работа с изображениями на процессорах семейства Athlon 64 выполняется несколько быстрее, нежели на конкурирующих продуктах от Intel.
При этом мы вновь должны констатировать, что CPU семейства Pentium 4 6XX в приложениях этого типа опережают процессоры серии Pentium 4 5XX лишь на десятые доли процента. То есть, и в графических редакторах эффект от увеличения кеш-памяти в процессорах с ядром Prescott 2M проявляется весьма слабо.

Редактирование видео

Процессоры семейства Athlon 64 сильны именно благодаря своей вычислительной мощности. Поэтому их победа в специализированных пакетах для математических расчётов вполне закономерна.
Интересно же в этих тестах другое. Во-первых, Mathematica оказывается одним из немногих приложений, в котором размер кеш-памяти второго уровня имеет большое значение. Так преимущество процессоров с ядром Prescott 2M над процессорами с ядром Prescott, работающими на одинаковой тактовой частоте, оказывается порядка 7%, а это чуть ли не максимальное значение, наблюдаемое нами в данном тестировании. Во-вторых, Matematica очень лояльно отнеслась к процессору Pentium 4 Extreme Edition 3.46 ГГц, основанному на устаревшем 130 нм ядре Gallatin. Как видим, этот процессор, несмотря на свою относительно невысокую тактовую частоту, является в данном приложении лидером среди всех CPU от Intel.
Что же касается пакета MATLAB, то наблюдаемая в нём картина вполне привычна, поэтому полученные здесь результаты вряд ли нуждаются в дополнительных комментариях.
Производительность при финальном рендеринге в Lightwave очень сильно зависит от типа стоящегося изображения. В зависимости от этого в лидерах могут быть как процессоры Athlon 64, так и Pentium 4.
При этом заметим, что в любых задачах 3D рендеринга объём кеш-памяти второго уровня оказывает небольшое влияние на конечный результат. Этот относится как к процессорам Pentium 4 6XX, так и к Athlon 64 с мегабайтным L2 кешем.
Кроме того, обратите внимание на то, что в Lightwave процессоры Pentium 4 6XX проигрывают Pentium 4 5XX, работающим на аналогичной частоте. Скорее всего, этот факт объясняется именно большей медлительностью кеш-памяти второго уровня, реализованной в ядре Prescott 2M.

Выводы

В рамках данного обзора мы познакомились с семейством новых процессоров Intel, использующих в своей основе ядро Prescott 2M. Хотя на первый взгляд основным преимуществом этого ядра является увеличенный до 2 Мбайт L2 кеш, на деле процессоры на базе этого ядра содержат гораздо больше интересных нововведений, чем это кажется на первый взгляд. CPU линейки Pentium 4 6XX, являющиеся основными носителями ядра Prescott 2M на сегодняшний день, обладают не просто большей кеш-памятью, чем их предшественники, они снабжены рядом новых технологий, расширяющих их функциональность.
Тут в первую очередь следует отметить, что Pentium 4 6XX стали первыми массовыми CPU от Intel для настольных компьютеров, поддерживающими 64-битные расширения архитектуры x86. В свете скорого появления 64-битных пользовательских операционных систем, и в первую очередь Windows XP Professional x64 Edition, Intel поддержал инициативу AMD по внедрению архитектуры x86-64 и снабдил свои CPU соответствующими расширениями. Таким образом, теперь поддержка x86-64 прекращает быть прерогативой исключительно процессоров Athlon 64: конкурирующие продукты от Intel, процессоры Pentium 4 6XX теперь также имеют возможность работать с 64-битными приложениями и поддерживать более 4 Гбайт оперативной памяти.
Аналогичные 64-битные расширения архитектуры x86 получили и процессоры Pentium 4 Extreme Edition. Новая модель в этом семействе, Pentium 4 Extreme Edition 3.73 ГГц, которая основывается на новом ядре Prescott 2M, также поддерживает x86-64.
Нельзя обойти вниманием и тот факт, что новые процессоры Pentium 4 6XX получили в свое распоряжение набор технологий Demand Based Switching, благодаря которым снижается тепловыделение и энергопотребление этих процессоров в те моменты, когда от CPU не требуется работа "на пике своих возможностей". В процессорах семейства Pentium 4 6XX реализованы технологии C1E, TM2 и EIST и благодаря этому набору CPU данного типа большинство времени работают на частоте 2.8 ГГц при пониженном напряжении питания, разгоняясь до номинальной частоты лишь в те моменты, когда от системы необходима максимальная производительность.
Именно такой набор новых возможностей, реализованных в процессорах Pentium 4 6XX, позволил Intel установить на них достаточно высокие цены по сравнению с их предшественниками, Pentium 4 5XX с обычным ядром Prescott. Вот выдержка из нового официального прайс-листа (цены процессоров за 1 тыс. шт.):

Intel Pentium 4 Extreme Edition 3.73 GHz (3.73 GHz, 1066 MHz FSB, 2 MB L2) - $999;
Intel Pentium 4 660 (3.60 GHz, 800 MHz FSB, 2 MB L2) - $605;
Intel Pentium 4 650 (3.40 GHz, 800 MHz FSB, 2 MB L2) - $401;
Intel Pentium 4 640 (3.20 GHz, 800 MHz FSB, 2 MB L2) - $273;
Intel Pentium 4 630 (3.00 GHz, 800 MHz FSB, 2 MB L2) - $224.

Что же касается традиционного восприятия новых CPU, а именно их производительности, то нельзя сказать, что появление Pentium 4 "шестисотой серии" как-то повлияло на расстановку сил на процессорном рынке. Пока тактовая частота этих CPU уступает тактовой частоте старших процессоров Pentium 4 5XX, а увеличенный кеш второго уровня лишь незначительно позволяет поднять быстродействие. На графике ниже мы приводим относительную производительность Pentium 4 660 по сравнению с производительностью аналогичного по тактовой частоте процессора Pentium 4 560, основанного на обычном ядре Prescott с кеш-памятью второго уровня объёмом 1 Мбайт:


Как видим, в большинстве случаев эффект от увеличенной в два раза кеш-памяти второго уровня не превосходит 5%. Именно поэтому на сегодняшний день Pentium 4 570 с тактовой частотой 3.8 ГГц и кеш-памятью второго уровня 1 Мбайт следует считать более производительным CPU, нежели Pentium 4 660 с тактовой частотой 3.6 ГГц и 2-мегабайтной кеш-памятью. Сильные же стороны Pentium 4 6XX заключаются в первую очередь в поддержке EM64T и в наборе технологий C1E, TM2 и EIST.
Что же касается процессора Pentium 4 Extreme Edition 3.73 ГГц, то он приходит на смену Pentium 4 Extreme Edition 3.46 ГГц, основанному на ядре Gallatin. Смена ядра, перенос 2 Мбайт кеша с третьего уровня на второй и ощутимое увеличение тактовой частоты возымели своё дело и в целом, новый Extreme Edition стал побыстрее старого:


Однако данная картина наблюдается далеко не всегда и, более того, в игровых приложениях, на работу в которых в первую очередь и нацелены процессоры серии Extreme Edition, новый Pentium 4 Extreme Edition 3.73 ГГц не обгоняет своего предшественника. Все-таки 130 нм ядро Northwood и его производная Gallatin, использовавшаяся в Pentium 4 Extreme Edition 3.46 ГГц, в игровых приложениях работает более эффективно, нежели любой из Prescott.
Впрочем, вновь не следует забывать о том, что неоспоримым преимуществом Pentium 4 Extreme Edition 3.73 ГГц является поддержка 64-битных расширений EM64T.
Что же касается общей расстановки сил "AMD против Intel", то теперь мы можем констатировать, что по своим возможностям процессоры на ядре Prescott 2M уровнялись с процессорами Athlon 64. Так, взамен 64-битных расширений AMD64 у Athlon 64, в процессорах Pentium 4 6XX появились расширения EM64T. Аналогом технологии Cool"n"Quiet от AMD стала технология EIST от Intel, а кроме того процессоры Intel получили поддержку NX-бита (в терминах Intel XD-бита).
Производительность же старших моделей процессоров от Intel при этом пока всё ещё уступает скорости старших процессоров Athlon 64. Хотя, Pentium 4 продолжают лидировать в традиционных для себя областях, как то кодирование видео данных или финальный рендеринг, в большинстве приложений, а в первую очередь в играх, CPU от AMD показывают более высокое быстродействие.