Поколения процессоров AMD. Супер скалярный блок плавающей точки FPT

05.05.2019

С установленным на ней ядром процессора (во всех модификациях), а также микросхемами кеш-памяти BSRAM (во всех модификациях, кроме процессоров на ядре Thunderbird). Процессор предназначен для установки в 242-контактный щелевой разъём Slot A .

В процессорах, основанных на ядрах Argon, Pluto и Orion, кеш-память второго уровня работает на частоте от трети до половины частоты ядра , а в процессорах на ядре Thunderbird - на частоте ядра.

На процессорной плате также находится ножевой 40-контактный технологический разъём, закрытый картриджем. Разъём содержит контакты, отвечающие за установку напряжения питания и тактовой частоты. С помощью специального устройства, подключаемого к процессору, возможно изменение этих параметров.

Картридж состоит из двух частей: металлической теплоотводной пластины, контактирующей с кристаллом процессора и микросхемами кэш-памяти (в случае с процессорами, имеющими внешний кэш), а также пластикового кожуха, закрывающего процессорную плату и защищающего установленные на ней элементы от повреждений. Маркировка находится на верхней грани картриджа.

Процессоры Athlon в корпусе типа FCPGA предназначены для установки в системные платы с 462-контактным гнездовым разъёмом Socket A и представляют собой подложку из керамического материала с установленным на ней открытым кристаллом на лицевой стороне и контактами на обратной (453 контакта). Существовали также процессоры с органической подложкой, выпущенные ограниченной партией. На стороне ядра расположены SMD-элементы , а также контакты, задающие напряжение питания и тактовую частоту (обычно называемые мостиками). Контакты располагаются группами, которые имеют обозначения L1 - L7. Маркировка нанесена на кристалл процессора.

Изначально кристалл не был защищён от сколов, которые могли происходить в результате перекоса радиатора при его неправильной установке неквалифицированными пользователями, однако вскоре появилась защита от перекосов в виде четырёх круглых прокладок, расположенных в углах подложки. Несмотря на наличие прокладок, при неаккуратной установке радиатора неопытными пользователями кристалл всё же мог получать трещины и сколы (процессоры с такими повреждениями обычно назывались «ко́лотыми»). В ряде случаев процессор, получивший существенные повреждения кристалла (сколы до 2-3 мм с угла), продолжал работать без сбоев или с редкими сбоями, в то же время, процессор с незначительными сколами мог полностью выйти из строя. Простейший способ проверки процессора на наличие сколов кристалла заключался в проведении по граням кристалла ногтем. В случае наличия сколов палец явно ощущал шероховатость. При наличии лупы или микроскопа сколы определялись визуально. Однако соблюдение мер предосторожности при сборке или установка опытным сборщиком, вместо самостоятельной установки, исключали механические повреждения процессоров с открытым ядром, таких, как процессоры семейства AMD K7 или Intel Pentium III и Celeron с ядром Coppermine.

Модели

На выставке Comdex Fall, проходившей осенью 1997 года в Лас-Вегасе (США), компанией AMD было объявлено о разработке принципиально нового процессора под кодовым названием K7, который должен прийти на смену процессорам серии . В октябре 1998 года были выпущены первые инженерные образцы нового процессора.

Первые процессоры Athlon (ядро Argon) предназначались для настольных компьютеров и производились по 250-нм КМОП -технологии. На смену ядру Argon пришло 180-нм ядро Pluto. Модель, работавшая на частоте 1 ГГц , получила наименование Orion.

Следующим ядром, использованным в процессорах семейства Athlon, стало 180-нм ядро Thunderbird, получившее интегрированный кеш второго уровня . Дальнейшим развитием семейства десктопных процессоров Athlon стали процессоры Athlon XP , вышедшие в октябре 2001 года .

Процессоры Athlon на ядре Argon
Тактовая частота , МГц 500 550 600 650 700
Частота FSB, МГц 200
Анонсирован 23 июня 9 августа 1999 4 октября 1999
Цена, долл. 324 479 699 849 849
Процессоры Athlon на ядрах Pluto и Orion
Тактовая частота, МГц 550 600 650 700 750 800 850 900 950 1000
Частота FSB, МГц 200
Анонсирован 29 ноября 6 января 11 февраля 2000 6 марта 2000
Цена, долл. - - - - 799 - 849 899 999 1299
Процессоры Athlon на ядре Thunderbird
Тактовая частота, МГц 700 750 800 850 900 950 1000 1100 1200 1000 1133 1200 1333 1300 1400 1400
Частота FSB, МГц 200 266 200 266
Анонсирован 5 июня 28 августа 2000 17 октября 2000 30 октября 2000 22 марта 6 июня 2001
Цена, долл. - - - - - - 853 612 - - - 350 318 253

Argon (Model 1)

Первое ядро, использованное в процессорах Athlon, имеет принципиально новую архитектуру по сравнению с предыдущими процессорами компании AMD.

Ключевыми особенностями процессоров архитектуры К7 являются:

  • Новый блок целочисленных вычислений (ALU), содержащий три конвейера глубиной 10 стадий. Это позволяет процессору выполнять до трёх инструкций за такт.
  • Новый блок вещественночисленных вычислений (FPU), содержащий три конвейера глубиной 15 стадий. В предыдущих процессорах компании AMD блок FPU не был конвейерным и не мог начать выполнять новую команду, пока не закончится выполнение предыдущей, что приводило к сильному падению производительности.
  • Системная шина EV6 , лицензированная у компании DEC , обеспечивающая передачу данных по обоим фронтам тактового сигнала. Это позволило при физической частоте 100 МГц получить эффективную частоту 200 МГц, что соответствует пропускной способности 1,6 Гб/с. Кроме того, шина EV6 использует протокол точка-точка, что позволяет организовать более эффективную многопроцессорную систему.
  • Кеш-память первого уровня объёмом 128 Кбайт (64 Кбайт кеш инструкций и 64 Кбайт кеш данных).
  • Расширенный набор инструкций Extended 3DNow! .

Положение на рынке и сравнение с конкурентами

Athlon являлся флагманским процессором компании AMD для настольных компьютеров с момента выхода в июне 1999 года и до появления на рынке процессора Athlon XP в октябре 2001 года . Параллельно с Athlon существовали следующие x86 -процессоры:

  • Intel Pentium III (Katmai). Конкурировал с процессорами Athlon на ядрах Argon, Pluto и Orion. Во многих задачах уступал процессору Athlon, в некоторых - опережал за счёт наличия поддержки расширений SSE .
  • Intel Pentium III (Coppermine). Конкурировал с процессорами Athlon на ядрах Pluto, Orion и Thunderbird. В некоторых задачах уступал процессорам Athlon за счёт архитектурных преимуществ процессоров семейства К7, в некоторых - опережал их за счёт наличия поддержки расширений SSE и за счёт быстрой 256-битной шины кэш-памяти (против 64-битной у Athlon)
  • Intel Pentium 4 . Серьёзно уступал всем конкурентам на равных частотах, однако за счёт архитектуры NetBurst имел значительно более высокий частотный потенциал, что позволяло их опережать в оптимизированных под эту архитектуру приложениях. При некотором преимуществе в тактовой частоте процессоры Pentium 4, выпущенные одновременно с процессорами Athlon, на большинстве приложений уступали конкуренту, но в некоторых задачах были быстрее за счёт поддержки расширений SSE и SSE2 .
  • Intel Celeron (Coppermine-128). Предназначался для рынка недорогих настольных компьютеров. Уступал как процессорам Athlon, так и конкуренту - AMD Duron - в основном за счёт использования медленной системной шины (66 / 100 МГц против 200 / 266 МГц у AMD Athlon и Duron). Уменьшенный до 128 Кбайт кэш второго уровня также не позволял процессорам Celeron приблизиться к конкурентам.
  • AMD Duron . Предназначался для рынка недорогих настольных компьютеров. Уступал процессорам Athlon за счёт меньшего объёма кэша второго уровня, а впоследствии и за счёт менее быстрой системной шины, чем у процессоров Athlon.
  • VIA C3 . Предназначался для компьютеров с низким энергопотреблением, имел крайне низкую производительность и уступал всем конкурирующим процессорам.
  • Transmeta Crusoe . Предназначался для использования в портативных компьютерах. Имел очень низкое энергопотребление, по производительности отставал от равночастотного Athlon.

«Битва за гигагерц»

Технические характеристики

Argon Pluto Orion Thunderbird
Десктопный
Тактовая частота
Частота ядра, МГц 500-700 550-950 1000 650-1000 650-1400
Частота FSB , МГц 200 200-266
Характеристики ядра
Набор инструкций IA-32 , MMX , 3DNow! , Extended 3DNow!
Разрядность регистров 32 бит (целочисленные),
80 бит (вещественночисленные),
64 бит (MMX)
Глубина конвейера Целочисленный: 10 стадий, вещественночисленный: 15 стадий
Разрядность ША 43 бит [ ]
Разрядность ШД 64 бит + 8 бит ECC
Количество транзисторов , млн 22 37
Кеш
Кэш данных 64 Кбайт, 2-канальный наборно-ассоциативный, длина строки - 64 байта, двухпортовый
Кэш инструкций 64 Кбайт, 2-канальный наборно-ассоциативный, длина строки - 64 байта
Кеш
Объём, Кбайт 512 256
Частота 1/2 частоты ядра (модели до 700 МГц)
1/2,5 частоты ядра (модели 750-850 МГц)
1/3 частоты ядра (модели от 900 МГц)
частота ядра
Разрядность BSB 64 бит + 8 бит ECC
Организация Объединённый, наборно-ассоциативный; длина строки - 64 байта Объединённый, наборно-ассоциативный, эксклюзивный; длина строки - 64 байта
Ассоциативность 2-канальный 16-канальный
Интерфейс
Разъём Slot A Socket A
Корпус SECC керамический FCPGA , OPGA
Шина EV6 (DDR)
Технологические, электрические и тепловые характеристики
Технология производства 250 нм КМОП 180 нм КМОП (шестислойный, алюминиевые соединения) КМОП (шестислойный, алюминиевые или медные соединения )
Площадь кристалла, мм² 184 102 120
Напряжение ядра, В 1,6 1,6-1,8 1,8 1,7-1,75
Напряжение кэша L2, В 2,5-3,3 напряжение ядра
Напряжение цепей I/O , В 1,6
Максимальное тепловыделение, Вт 50 62 65 54 72

Наименование моделей

Маркировка процессоров Athlon состоит из трёх строк. Первая строка является наименованием модели, вторая содержит информацию о ревизии ядра процессора и дате его выпуска, третья - информацию о партии процессоров.

Ниже представлена расшифровка строки наименования модели процессоров Athlon с различными ядрами.

Argon (AMD-K7xxx MTR51B):

  • AMD-K7 - процессор AMD K7.
  • xxx - тактовая частота , МГц .
  • M - тип корпуса (картридж).
  • T - напряжение питания (1,6 ).
  • 5 - объём кэш-памяти второго уровня (512 Кбайт).
  • 1 - частота кэш-памяти второго уровня (1/2 частоты ядра).

Pluto, Orion (AMD-K7xxx My R5z B):

  • AMD-K7 - процессор AMD K7.
  • xxx - тактовая частота, МГц.
  • M - тип корпуса (картридж).
  • y - напряжение питания (T: 1,6 В; P: 1,7 В; N: 1,8 В).
  • R - максимальная температура корпуса (70 °C).
  • 5 - объём кэш-памяти второго уровня (512 Кбайт).
  • z - частота кэш-памяти второго уровня (1: 1/2 частоты ядра; 2: 1/2,5 частоты ядра; 3: 1/3 частоты ядра;).
  • B - частота системной шины (200 МГц).

Thunderbird для Slot A (AMD-Axxxx My R24B):

  • AMD-A - процессор AMD Athlon.
  • xxxx - тактовая частота, МГц.
  • M - тип корпуса (картридж).
  • y - напряжение питания (M: 1,75 В; N: 1,8 В; P: 1,7 В; T: 1,6 В).
  • R - максимальная температура корпуса (70 °C).
  • 2 - объём кэш-памяти второго уровня (256 Кбайт).
  • 4 - частота кэш-памяти второго уровня (равна частоте ядра).
  • B - частота системной шины (200 МГц).

Thunderbird для Socket A (Axxxxgyz 3v ):

  • A - процессор AMD Athlon.
  • xxxx - тактовая частота, МГц.
  • g - тип корпуса (A: керамический PGA, D: органический PGA).
  • y - напряжение питания (H: 1,55 В; U: 1,6 В; K: 1,65 В; P: 1,70 В; M: 1,75 В).
  • z - максимальная температура корпуса (T: 90 °C; S: 90 °C).
  • 3 - объём кэш-памяти второго уровня (256 Кбайт).
  • v - частота системной шины (B: 200 МГц; C: 266 МГц).

Ревизии ядер процессоров

Argon Pluto, Orion Thunderbird

Ревизия CPU Id Примечание
A4 0x642h модели AMD-A1000MMR24B A, AMD-A0950MMR24B A, AMD-A0900MMR24B A, AMD-A0850MPR24B A, AMD-A0800MPR24B A, AMD-A0750MPR24B A, AMD-A0700MPR24B A, AMD-A0650MPR24B A (

С появлением микроархитектуры Zen стратегия AMD на процессорном рынке стала базироваться на очень простом принципе: компания старается обеспечивать лучшие характеристики (в первую очередь по числу ядер и поддерживаемых потоков) по более выгодной цене. Семейства Ryzen 7, Ryzen 5 и Ryzen 3 при таком подходе оказались более дешёвыми альтернативами для Core i7, i5 и i3, и именно это во многом обеспечивает их популярность у покупателей. Но несмотря на то, что цена - это один из самых важных аргументов в продвижении процессоров AMD, совсем дешёвых Socket AM4-процессоров в ассортименте у этого производителя до недавних пор не существовало. Для тех покупателей, которые не располагали как минимум 100-долларовым бюджетом, выделенным на покупку CPU, AMD могла лишь предложить старые процессоры для Socket FM2+ семейств и либо ещё более старые процессоры AMD FX класса Piledriver. Но привлекательность таких предложений в современных условиях вызывает обоснованные сомнения, и это стало заметной проблемой.

Данная проблема дополнительно усугубилась тем, что компания Intel с внедрением дизайна Kaby Lake начала выпускать очень привлекательные процессоры начального уровня - двухъядерные . Такие недорогие четырёхпоточные CPU быстро завоевали признание и стали очень популярным вариантом для бюджетных конфигураций.

Тем не менее оставлять Pentium c Hyper-Threading совсем без конкуренции в начальном рыночном сегменте AMD всё же не стала. Спустя примерно полгода после их появления в продаже «красный чипмейкер» принял решение создать свою альтернативу «гиперпням» и пустить для этого в дело имевшиеся в его распоряжении четырёхъядерные чипы Bristol Ridge. Такие процессоры поставлялись AMD по OEM-каналам примерно с середины прошлого года, но летом было объявлено, что теперь для исправления ситуации в нижнем ценовом сегменте Bristol Ridge станут доступны и для розничных покупателей.

Вообще, семейство Bristol Ridge в первую очередь включает в себя гибридные процессоры A-серии с интегрированным графическим ядром Radeon (поколения Volcanic Islands). Однако для конкуренции с Pentium были спроектированы специальные модели с отключённой графикой - такие процессоры AMD отнесла к отдельному модельному ряду Athlon X4. В результате покупатели бюджетных систем с дискретными видеокартами получили выбор между двухъядерными Kaby Lake с Hyper-Threading и четырёхъядерными процессорами Bristol Ridge, которые базируются на микроархитектуре Excavator. Какой вариант лучше - мы и решили выяснить в нашем очередном материале.

Для проведения тестирования нам пришлось взять модель Athlon X4 950. Несмотря на то, что в серии Bristol Ridge компания AMD запланировала три модификации процессоров без интегрированной графики, в продаже реально доступна только эта, средняя модель. Тем не менее благодаря наличию даже одного такого процессора экосистема Socket AM4 приобрела необходимую полноту. Сегодня для этой платформы можно приобрести процессор с ценой от $51 до $499, и доступный Athlon X4 950 может стать отличным вариантом начального уровня, который со временем можно будет заметить одним из существующих Ryzen серии Summit Ridge или даже перспективным Ryzen серии Pinnacle Ridge.

⇡ Athlon X4 для Socket AM4: что нового

В теории всё выглядит достаточно неплохо. Новая версия Athlon X4 представляет собой производную от наиболее современных APU компании AMD, относящихся к поколению Bristol Ridge. Такие APU пришли на рынок мобильных решений ещё в 2016 году, а в этом году семейство расширилось за счёт чипов для настольных систем. Конструктивно Bristol Ridge можно охарактеризовать как перенос в современную экосистему. В процессе этого переноса в APU сохранились вычислительные ядра Excavator и графическое ядро класса Volcanic Islands (дискретный аналог архитектуры R9 Fury с меньшим количеством потоковых процессоров), но добавился более новый контроллер памяти, поддерживающий DDR4 SDRAM. Кроме того, архитектурно Bristol Ridge больше напоминают системы-на-чипе (SoC), что позволило вписать их в экосистему Socket AM4.

Интересующие нас представители серии Athlon X4, как и раньше, интегрированной графики лишены. Графический процессор, естественно, присутствует на полупроводниковом кристалле, но он аппаратно заблокирован, что позволяет AMD задействовать при производстве Athlon X4 кремниевую отбраковку, которая не смогла попасть в полноценные гибридные процессоры A-серии. В результате Athlon X4 представляют собой недорогие четырёхъядерники для платформы Socket AM4, которые кардинально отличаются от схожих по количеству ядер чипов Ryzen 3 своей базовой микроархитектурой. Процессорные ядра в Bristol Ridge были спроектированы в эпоху, предшествовавшую появлению архитектуры Zen, а значит, Athlon X4 для Socket AM4, как и их Socket FM2+-собратья, относятся к прямым потомкам Bulldozer.

Если конкретнее, то лежащие в основе актуального поколения APU вычислительные ядра Excavator представляют собой эволюционное развитие ядер Steamroller, которые, в свою очередь, появились в результате оптимизации Piledriver. Как говорит сама AMD, по показателю IPC (по числу выполняемых за такт инструкций) Excavator превосходит предшествующее ядро Steamroller примерно на 5-15 процентов. Прогресс достигается за счёт увеличения объёма кеш-памяти данных первого уровня до 32 Кбайт на ядро , а также благодаря полуторакратному расширению буфера адресов ветвлений, что улучшает результативность работы алгоритмов предсказания переходов. Кроме того, в Excavator добавлена поддержка 256-битных векторных инструкций из набора AVX2.

Однако не стоит переоценивать все такие дополнения, ведь они сделаны на откровенно устаревшем фундаменте. Ждать каких-то чудес производительности от Excavator явно не следует, и хорошей иллюстрацией слабости данной микроархитектуры может послужить тот факт, что во время представления первых процессоров серии Ryzen представители AMD говорили о 52-процентном превосходстве Zen над Excavator по показателю IPC. То есть при прочих равных четырёхъядерные Ryzen 3 способны обеспечить как минимум в полтора раза более высокую производительность, чем современные Athlon X4. А это значит, что между Athlon X4 для Socket AM4-систем и «полноценными» процессорами Ryzen существует колоссальный разрыв хотя бы с точки зрения эффективности базовой микроархитектуры. И этим дело не ограничивается. В бюджетных CPU компания AMD заложила ещё несколько дополнительных «ухудшений».

Одна из основных потерь, которую понёс современный Athlon X4, касается системы кеширования. В отличие от представителей серий FX или Ryzen, в процессорах этого семейства вообще нет кеш-памяти третьего уровня. Кроме того, в ядрах Excavator сократился и объём L2-кеша. Раньше в CPU такого класса на каждый двухъядерный модуль Bulldozer приходился кеш второго уровня объёмом по 2 Мбайт. Теперь он стал вдвое меньше, и четырёхъядерные Athlon X4 для Socket AM4 располагают лишь небольшим L2-кешем ёмкостью 2 Мбайт суммарно.

Серьёзные претензии вызывает и встроенный в Bristol Ridge двухканальный контроллер памяти. AMD реализовала в этих процессорах поддержку DDR4, но она совсем не такая, как в Ryzen. Bristol Ridge проектировался заметно раньше, и контроллер памяти в нём оказался намного хуже. В частности, максимальная частота поддерживаемой памяти ограничена режимом DDR4-2400, причём более высокие скорости недоступны и через разгон - для них банально не предусмотрены делители. Не впечатляет и эффективность этого контроллера. Bristol Ridge ощутимо проигрывает Ryzen в латентности подсистемы памяти и катастрофически уступает в реальной пропускной способности. Таким образом, переход на использование DDR4 производительность представителей семейства Athlon X4 только ухудшил.

Athlon X4 950 Ryzen 3 1200

Что касается встроенных в процессор элементов SoC, то и они у новых Athlon X4 тоже сильно отличаются от того, что предлагает AMD в процессорах семейства Ryzen. Самая серьёзная потеря затронула шину для взаимодействия с дискретными графическими ускорителями: для этой цели Athlon X4 предлагает лишь восемь линий PCI Express 3.0. То есть видеокарты в Socket AM4-платформах, построенных на базе таких бюджетных процессоров, будут работать «не в полную силу».

В дополнение к урезанной графической шине процессорная SoC в Bristol Ridge поддерживает две дополнительные линии PCI Express 3.0, которые могут быть конвертированы в два порта SATA, а также четыре порта USB 3.0. Расширить этот набор можно за счёт подключения внешнего южного моста, для соединения с которым в процессоре зарезервировано ещё четыре линии PCI Express 3.0. Поскольку способ взаимодействия с набором системной логики у Athlon X4 точно такой же, как и у Ryzen, процессоры поколения Bristol Ridge полностью совместимы с любыми Socket AM4-материнскими платами, включая модели, построенные на чипсетах A320, B350 и даже X370.

Скудные характеристики Athlon X4 объясняются его происхождением. Изначально дизайн Bristol Ridge был нацелен на применение в мобильных системах, поэтому многое из того, в чём нет острой необходимости в ноутбуках, пошло под нож ради оптимизации энергопотребления. И в этом есть некоторая положительная сторона: энергосберегающие технологии в Bristol Ridge сделали большой шаг вперёд, позволяя соблюдать тонкий баланс между производительностью и энергопотреблением.

Но самое важное заключается в том, что, несмотря на использование при производстве Bristol Ridge полупроводниковой технологии с разрешением 28 нм, данный процессорный дизайн получился вполне энергоэффективным. В частности, все представители десктопного семейства Bristol Ridge вписываются в 65-ваттный тепловой пакет, в том числе даже модели с графическим ядром и рабочими частотами порядка 4 ГГц. Достигается это во многом благодаря тому, что производственный партнёр AMD, компания TSMC, внедрил специальную «высокоплотную» разновидность 28-нм техпроцесса, похожую на технологию, которая применяется при выпуске GPU. В результате современные Athlon X4 смогли получить не только сравнительно невысокое тепловыделение и энергопотребление, но и конфигурируемый TDP. Номинальный тепловой пакет этих процессоров, как и у полноценных APU, установлен на уровне 65 Вт, но в случае необходимости его рамки могут быть ужесточены до 35 Вт.

⇡ Athlon X4 950 в подробностях

Когда AMD объявляла о начале розничных продаж десктопных процессоров семейства Bristol Ridge, она говорила о модельном ряде, состоящем из восьми APU A-серии и трёх процессоров Athlon X4 без встроенной графики. Новые модификации Athlon X4 должны были получить модельные номера 940, 950 и 970 и, согласно спецификации, различались бы тактовыми частотами, установленными на уровне 3,2, 3,5 и 3,8 ГГц соответственно. Однако впоследствии AMD решила отказаться от розничной реализации бюджетных Socket AM4-процессоров «широким фронтом» и ограничилась поставками лишь единичной четырёхъядерной модели Athlon X4 950.

Стоит напомнить, что в экосистеме Socket FM2+ модельный ряд процессоров Athlon X4 был весьма представителен. Он формировался из многочисленных четырёхъядерных чипов Kaveri с частотами от 3,0 до 4,0 ГГц и впоследствии получил дополнение в виде Carrizo с частотой 3,5 ГГц. При переносе Athlon X4 в более актуальную платформу Socket AM4 от былого изобилия не осталось и следа. Причём единственный Athlon X4 для Socket AM4 - это ещё и сильно «зарезанный» по характеристикам процессор. Если пытаться провести параллели между Athlon X4 950 и предшественниками для Socket FM2+, то наиболее близкой по характеристикам моделью окажется Athlon X4 845, в то время как популярные Athlon X4 860K (и более быстрые модели) родом из 2015 года новинку заметно превосходят.

Зато это позволило компании AMD установить на Athlon X4 950 очень привлекательную цену. Его официальная стоимость составляет $51, что делает данный процессор самым доступным четырёхъядерником, который вдвое дешевле младшего представителя в серии Ryzen 3. Благодаря такому предложению AMD надеется привлечь на свою сторону покупателей бюджетных систем, которые до настоящего момента ориентировались на Intel Pentium поколения Kaby Lake с поддержкой Hyper-Threading.

При этом характеристики Athlon X4 950 на фоне прочих дешёвых процессоров с возможностью исполнения четырёх потоков выглядят достаточно многообещающе:

AMD Athlon X4 950 AMD Ryzen 3 1200 Intel Pentium G4560
Кодовое имя Bristol Ridge Summit Ridge Kaby Lake
Технология производства, нм 28 14 14+
Ядра/потоки 4/4 4/4 2/4
Базовая частота, ГГц 3,5 3,1 3,5
Частота в турборежиме, ГГц 3,8 3,4 -
Технология XFR Нет +50 МГц Нет
Разгон Поддерживается Поддерживается Не поддерживается
L2-кеш 2 × 1 Мбайт 4 × 512 Кбайт 2 × 256 Кбайт
L3-кеш Нет 2 × 4 Мбайт 3 Мбайт
Поддержка памяти DDR4-2400 DDR4-2666 DDR4-2400
Линии PCI Express 3.0 для GPU 8 16 16
TDP, Вт 65 65 54
Разъём Socket AM4 Socket AM4 LGA1151 v1
Официальная цена $51 $109 $64

Основная проблема Athlon X4 950 - устаревшая микроархитектура с низкой удельной производительностью, в остальном же никаких очевидных изъянов в приведённом списке спецификаций не видно.

В диагностической программе CPU-Z характеристики Athlon X4 950 выглядят следующим образом.

Реальные рабочие частоты Athlon X4 950 оказываются немного выше номинала. В Bristol Ridge работа технологии Turbo Core привязана исключительно к показаниям встроенных в ядро датчиков температуры и потребляемой мощности и никак не зависит от того, какое количество ядер процессора реально работает, а какое находится в состоянии простоя. Поэтому, несмотря на то, что номинальная частота Athlon X4 950 - 3,5 ГГц, в большинстве случаев он работает на 3,7-3,8 ГГц. Причём активация турборежима нередко происходит даже при исполнении ресурсоёмких многопоточных программ.

В таком состоянии расчётное тепловыделение Athlon X4 950 остаётся в 65-ваттных рамках. Однако имеется возможность снизить TDP через настройки UEFI BIOS материнской платы. Минимальный уровень потребления составляет 35 Вт, что в теории может быть востребовано в случае использования такого CPU в компактных системах. В таком экономичном режиме реальная частота Athlon X4 950 оказывается ниже номинала и в ресурсоёмких приложениях плавает в интервале от 3,0 до 3,4 ГГц.

⇡ Разгон

Хотя в названии Athlon X4 950 нет литеры K, коэффициент умножения у этого процессора не зафиксирован, что открывает путь к сравнительно простому разгону. Впрочем, не стоит забывать, что процессорный дизайн Bristol Ridge пришёл в десктопы из мобильной среды, а это значит, что основанные на нём чипы оптимизированы скорее под низкое энергопотребление, чем под высокие частоты.

Поэтому вполне закономерно, что на практике разгонный потенциал Athlon X4 950 оказался достаточно скудным, и с повышением напряжения питания до 1,5 В нам удалось добиться устойчивой работы нашего экземпляра всего лишь на частоте 4,2 ГГц.

Хотя 28-нм Athlon X4 с ядрами Excavator по оверклокерскому потенциалу немного превосходит 14-нм Ryzen, которые обычно удаётся разогнать до частот порядка 4,0 ГГц, хорошим результатом такой разгон всё равно назвать невозможно. Более ранние потомки Bulldozer были способны работать на значительно более высоких частотах. Например, предшествующие Athlon X4 950 процессоры той же серии с модельными номерами из девятой сотни, предназначенные для платформы Socket FM2+ и базирующиеся на дизайне Kaveri, без особого труда брали частоты в диапазоне от 4,5 до 4,8 ГГц.

При этом максимально доступные для представителей поколения Bristol Ridge частоты ограничиваются отнюдь не тепловыделением. Температура Athlon X4 950 в разгоне остаётся сравнительно невысокой. Повышение же частоты стопорится из-за каких-то глубинных ограничений в полупроводниковой структуре, которые препятствуют безошибочной работе CPU на скоростях сильно выше номинальной.

Athlon 64 x2 модели 5200+ позиционировался производителем как двухъядерное решение среднего уровня на базе АМ2. Именно на его примере и будет изложен порядок разгона данного семейства устройств. Запас прочности у него достаточно неплохой, и при наличии соответствующих комплектующих можно было получить вместо него чипы с индексами 6000+ или 6400+.

Смысл разгона ЦПУ

Процессор AMD Athlon 64 x2 модели 5200+ можно легко превратить в 6400+. Для этого достаточно только повысить его тактовую частоту (в этом и заключается смысл разгона). Как результат - конечная производительность системы вырастет. Но при этом увеличится и энергопотребление компьютера. Поэтому не все так просто. Большинство компонентов компьютерной системы должно иметь запас по надежности. Соответственно, материнская плата, модули памяти, блок питания и корпус должны быть более высокого качества, это значит, что и стоимость у них будет выше. Также система охлаждений ЦПУ и термопаста должны быть специально подобраны именно для процедуры разгона. А вот со штатной системой охлаждения не рекомендуется экспериментировать. Она рассчитана на стандартный тепловой пакет процессора и с увеличенной нагрузкой не справится.

Позиционирование

Характеристики процессора AMD Athlon 64 x2 явно указывают на то, что он относился к среднему сегменту двухъядерных чипов. Были и менее производительные решения - 3800+ и 4000+. Это начальный уровень. Ну а выше в иерархии находились ЦПУ с индексами 6000+ и 6400+. Первые две модели процессоров теоретически можно было разогнать и получить из них 5200+. Ну а сам 5200+ можно было модифицировать до 3200 МГц, и за счет этого получить вариацию уже 6000+ или даже 6400+. Причем технические параметры у них были практически идентичными. Единственное что могло изменяться, так это количество кэша второго уровня и технологический процесс. Как результат уровень их производительности после разгона практически не отличался. Вот и получалось, что при меньшей стоимости конечный владелец получал более производительную систему.

Технические характеристики чипа

Характеристики процессора AMD Athlon 64 x2 могут существенно отличаться. Ведь было выпущено три его модификации. Первая из них носила кодовое название Windsor F2. Работала она на тактовой частоте в 2,6 ГГц, имела 128 кбайт кэша первого уровня и, соответственно, 2 Мб второго уровня. Изготавливался этот полупроводниковый кристалл по нормам 90 нм технологического процесса, а тепловой его пакет был равен 89 Вт. При этом максимальная температура его могла достигать 70 градусов. Ну и напряжение, подаваемое на ЦПУ, могло быть равно 1,3 В или 1,35 В.

Чуть позже появился в продаже чип с кодовым названием Windsor F3. В этой модификации процессора изменилось напряжение (в этом случае оно понизилось до 1,2 В и 1,25 В соответственно), увеличилась максимальная рабочая температура до 72 градусов и уменьшился тепловой пакет до 65 Вт. В довершение к этому изменился и сам технологический процесс - с 90 нм до 65 нм.

Последний, третий вариант процессора носил кодовое название Brisbane G2. В этом случае частота была поднята на 100 МГц и составляла уже 2,7 ГГц. Напряжение могло быть равным 1,325 В, 1,35 В или 1,375 В. Максимальная рабочая температура снижалась до 68 градусов, а тепловой пакет, как и в предыдущем случае, был равен 65 Вт. Ну и сам чип изготавливался по более прогрессивному 65 нм технологическому процессу.

Сокет

Процессор AMD Athlon 64 x2 модели 5200+ устанавливался в сокет АМ2. Второе его название - сокет 940. Электрически и в отношении программного обеспечения он совместим с решениями на базе АМ2+. Соответственно, приобрести для него материнскую плату пока еще возможно. Но вот сам ЦПУ уже купить достаточно сложно. Это неудивительно: процессор появился в продаже в 2007 году. С тех пор успело уже поменяться три поколения устройств.

Подбор материнской платы

Достаточно большой набор материнских плат на базе сокета АМ2 и АМ2+ поддерживал процессор AMD Athlon 64 x2 5200. Характеристики у них были самые разнообразные. Но вот чтобы по максимуму стал возможен разгон этого полупроводникового чипа, рекомендуется обращать внимание на решения на базе чипсета 790FX или 790Х. Стоили подобные материнские платы дороже среднего. Это логично, так как возможности для разгона у них были значительно лучше. Также плата должна быть изготовлена в форм-факторе АТХ. Можно, конечно, попытаться разогнать данный чип и на решениях мини-АТХ, но плотная компоновка радиодеталей на них может привести к нежелательным последствиям: перегреву материнской платы и центрального процессора и выходу их из строя. В качестве конкретных примеров можно привести PC-AM2RD790FX от Sapphire или 790XT-G45 от MSI. Также достойной альтернативой приведенным ранее решениям может стать M2N32-SLI Deluxe от Asus на базе чипсета nForce590SLI, разработанного NVIDIA.

Система охлаждения

Разгон процессора AMD Athlon 64 x2 невозможен без качественной системы охлаждения. Тот кулер, который идет в коробочной версии данного чипа, не подходит для этих целей. Он рассчитан на фиксированную тепловую нагрузку. При увеличении производительности ЦПУ его тепловой пакет возрастает, и штатная система охлаждения уже не будет справляться. Поэтому нужно покупать более продвинутую, с улучшенными техническими характеристиками. Можно порекомендовать для этих целей использовать кулер CNPS9700LED от Zalman. При наличии его данный процессор можно смело разгонять до 3100-3200 МГц. При этом особых проблем с перегревом ЦПУ точно не будет.

Термопаста

Еще один важный компонент, который нужно учитывать перед тем, AMD Athlon 64 x2 5200 +, это термопаста. Ведь чип будет функционировать не в режиме штатной нагрузки, а в состоянии увеличенной производительности. Соответственно, к качеству термопасты выдвигаются более жесткие требования. Она должна обеспечивать улучшенный теплоотвод. Для этих целей рекомендуется заменить штатную термопасту на КПТ-8, которая отлично подойдет для условий разгона.

Корпус

Процессор AMD Athlon 64 x2 5200 будет работать с увеличенной температурой в процессе разгона. В некоторых случаях она может подниматься до 55-60 градусов. Чтобы компенсировать эту увеличенную температуру, одной качественной замены термопасты и системы охлаждения будет недостаточно. Также нужен корпус, в котором воздушные потоки могли бы хорошо циркулировать, а за счет этого обеспечивалось бы дополнительное охлаждение. То есть внутри системного блока должно быть как можно больше свободного пространства, и это бы позволило за счет конвекции обеспечить охлаждение компонентов компьютера. Еще лучше будет, если в нем будут установлены дополнительные вентиляторы.

Процесс разгона

Теперь разберемся с тем, как разогнать процессор AMD ATHLON 64 x2. Выясним это на примере модели 5200+. Алгоритм разгона ЦПУ в это случае будет таким.

  1. При включении ПК нажимаем клавишу Delete. После этого откроется синий экран БИОСа.
  2. Затем находим раздел, связанный с работой оперативной памяти, и снижаем частоту ее работы до минимума. Например, задано значение для ДДР1 333 MHz, а мы опускаем частоту до 200 MHz.
  3. Далее сохраняем внесенные изменения и загружаем операционную систему. Потом с помощью игрушки или тестовой программы (например, CPU-Z и Prime95) проверяем работоспособность ПК.
  4. Опять перезагружаем ПК и заходим в БИОС. Здесь теперь находим пункт, связанный с работой шины PCI, и фиксируем ее частоту. В этом же месте необходимо зафиксировать данный показатель для графической шины. В первом случае значение должно быть установлено в 33 MHz.
  5. Сохраняем параметры и перезагружаем ПК. Заново проверяем его работоспособность.
  6. На следующем этапе выполняется перезагрузка системы. Заново входим в БИОС. Здесь находим параметр, связанный с шиной HyperTransport, и устанавливаем частоту работы системной шины в 400 МГц. Сохраняем значения и перезагружаем ПК. После окончания загрузки ОС тестируем стабильность работы системы.
  7. Потом перезагружаем ПК и входим заново в БИОС. Здесь необходимо теперь перейти в раздел параметров процессора и увеличить частоту системной шины на 10 МГц. Сохраняем изменения и перезагружаем компьютер. Проверяем стабильность системы. Затем, постепенно повышая частоту процессора, доходим до того момента, когда он перестает стабильно работать. Далее возвращаемся к предыдущему значению и опять тестируем систему.
  8. Затем можно попытаться дополнительно разогнать чип с помощью его множителя, который должен быть в этом же разделе. При этом после каждого внесения изменений в БИОС сохраняем параметры и проверяем работоспособность системы.

Если в процессе разгона ПК начинает зависать и вернуться к предыдущим значениям невозможно, то необходимо сбросить настройки БИОСа на заводские. Для этого достаточно найти в нижней части материнской платы, рядом с батарейкой, джампер с надписью Clear CMOS и переставить его на 3 секунды с 1 и 2 контакта на 2 и 3 контакты.

Проверка стабильности системы

Не только максимальная температура процессора AMD Athlon 64 x2 может привести к нестабильной работе компьютерной системы. Причина может быть вызвана рядом дополнительных факторов. Поэтому в процессе разгона рекомендуется проводить комплексную проверку надежности работы ПК. Лучше всего для решения этой задачи подходит программа Everest. Именно с ее помощью и можно проверить надежность и стабильность работы компьютера в процессе разгона. Для этого лишь достаточно после каждых внесенных изменений и после окончания загрузки ОС запускать эту утилиту и проверять состояние аппаратных и программных ресурсов системы. Если какое-то значение выходит за допустимые границы, то нужно перезагружать компьютер и возвращаться к предыдущим параметрам, а затем заново все тестировать.

Контроль системы охлаждения

Температура процессора AMD Athlon 64 x2 зависит от работы системы охлаждения. Поэтому по окончании процедуры разгона необходимо проверить стабильность и надежность работы кулера. Для этих целей лучше всего использовать программу SpeedFAN. Она и бесплатная, и уровень ее функциональности достаточный. Скачать ее из Интернета и установить на ПК не составит особого труда. Далее ее запускаем и периодически, в течение 15-25 минут, контролируем количество оборотов кулера процессора. Если это число стабильно и не уменьшается, то все в порядке с системой охлаждения ЦПУ.

Температура чипа

Рабочая температура процессора AMD Athlon 64 x2 в штатном режиме должна изменяться в диапазоне от 35 до 50 градусов. В процессе разгона этот диапазон будет уменьшаться в сторону последнего значения. На определенном этапе температура ЦПУ может даже превысить 50 градусов, и в этом ничего страшного нет. Максимально допустимое значение - 60 ˚С, приблизившись к которому, рекомендуется прекратить какие-либо эксперименты с разгоном. Более высокое значение температуры может негативно сказаться на полупроводниковом кристалле процессора и вывести его из строя. Для проведения замеров в процессе операции рекомендуется использовать утилиту CPU-Z. Причем регистрацию температуры необходимо осуществлять после каждого внесенного изменения в БИОС. Также нужно выдержать интервал в 15-25 минут, в течении которого периодически проверять, как сильно нагрелся чип.

Длительное время Advanced Micro Devices, подобно Cyrix, производила центральные процессоры 286, 386 и 486, которые были основаны на разработках Intel. К5 был первым независимо созданным х86 процессором, на который AMD возлагала большие надежды.

Однако, покупка компанией AMD основанного в Калифорнии конкурента весной 1996 года, кажется, создала возможность лучше подготовиться к своей следующей атаке на Intel. К6 начал жизнь как Nx686, будучи переименованным после приобретения NextGen. Серия ММХ-совместимых процессоров К6 была запущена в середине 1997 года, за несколько недель до Cyrix 6х86МХ, и сразу была одобрена пользователями.

Изготовленный по 5-слойной 0.35-мкм технологии, К6 был почти на 20 % меньше, чем Pentium Pro и при этом содержал на 3.3 миллионов транзисторов больше (8.8 против 5.5 миллионов). Большинство этих дополнительных транзисторов находилось в кэше первого уровня на 64 Кбайт (на кэш команд 32 Кбайт и на кэш данных 32 Кбайт). Это равносильно четырем Pentium Pro или двум Pentium ММХ и Pentium 2.

Центральный процессор К6 поддерживал технологию ММХ Intel, включая 57 новых х86 команд, разработанных для развития мультимедийного программного обеспечения. Как и Pentium Pro, К6 был многим обязан классическим технологиям RISC. Используя суперскалярную микроархитектуру AMD RISC86, чип декодировал каждую х86-инструкцию в ряд более простых действий, которые могли быть обработаны, используя типичные принципы RISC - такие, как выполнение вне естественного порядка, переименование регистров, предсказание переходов, спекулятивное исполнение, опережающая выборка данных.

Центральный процессор К6 начинал с версий 166.200 и 233 МГц. Уровень его производительности был очень схож с Pentium Pro соответствующих частот с его максимальным 512 Кбайт кэшем второго уровня. Общее с чипом Cyrix MX (но в несколько меньшей степени) - работа с плавающей запятой - была областью относительной слабости по сравнению с Pentium Pro или Pentium 2. Однако проникновению процессора на рынок в конце 1997 - начале 1998 года препятствовали проблемы, которые возникли у AMD при перемещении ее нового производственного 0.25-мкм процесса из лабораторий на заводы-изготовители. Это привело к падению производства центральных процессоров на 200 и 233 МГц, задержке введения чипа 266 МГц и отмене чипа 300 МГц.

Процессор AMD К6-2

Процессоры AMD К6-2 с 9.3 миллионами транзисторов производились по 0.25-микронной технологии AMD. Процессор был упакован в 100 МГц Sирег7-совместимую, 321-контактную керамическую плату (ceramic pin grid array (CPGA) package).

K6-2 включает инновационную эффективную микроархитектуру RISC86, большой (64 Кбайт) кэш первого уровня (двухпортовый кэш данных на 32 Кбайт, кэш команд на 32 Кбайт с дополнительным предрасшифровывающим кэшем на 20 Кбайт), а также улучшенный модуль работы с плавающей запятой. Эффективная производительность при его запуске в середине 1998 года была оценена в 300 МГц, к началу 1999 года самым быстрым из доступных процессоров была версия 450 МГц.

Трехмерные возможности К6-2 представляли другое важное достижение. Они были воплощены в AMD технологии 3DNow!, как новый набор из 21 команды, который дополнял стандартные команды ММХ, уже включенные в архитектуру К6, что ускоряло обработку трехмерных приложений.

Процессор AMD K6-3

В феврале 1999 года AMD объявила о начале выпуска партии 400 МГц AMD К6-lll процессора под кодовым названием «Sharptooth» и опробовала 450 МГц версию. Ключевой особенностью этого нового процессора была инновационная разработка - «Трехуровневый кэш».

Традиционно процессоры персональных компьютеров использовали два уровня кэша:

  • кэш первого уровня (L1), который обычно расположен на кристалле;
  • кэш второго уровня (L2), который мог располагаться либо вне центрального процессора, на материнской плате или слоте, либо непосредственно на чипе центрального процессора.

Общее эмпирическое правило при проектировании подсистемы кэша - чем больше и быстрее кэш, тем выше производительность (ядро центрального процессора может быстрее получить доступ к инструкциям и данным).

Признавая выгоды большого и быстрого кэша в удовлетворении потребностей приложений, все более требовательных к производительности персональные компьютеры, «Трехуровневый кэш» компании AMD вводил архитектурные новшества кэша, разработанные для увеличения производительности персонального компьютера на основе платформы Super7:

  • внутренний L2-кэш (256 Кбайт), работающий на полной скорости процессора AMD-K6-3 и дополняющий кэш L1 (64 Кбайт), который был стандартен для всего семейства процессоров AMD-K6;
  • многопортовый внутренний кэш, позволяющий одновременное 64-битовое чтение и запись как кэшу L1, так и L2;
  • первичную процессорную шину (100 МГц), обеспечивающую соединение с резидентной кэш памятью на системной плате, расширяемой от 512 до 2048 Кбайт.

Таблица основных характеристик процессоров AMD

Тип процессора Архитектура Год выпуска Кодовое наименование Количество транзисторов, млн Ядро, мм L1 -кэш, Кбайт L2-кэш, Кбайт
AMD K5 K5 1996 SSA/5 4.3 271-161 8+16 Внешн.
1996 Godot 4.3 181 8+16 Внешн.
AMD К6 К6 1997 Nx686 (Model 6) 8.8 162 32+32 Внешн.
1998 Little Foot 8.8 88 32+32 Внешн.
K6-2 1998-2001 Chompers 9.3 81 64 Внешн.
К6 3 1999 Sharptooth 21.3 118 64 256
Athlon К7 1999 Argon 22.0 184 128 512
2000 Pluto 22.0 102 128 512
2000-2001 Thunderbird 37.0 120 64+64 256
Duron 2000-2001 Spitfire 25.0 100 64(|) + 64(D) 64-128
2001-2002 Morgan 25.18 106 128 64
2003 Applebred 37.2 85 128 64
Athlon ХР/МР 2001-2002 Palomino 37.5 130 128 256
2002 Thoroughbred 37.2 85 128 256
2003-2004 Barton 54.3 101 64+64 512
Sempron К7 2004 Thorton 54.3 101 128 256
2004 Thoroubred 37.2 85 128 256
2005 Winchester 68.5 84 128 128
Sempron К7 2005 Palermo 68-75 84 64+64 128-256
2006 Manila 103 81 128 128-256
Athlon 64 К8 2003-2004 Clawhammer 105.9 193 128 512-1024
2004 Newcastle 68.5 144 128 512
2004 Winchester 68.5 84 128 512
2005 Venice 76 84 128 512
2005 San Diego 114 115 128 512-1024
2006 Orleans 129 125 128 512
2006 Manchester 154 147 128 512
Opteron 2003 Sledgehammer 64+64 1024
2005 Venus, Troy, Athens 64+64 1024
Athlon 64 x 2 2-ядерные 2005 Manchester 154 147 128 x 2 512 x 2
2005 Toledo 233 199 128 x 2 512 x 2
2006 Windsor 243 220 128 x 2 512 x 2
2006 Brisbane 153.6 183 128 x 2 1024 x 2
Тип процессора Архитектура Размер минимальной структуры, мкм Тактовая частота шины, МГц Тактовая частота процессора, МГц Потребляемая мощность, Вт Интерфейс
AMD K5 K5 0.5-0.35 50-66 75-100 11-15 Socket 5/7
0.35 60-66 90-115 12-16 Socket 5/7
AMD К6 К6 0.35 CMOS 66 166-300 13-28 Socket 7
0.25 66 200-300 13-28 Socket 7
K6-2 0.25 66-100 266-550 15-30 Super7(321 p)
К6 3 0.25 100 400-450 18-30 Super7
Athlon К7 0.25 200 500-700 36-54 Slot A(575 p)
0.18 200 550-950 31-62 Slot A
0.18 200 700-1.4 ГГц 38-72 Socket A/Slot A
Duron 0.18 200 600-950 27-41 Socket A (Socket 462)
0.18 200 900-1.3 ГГц 44-60 S 462
0.13 266 1.4-1.8 57 S 462
Athlon ХР/МР 0.18 266 1.4-1.7 62-72 Socket 462
0.13 266 1.4-2.25 49-74 S 462
0.13 266-400 1.86-2.33 66-77 Socket A
Sempron К7 0.13 333 1.5-2.0 62 S 754/S 939
0.13 333 1.5-2.0 62 S462
0.09 400 1.6 62 S 754
Sempron К7 0.09 400 1.6-1.8 59-64.0 Socket А/ Socket 754
0.09 400 1.6-2.0 35-62 AM2
Athlon 64 К8 0.13 400 1.8-2.4 89 S 754
0.09 400 1.6-2.4 89 S754
0.09 400 1.8-2.2 67 S 939
0.09 400 2.0-2.4 16-89 S 754
0.09 400 2.2 89 S 939
0.09 400 1.8-2.4 35-62 AM2
0.09 400 2.0-2.2 67 S 939
Opteron 0.13 800/НТ 1.4-2.4 55-95 S 940
0.09 1000/НТ 1.6-3.0 55-95 S 940
Athlon 64 x 2 2-ядерные 0.09 667-800 2.0-2.4 69-110 S939
0.09 2.0-2.4 89-110 S 939
0.09 2.0-2.6 65-89 AM2
0.09 2.0-2.8 65-89 AM2

Проект многопортового внутреннего кэша процессора AMD-K6-3 позволил как кэшу L1 (64 Кбайт), так и кэшу L2 (256 Кбайт) выполнять одновременное 64-битовое чтение и запись операций за один такт процессора. В дополнение к этому многопортовому проекту кэша ядро процессора AMD-K6-I11 было в состоянии получить доступ к кэшам L1 и L2 одновременно, что увеличивало общую пропускную способность центрального процессора.

Процессор AMD Athlon

Выпуск процессора Athlon летом 1999 года был наиболее удачным ходом AMD. Это позволило им гордиться тем, что они произвели первый процессор седьмого поколения (у него было достаточно много радикальных архитектурных отличий от Pentium ll/lll и К6-3, чтобы заслужить название процессора следующего поколения), и это означало также, что они вырвали технологическое лидерство у Intel.

Древнегреческое слово Athlon означает «трофей», или «игры». Athlon - процессор, с помощью которого AMD надеялась увеличить реальное конкурентоспособное присутствие в корпоративном секторе, помимо его традиционного преимущества на потребительском рынке и рынке трехмерных игр. Ядро размещается на кристалле в 102 квадратных миллиметров и содержит приблизительно 22 миллиона транзисторов.

Основные элементы ядра Athlon

Многократные декодеры

Три полных декодера переводят х86-команды в макрооперации (MacroOPs) с фиксированной длиной для более высокой пропускной способности команд и увеличения мощности обработки. Вместо того чтобы выполнять х86 команды с длиной 1-15 байтов, процессор Athlon выполняет макрооперации фиксированной длины.

Блок контроля команд

Как только макрооперация расшифрована, за цикл посылаются до трех макроопераций блоку управления инструкциями (ICU). Это буфер перенаправления макроопераций с 72 входами (ROB), который управляет выполнением каждой макрооперации в целом, осуществляет переименование регистра для операндов, управляет любыми условиями исключения и действиями команды. ICU посылает макрооперацию планировщику исполнения.

Конвейеры исполнения

Athlon содержит 18-разрядный планировщик макроопераций и 36-разрядный планировщик операций мультимедиа и ПТ. Эти планировщики распределяют MacroOPs по девяти независимым конвейерам - три для вычислений с ФТ, три для вычисления адресов и три для выполнения команд ММХ, 3DNow! и операций ПТ для х87.

Супер скалярный блок плавающей точки FPT

Предыдущие центральные процессоры AMD были недостаточно производительными при работе с ПТ по сравнению с Intel. К этому недостатку более чем ответственно отнеслись в Athlon, который характеризуется суперскалярной архитектурой, включающей три конвейера выполнения команд с ПТ вне естественного порядка - FMUL (перемножение с ПТ), FADD (сложение с ПТ) и FSTORE (запись с ПТ). «Суперскалярность» означает способность центрального процессора выполнять более одной команды за такт процессора. Athlon же может выполнять одну операцию над 32-битовым числом с ПТ за такт процессора, что дает производительность в 2.4 Гфлопс при частоте в 600 МГц.

Прогнозирование переходов

Процессор Athlon предлагает сложную динамическую логику прогнозирования ветвления, чтобы минимизировать или устранить задержки из-за команд перехода, широко распространенные в программном обеспечении х86.

Системная шина

Системная шина Athlon - первая системная шина на 200 МГц для х86-платформ. Основанная на протоколе Digital Alpha EV6, первичная шина (FSB) - потенциально расширяемая до 400 МГц и более и, в отличие от разделяемой шины SMP (Symmetric Multi-Processing) проекта Pentium 3, использует архитектуру «точка-точка», чтобы обеспечить широкую полосу пропускания для одно- и многопроцессорных х86 платформ.

Архитектура кэша

Архитектура кэша Athlon существенно превосходит обычные центральные процессоры шестого поколения - полноценный кэш первого уровня 128 Кбайт, в 4 раза больший, чем у Pentium 3, и быстродействующий 64-битовый контроллер вторичного кэша 2-го уровня, поддерживающий от 512 Кбайт до 8 Мбайт.

Расширенный 3D Now

В ответ на Streaming SIMD Extensions (Intel Pentium 3) реализация 3DNow! в Athlon была модернизирована добавлением 24 новых команд к исходной 21 инструкции 3DNow!

Athlon был первоначально доступен в диапазонах скорости 500.550 и 600 МГц и 650 МГц немного позднее (все изготовлены по 0.25-мкм технологии). К концу 1999 года AMD еще более повысила частоту: его ядро К75 (750 МГц) является первым процессором, построенным с использованием алюминиевой 6-слойной технологии 0.18-мкм компании AMD.

Утверждение о том, что это был самый быстрый х86 совместимый центральный процессора тысячелетия, спорно, поскольку Intel быстро ответила объявлением 800 МГц Pentium 3. Однако AMD вскоре вернула лидерство в 2000 году выпуском версий на 800 и 850 МГц и преуспела в опережении Intel в преодолении барьера 1 ГГц буквально через несколько недель.

Процессор Thunderbird

В середине 2000 года была выпущена улучшенная версия Athlon с кодовым названием «Thunderbird».

Технология 0.18-мкм, кэш память 2-го уровня (L2) размером в 256 Кбайт расположена на плате процессора и работает на полной частоте процессора (первые процессоры Athlon имели кэш L2, работавшую на меньших частотах, например при частоте в 1 ГГЦ, память L2 работала на 330 МГц).

Интерфейсы - 462-контактный Socket А и Slot А. Частоты от 0.75 до 1 ГГц. Размещение 256 Кбайт памяти на кристалле привело к увеличению его размера до 120 квадратных миллиметров (102 квадратных миллиметров для ядра). Однако он меньше исходного (0.25-micron) К7 Athlon, который занимает 184 квадратных миллиметров. Добавление 256 Кбайт к L2-кэшу на кристалле весьма увеличивает число транзисторов. Центральный процессор Thunderbird включает 37 миллионов транзисторов, то есть 15 миллионов добавились для размещения кэша L2.

Осенью 2000 года был выпущен чипсет AMD760, обеспечивающий поддержку для памяти DDR SDRAM РС1600 (200 МГц FSB) и РС2100 (266 МГц FSB). Другие особенности - AGP 4-х, 4 порта USB , адресация памяти 8 Гбайт на 4 DIMM и поддержка АТА-100. С этого момента процессоры Athlon выпускались только для разъемов Socket А. Последние из процессоров Athlon/Thunderbird были выпущены летом 2001 года, достигнув частоты 1.4 ГГц.

Процессор Duron

В середине 2000 года был выпущен процессор Duron, предназначенный для дома и офиса. Название происходит от латинского «durare» - «вечный», «длительный». Кэш-память L1 (128 Кбайт) и L2 (64 Кбайт) размещается на плате. Первичная системная шина работает на частоте 200 МГц. Поддерживается улучшенная технология 3DNow! Технология 0.18-мкм, частоты 600.650 и 700 МГц. Интерфейс - 462-контактный разъем Socket А.

Процессор Palomino (Athlon ХР - EXtra Performance)

Процессор выполнен по 0.18-мкм технологии с использованием медных проводников на плате (вместо алюминия), содержит 37.5 миллионов транзисторов на кристалле в 128 квадратных миллиметров. Достигнуто понижение на 20 % энергопотребления сравнительно с Thunderbird. Введен ряд новшеств, в совокупности именуемых AMD как «QuantiSpeed Architecture»:

  • введение дополнительного буфера - буфера быстрого преобразования адреса (БПА, TLB - Processor`s Transition Lookaside Buffer). Это дополнительная кэш память, расположенная между L1 и L2. В частности, TLB содержит данные, которые используются для перевода виртуальных адресов в физические и наоборот;
  • поддержка SSE технологии Intel. В Palomino добавлены еще 52 новые команды SIMD по отношению к ранее имевшимся. Удвоено количество исходных 21 SIMD-команд, реализующих «3DNow!», и получена технология «Enhanced 3DNow!» («3DNow! Professional»);
  • использование технологии упаковки OPGA (organic PGA) для замещения CPGA (ceramic PGA), которая использовалась ранее. Использование пластмасс вместо керамики технологичнее, платы оказываются легче и обладают лучшими тепловыми свойствами. Кроме того, можно плотнее размещать навесные элементы, что уменьшает наводки и помехи. OPGA размещаются на уже известном разъеме Socket А.

Процессор Morgan

Morgan первоначально представлял собой ядро Palomino c удаленными 3/4 кэша L2 (64 Кбайт вместо 256 Кбайт). Размер кристалла - 106 квадратных миллиметров, число транзисторов - 25.18 миллионов. Напряжение питания было изменено с 1.6 до 1.75 В.

Процессор Thoroughbred

Летом 2002 года AMD начала поставлять первый процессор с 0.13-мкм технологией и медными соединениями. Площадь кристалла - 80 квадратных миллиметров (у его предшественников - 128 квадратных миллиметров). Питание - 1.65 В, размеры кэша на кристалле - 128 Кбайт для L1 и 256 Кбайт для L2, разъем - Socket А. Эквивалентная производительность Athlon ХР - 2400+ или 2600+.

Однако ядро Thoroughbred рассматривать как простую переделку Palomino с учетом новых норм технологического процесса все же не совсем верно. Thoroughbred по своей внутренней структуре значительно отличается от Palomino, в чем можно убедиться по микроснимкам процессорных ядер.

  • а - Palomino.
  • б - Thoroughbred.

Процессор Sempron

Летом 2004 года AMD объявила о выходе центрального процессора семейства Sempron. Первоначально задуманный как преемник успешного центрального процессора Duron и прямой конкурент процессору Celeron D (Intel, 90 нм), диапазон применения Sempron фактически перекрыл диапазон Athlon AMD ХР и поставил фирмы, выпускающие настольные и мобильные персональные компьютеры, перед выбором - либо Sempron, либо Athlon 64.

Все первые центральные процессоры базировались на 130 нанометровой технологии AMD. Наиболее мощные образцы (3100+) выпускаются в формате интерфейса Socket 754 (Athlon 64 - в формате Socket 939). Другие участники семейства - от 2 ГГц (2800+) до 1.5 ГГц (2200+) - используют Socket А.

В дальнейшем Sempron предполагается перевести на 90 нанометровую технологию и интерфейс Socket 939.

Архитектура процессора К8

Эта архитектура используется во всех современных серверных, настольных и мобильных процессорах AMD (Opteron, Athlon 64 и Athlon 64 Х2). Первым из процессоров К8 являлся Hammer (середина 2000 года).

Одним из главных новшеств К8 является 64-разрядная архитектура х86-64 ISA. Примером 64-разрядных процессоров (IA-64) является Intel Itanium. Однако между 64-разрядными архитектурами процессоров Itanium и К8 мало общего. Itanium - процессор, несовместимый с системой команд х86, тогда как К8, напротив, таковым является.

Стратегия AMD на 64 бита (х86-64) заключается в следующем - за основу взято производительное х86-ядро и расширен набор инструкций для возможности адресации 64-битового пространства памяти. Особенности архитектуры х86-64 (AMD64):

  • обратная совместимость с инструкциями х86;
  • 8 новых 64-битовых РОН плюс 64-битовые версии прежних 8 РОН х86 (доступны лишь в 64-битовом «длинном» режиме);
  • поддержка SSE и SSE2 помимо восьми новых регистров SSE2;
  • увеличен объем адресуемой памяти для приложений, работающих с большими объемами данных (доступно лишь в «длинном» режиме);
  • высокая производительность 32-битовых приложений плюс поддержка появляющихся 64-битовых приложений, хороший вариант переходного процессора.

Таблица режимов процессоров К8

Режим Подрежим Назначение Адресуемая память, Гбайт Операционная система Примечания
«Преемственности» (Legacy Mode) Нет Работа со всеми 16- или 32-бито-выми х86-прило-жениями 4 32-раз-рядная Используются только 32 разряда в 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется
«Длинный» (Long Mode) Полный (64 разряда) Работа с 64-разрядными приложениями (инструкции х86-64) Более 4 64-разрядная Используются 64-разрядные основные и дополнительные регистры. Требуется перекомпиляция старых программ
Совместимости (Compatibility Mode) Запуск 32-разрядных программ в 64-разрядной операционной системы 2 в 32-битовой операционной системе. 4 в 64-битовой операционной системе Используются только 32 разряда е 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется

Основные недостатки:

  • процессор продолжает поддерживать архитектуру х86, которая достаточно устарела;
  • новые РОН можно использовать лишь в 64-битовом режиме, что не позволяет повысить производительность 32-битовых приложений посредством улучшения архитектуры системы команд.

Для реализации возможности работы как с 32-битовыми, так и с 64-битовыми приложениями процессоры К8 поддерживают два режима работы - Long Mode и Legacy Mode. В режиме Long Mode также предусмотрено два подрежима - 64-битовый и Compability mode (режим совместимости).

Некоторые прочие особенности К8

  • контроллер памяти интегрирован в сам процессор. Традиционно он располагается в «северном мосте» чипсета на системной плате. Собственно, контроллер памяти - это основной функциональный блок «северного моста» (в чипсетах Intel его так и называют - МСН, Memory Controller Hub); встроенный порт («линк») шины HyperTransport - универсальной шины межчипового соединения. В процессорах К8 Opteron может быть до 3-4 линков НТ, что позволяет комбинировать их в кластерные структуры

  • архитектура К8 разработана с перспективой создания многоядерных процессоров и многопроцессорных систем: если центральные процессоры Intel Хеоn может продемонстрировать лишь 11 процентов увеличения производительности при переходе к двум процессорам, то в случае с Opteron оно составляет 24 процента;
  • усовершенствован блок предсказания переходов - для увеличения точности он содержит историю 16 000 переходов, а также 2000 адресов назначения.

Исполнение инструкций на конвейере К8 начинается с блока выборки инструкций. За один такт блок выбирает из кэша 16 байт данных и выделяет из них от одной до трех инструкций х86 - сколько в выбранных данных поместилось. Поскольку средняя длина команды х86 составляет 5-6 байт, то, как правило, блоку удается выбрать три команды за такт.

На втором такте конвейера выбранные команды распределяются по трем блокам декодирования инструкций. Самые сложные команды отправляются в декодер сложных команд (VectorPath), другие - в декодеры простых команд (DirectPath).

Исходные х86-инструкции на завершающих этапах работы декодера К7/К8 переводятся в макрооперации, или МакОПы (mOPs). Большинству х86-инструкций соответствует одна МакОП, некоторые преобразуются в 2 или 3, а наиболее сложные, например деление или тригонометрические, - в последовательность из нескольких десятков МакОП. Макрооперации имеют фиксированную длину и регулярную структуру.

Условно можно считать что в определенный момент МакОп может «расщепляться» на две микрооперации (МкОП). Как правило, в К7 и в К8 МакОП содержит две МкОП - одну для АЛУ (ALU) (или блока ПЗ - FPU), другую - для УВА (устройства вычисления адреса, AGU - Address Generation Unit).

За счет конвейеризации возможны ситуации, когда одновременно в разных блоках процессора будут выполняться до двух десятков команд - и в К7, и в К8 имеется десять исполнительных устройств - три ALU, три FPU, три AGU и отдельный блок умножения.

Подобно тому, как объединение двух отдельных МкОП в одну МакОП дает явные преимущества, точно так же дела обстоят и с самими МакОП - практически везде они выступают не в виде самостоятельных единиц, а в виде группы. Группу образуют три МакОП, которые одновременно запускаются на параллельные каналы.

Вся дальнейшая работа идет не с одиночными, а с «тройками» МакОП («линиями», line). Такая «линия», с точки зрения центрального управляющего блока процессора - ICU (Instruction Control Unit) воспринимается как единое целое: все основные действия выполняются именно над «линиями», в первую очередь выделение внутренних ресурсов.

Сгенерированные «линии» от декодеров по одной за такт поступают в блок управления командами - Instructions Control Unit (ICU), где подготовленные к исполнению линии накапливаются в специальной очереди (24 линии).

Из очереди в 24 линии по три МакОП в каждой ICU выбирает в наиболее удобной для исполнения последовательности (одна-три МакОП) и пересылает их либо на АЛУ, либо на блок ПЗ в зависимости от типа микрооперации. В случае АЛУ микрооперации сразу же попадают в очередь планировщика (шесть элементов по три МакОП), который подготавливает необходимые для исполнения микрооперации ресурсы, дожидается их готовности и только потом отправляет. Причем при исполнении одной МакОП на самом деле может происходить исполнение сразу двух действий (МкОП).

Процессор Athlon 64х2

AMD снова оказалась впереди Intel, продемонстрировав действующий экспериментальный образец двухъядерного процессора летом 2004 года и поэтому Intel вызвала всеобщее удивление, все же выйдя первой на рынок с двухъядерным процессором весной 2005 года Однако, мало того, что AMD 64 Х2 был только короткое время позади Pentium Extreme Edition и Pentium D по датам выхода на рынок, он значительно опережал их по показателям эффективности.

Athlon 64 Х2 включает все возможности, заложенные в единственном ядре Athlon 64 (такие, как HyperTransport и Enhanced Virus Protection - EVP). Когда центральный процессор работает под операционной системой Windows ХР (SP2), EVP интерпретирует области системной памяти как «только данные», так что любой находящийся здесь фрагмент кода может быть либо прочитан, либо записан, но не может быть выполнен как код программы. Тем самым EVP действует как профилактическая мера против обычных злонамеренных вирусов, локализуя и обезвреживая их.

Основная архитектура ядра Х2 по существу та же, как и у Athlon 64. Различие в том, что новые чипы, размещаемые на единственном кристалле в 199 квадратных миллиметров, причем каждый содержит более чем 233 миллиона транзисторов, изготовлены по 90 нанометровой технологии AMD.

Таким образом, спецификации первоначально объявленного диапазона Athlon 64 Х2 были эквивалентны таковым из существующих центральных процессоров на 3500+, 3700+, 3800+ и 4000+ с изменением кэша L2 и тактовой частоты. Модели с 512 Кбайт кэша на ядре базируются на двойном ядре «Winchecter», в то время как версии версии кэша L2 на 1 Мбайт используют дизайн «Toledo». К лету 2005 года диапазон был расширен с появлением нового чипа (3800 +).