`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Звезда Денеб – cверхновая в созвездии AMD

Статья опубликована в №5 (671) от 17 февраля

+35
голосов

Процессоры AMD Phenom должны были стать новой надеждой компании на серьезную конкуренцию с Intel в сегменте CPU для настольных ПК и рабочих станций. К сожалению, их реальная производительность оказалась намного ниже ожидаемой. Впрочем, инженеры AMD не поставили крест на этой архитектуре, а смогли ее усовершенствовать, исправив большинство недостатков в новом поколении – AMD Phenom II.

Ситуация на рынке настольных CPU в последние полтора года была довольно плачевной. После успеха AMD Athlon 64 корпорация из Саннивейла очень рассчитывала на процессоры Phenom, но в итоге ее ожидало серьезное разочарование. Даже после того как в новой ревизии ядра была исправлена ошибка TLB и производительность сравнялась с аналогичными по стоимости продуктами от Intel, Phenom X4 не стал тем процессором, который бы мог улучшить положение AMD на рынке. Причинами тому были прежде всего слишком высокое тепловыделение и недостаточное быстродействие в пересчете на одно ядро при слабой оптимизации ПО для четырехъядерных CPU.

Фактически архитектуру Phenom II нельзя назвать новой, даже во внутренней номенклатуре AMD она значится как K10.5. Процессоры с кодовым именем Deneb основаны на предыдущем поколении – тех самых неудачных Phenom (Agena), однако производство по 45-нанометровому техпроцессу и несколько ключевых улучшений позволили устранить большинство недостатков.

Звезда Денеб – cверхновая в созвездии AMD
Ядро AMD Phenom
Звезда Денеб – cверхновая в созвездии AMD
Ядро AMD Phenom II

Новинки сохранили сильные места предшественников. Встроенный контроллер памяти дает возможность радикально снизить задержки при обращении к RAM и увеличить пропускную способность. «Нативная четырехъядерность», называющаяся у AMD Direct Connect Architecture, представляющая собой расположение всех ядер процессора в одном кристалле, способствует снижению потерь при обращении ядер в чужой кэш L2. Кстати, несмотря на неоднократные заявления корпорации о том, что такой принцип построения CPU дает значительные преимущества перед архитектурой Intel Core 2 Quad, на практике дивидендов так и не было заметно.

Остановимся на контроллере памяти. В Deneb он был разработан заново, что позволило реализовать поддержку как привычной памяти DDR2-1066, так и более современной DDR3-1333. Кроме очевидной выгоды в виде совместимости с уже существующими платформами, это дало возможность добиться уменьшения задержек при доступе к памяти примерно на 10% (со 107 нс для первых Phenom до 95 нс для Phenom II). Как и ранее, контроллер работает в двухканальном режиме с возможностью переключения между режимами обращения к RAM (unganged и ganged, т.е. по половине доступного объема памяти на каждый канал или двухканальный доступ во все адресное пространство). Напомним, что у Intel Core i7 контроллер памяти трехканальный, что обеспечит ему большую производительность при установке трех модулей памяти.

В целом, поддержка обоих стандартов памяти – не такая уж сверхсложная задача, поскольку DDR2 и DDR3 на стороне контроллера отличаются только напряжениями, а основные различия в расположении контактов и терминации находятся на стороне материнской платы и модулей. Таким образом, ничто не мешало AMD реализовать поддержку обоих стандартов еще в первых Phenom, однако тогда экономической целесообразности в подобном шаге не было. На сегодняшний день смысл в этом уже есть, так как DDR3 начинает заметно дешеветь, да и производители DRAM более заинтересованы в продвижении нового стандарта на рынок и замещении им DDR2.

Иерархия кэшей в новых процессорах осталась прежней: на каждое ядро приходится 128 КБ (по 64 КБ для инструкций и данных) и 512 КБ эксклюзивного кэша L2. Значительное изменение претерпел только кэш L3, размер которого увеличился с 2 до 6 МБ, а латентность уменьшилась на два такта по сравнению с Agena. Если сравнивать архитектуру AMD с Intel Core i7, то иерархия кэшей у них одинакова, отличаются лишь объемы и скорость. У AMD K10.5 задержки L1 составляют три такта против четырех у Nehalem. При этом у Core i7 в два раза меньше кэша второго уровня на ядро (всего 256 КБ), однако у него гораздо меньшая латентность – 11 тактов против 15 у Phenom II. В целом, оба разработчика сходятся во мнении, что размер кэша L2 играет меньшую роль, нежели его производительность, если процессор оборудован достаточно быстрым и емким общим L3. Именно малый объем кэша был одной из основных причин низкой производительности первых Phenom во многих приложениях: для постоянной полной загрузки вычислениями всех четырех ядер нужно быстро передавать значительные объемы данных, которые просто не могут уместиться в 2 МБ. В результате процессору приходилось часто обращаться к оперативной памяти, теряя такты на ожидание. Шести мегабайт L3 должно хватать для большинства ситуаций. Если ядра обрабатывают независимые потоки с разными данными, то раздельный L2 для каждого из них не будет помехой, так как ядрам не нужно обмениваться содержимым кэшей, а если идет многопотоковая обработка одного набора данных, то общий быстрый L3 выгоднее объемного, но раздельного L2 в случае Core 2.

Сами ядра процессора не претерпели изменений, а просто были подвергнуты уменьшению для 45-нанометрового техпроцесса. Это позволило увеличить тактовые частоты до 3 ГГц у топовой модели Phenom II X4 940, при этом результаты тестирований демонстрируют, что запас частоты еще есть. Тепловой пакет CPU остался на уровне 125 Вт (85 Вт для младших моделей), в основном это объясняется наличием большого объема кэша L3. Что интересно, несмотря на переход на более миниатюрный техпроцесс и использование технологии SOI, напряжения питания процессоров практически не уменьшились, а верхний порог даже достиг 1,5 В при 1,3 В для AMD Phenom X4 9950. Тем не менее потребляемая мощность заметно снизилась по сравнению с предыдущим поколением: на частоте 3 ГГц Phenom II X4 940 потребляет около 190 Вт против 210 Вт у Phenom X4 9950 на 2,6 ГГц. Кроме того, AMD устранила проблему с технологией Cool ‘n' Quiet. Напомним, что архитектура Phenom позволяет задавать множители ядер динамически и независимо друг от друга. AMD воспользовалась этим для реализации системы энергосбережения, однако особенности диспетчера потоков в Windows привели к резкому снижению производительности при активации этой функции. Если какое-то ядро простаивало, процессор переводил его в экономный режим, снижая частоту вдвое. В какой-то момент Windows могла перевести поток с работающего на полной скорости ядра на замедленное, потеряв в быстродействии до 15%. В Phenom II AMD заблокировала возможность автоматического снижения частоты для отдельных ядер. Теперь, если хоть одно ядро сильно загружено, все четыре будут работать на максимальной частоте, а если уровень загрузки позволяет переключиться в экономный режим – весь CPU снижает частоты. Кроме того, для Phenom II количество состояний процессора (p-states) расширено с двух до четырех, и минимальная частота составляет всего 800 МГц. Также в новом поколении Phenom «научился» выгружать данные из кэшей L1 и L2 полностью простаивающих ядер в кэш L3, частоты которого задаются отдельным генератором, и переводить их в режим сна. Таким образом, они потребляют только токи утечки. Тем не менее новинки AMD значительно уступают по экономичности Intel Core i7, поскольку не умеют совсем отключать ядра от питания. Core 2 Quad также выглядят немного выигрышнее, поскольку Intel использует сплав high-k на основе гафния для металлических затворов транзисторов, демонстрирующий заметно меньшие токи утечки, чем применяемые AMD материалы.

Процессоры AMD Phenom II выпускаются в двух вариантах с разъемами Socket AM2+ и Socket AM3. Первый поддерживает установку только в материнские платы с разъемом AM2+, работающие с памятью DDR2. CPU с Socket AM3 обратно совместимы с Socket AM2+, т. е. их можно устанавливать как в материнские платы с новым разъемом и DDR3, так и в платформы предыдущего поколения. Для обеспечения работоспособности достаточно просто обновить прошивку BIOS. В принципе, ничего не мешает производителям материнских плат реализовать поддержку Phenom II и в платах с разъемом Socket AM2, однако официальной валидации такой комбинации со стороны AMD нет. Что касается AM3, то процессоры с этим разъемом имеют на две контактные ножки меньше, а в гнезде на соответствующем месте нет отверстия, потому Phenom II Socket AM2+ установить в новую материнскую плату попросту невозможно. Вероятнее всего, это сделано сугубо из маркетинговых побуждений, так как архитектурно модели с разными разъемами идентичны. Единственная разница между моделями одного класса – частота северного моста и кэша L3, которая для CPU с Socket AM2+ составляет 1,8 ГГц, а для AM3 – 2 ГГц. Впрочем, на производительности это практически не сказывается, а причиной такого явления скорее всего была необходимость выпустить Phenom II к CES 2009, а первые экземпляры были нестабильны при частоте uncore-блока 2 ГГц.

Материнские платы для Phenom II с обоими разъемами в данный момент основываются на чипсетах AMD 790FX, 790GX, 790X, 780G с южными мостами SB600 и SB750. Механизм Load Line Calibration, впервые введенный AMD SB750 и заметно улучшающий стабильность задающей частоты, теперь интегрирован в процессор. Это позволяет рассчитывать на то, что частотный потенциал, демонстрируемый новинками, будет сохраняться и при установке их в сравнительно давно выпущенные материнские платы с южным мостом SB600. В этом году будут представлены новые наборы логики 800-й серии для Socket AM3 и серверной платформы Socket F+, которые, кроме внутренних усовершенствований, направленных на повышение быстродействия чипсета, привнесут поддержку SATA 6 Гб/с и 14 портов USB 2.0. Точных сведений о сроках появления этих продуктов нет, однако исходя из того, что AMD планирует к концу 2009 г. практически полностью вытеснить платформу Socket AM2+ новым разъемом, можно ожидать их выхода летом.

Подводя итог, отметим, что AMD Phenom II – это, очевидно, эволюционное развитие уже существующей архитектуры. Разработчики сконцентрировались на основных недостатках предыдущего поколения: низкую экономичность устранили с помощью нового техпроцесса и улучшенной технологии Cool ‘n' Quiet, недостаточную производительность – повышенными частотами и расширенным кэшем. Кроме того, не встречавшаяся ранее поддержка работы встроенного контроллера с двумя стандартами памяти должна обеспечить заждавшихся потребителей возможностью как модернизировать существующие ПК, так и собрать новые из современных комплектующих. О том, насколько эти меры оказались удачными, читайте в следующем материале этого номера.

+35
голосов

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT