`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

AMD Thuban и Intel Gulftown: новые флагманы

Статья опубликована в №22 (733) от 22 июня

+22
голоса

Индустрия процессоров не стоит на месте: пять лет назад тематические форумы сотрясали баталии по поводу оправданности появления первых двухъядерных процессоров, а теперь никого не удивишь и четырехъядерными в домашних ПК. Более того, CPU с двумя ядрами встречаются даже в мобильных телефонах! Архитектуры постоянно развиваются, однако на их разработку требуется время, потому Intel и AMD пока организовали себе своеобразную отсрочку, выпустив первые шестиядерные процессоры на базе уже внедренных архитектур. Так ли они востребованы в своем сегменте – домашних ПК и рабочих станциях? Оправдан ли переход на них? Постараемся выяснить.

AMD Thuban

AMD Thuban и Intel Gulftown новые флагманы
AMD Thuban и Intel Gulftown новые флагманы
Вверху – кристалл AMD Deneb, внизу – AMD Thuban

Именно с процессоров AMD Athlon 64 X2 началось победоносное шествие двухъядерных CPU на десктопном рынке, потому неудивительно, что компания не оставила практику наращивания количества ядер в своих продуктах. В целом AMD придерживается логичного мнения о том, что сложное ПО, которого становится все больше, обычно может быть адаптировано под параллельное исполнение в несколько потоков, и, следовательно, число ядер в процессоре для него будет играть более важную роль, чем чистая производительность одного из них. Потому хоть процессоры Phenom II и уступают в быстродействии Intel Core 2 и Core i5/i7, но демократичная ценовая политика дает пользователю возможность купить более сложный CPU: Phenom II X3 с тремя ядрами вместо Core 2 Duo или Core i3/i5 из нижних линеек, Phenom II X4 – вместо старших Core 2 Duo. У AMD не было по-настоящему исчерпывающего ответа лишь на Core 2 Quad и Core i7: при равном числе вычислительных блоков в быстродействии Phenom II уступают, так что в верхнем сегменте для энтузиастов «зеленые стрелы» фактически не представлены.

Архитектура K10 позволяет сравнительно легко строить процессоры по модульному принципу, что дало AMD возможность «малой кровью» довольно регулярно увеличивать производительность CPU серии Opteron, ориентированных на серверные системы, в которых оптимизация ПО под новейшие технологии – дело обыденное. На сегодняшний день в линейке компании уже есть двенадцатиядерные модели, потому неудивительно, что и в десктопном сегменте произошло обновление. Новые CPU, основанные на ядре Thuban, получили название Phenom II X6.

На данный момент AMD предлагает всего две шестиядерные модели с номерами 1055T и 1090T, последний относится к Black Edition – серии CPU для любителей разгона, которые за небольшую дополнительную плату дают возможность управлять множителем в сторону повышения. В III квартале линейка пополнится Phenom II X6 1075T и 1035T, а также основанным на Thuban четырехъядерным Phenom II X4 960T. Максимальная штатная частота этих процессоров составляет 3,2 ГГц, тепловой пакет (TDP) сохранен на уровне 125 Вт (отличное достижение инженеров как из отдела разработки AMD, так и «производственников» GlobalFoundries). Более того, модель 1055Т уже сейчас представлена в двух вариантах, отличающихся только напряжением питания и TDP – 125 или 95 Вт. Вышеупомянутые 1035Т и 960Т также будут выделять пониженное количество тепла, а 1075Т останется на уровне 125 Вт.

Turbo Core

Мы неспроста уделяем столько внимания заявленному показателю тепловой мощности Thuban: эти процессоры так и остались 45-нанометровыми, потому добавление на кристалл двух ядер при сохранении того же TDP является важной победой AMD. И это еще не все: буква «Т», появившаяся в номерах CPU, означает поддержку новой технологии Turbo Core, которая динамически разгоняет процессор в зависимости от загрузки, что также сказывается на тепловыделении.

Turbo Core в значительной мере похожа на Intel Turbo Boost, которая уже не раз удостаивалась похвалы за то, что ее включение приводит к заметному повышению эффективности ПО, неспособного загрузить все ядра процессора. Вариация AMD не настолько развита, как у лидера рынка, однако также должна стать неплохим подспорьем в рабочих станциях и домашних ПК, где программ с высокой степенью параллелизации не так уж и много. Реализована она следующим образом: в случае, если загружены только три или меньше ядер из шести, простаивающие три переводятся в режим пониженного энергопотребления путем снижения частоты до 800 МГц, напряжение на всем кристалле повышается и частота активно работающих блоков поднимается до определенного моделью CPU значения. Для Phenom II X6 1090T Black Edition это 3,6 ГГц, что составляет 400 МГц прироста против штатных 3,2 ГГц, а модели 1055Т (и будущей 1075Т) Turbo Core приносит целых 500 МГц. Работает технология посредством штатного механизма управления состояниями процессора, потому пользователю доступны расширенные настройки Turbo Core с помощью утилиты AMD OverDrive. В ней можно указать, сколько ядер и какие именно будут «разгоняться», до какой частоты, а также до какого значения повышать напряжение. Таким образом, появляется возможность вместо стандартного управления тремя из шести ядер настроить CPU на разгон двух или даже одного (что при замедлении остальных до 800 МГц и снижении тепловыделения позволит стабильно работать на частотах 4 ГГц и выше). Правда, такое вмешательство в алгоритм может оказаться чреватым проблемами: в свое время AMD неспроста отключила индивидуальное управление частотами всех ядер из Phenom II (Deneb). Особенность диспетчера потоков Windows, состоящая в том, что он постоянно «перебрасывает» исполняемое приложение между ядрами, приводила к тому, что поток в любой момент мог оказаться на «спящем» ядре, на его пробуждение требовалось несколько тактов, и это значительно снижало общую производительность. Потому в Phenom II режимы сниженного энергопотребления активируются сразу для всего процессора. Как будет себя вести ПО с модифицированными алгоритмами Turbo Core – вопрос сложный и требующий отдельного исследования.

В сравнении с Intel Turbo Boost новая технология AMD не так развита: во-первых, в ней нет промежуточных состояний (которые Intel называет «шагами»), и частота повышается скачком до максимального значения; во-вторых, в Thuban отсутствуют реализованные в Nehalem блоки управления питанием ядер, позволяющие полностью отключать их, поэтому AMD пришлось ограничиться замедлением до 800 МГц. Если бы можно было обесточить хотя бы три из шести ядер, TDP бы снизился намного сильнее и потолок Turbo Core поднялся бы значительно выше, все же 45-нанометровая архитектура K10.5 в плане частотного потенциала уже показала себя с отличной стороны. Чтобы подсластить пилюлю, отметим, что возможность настройки этой функции пользователем определенно понравится энтузиастам, в то время как Turbo Boost либо работает в штатном режиме, либо не работает вообще.

Архитектура

В целом даже мимолетный взгляд на снимок кристалла Phenom II X6 тут же убеждает в том, что Thuban – не полностью новая разработка, а эволюционное развитие Deneb. Четыре «исходных» ядра расположены оптимально с точки зрения разводки, тепловыделения, организации питания и доступа к кэшам, а два новых будто бы «прилеплены» сбоку. Из-за стремления не выйти за пределы теплового пакета в 125 Вт инженерам пришлось сохранить объем кэша третьего уровня лишь 6 МБ, чего для «тяжелых» приложений может быть мало. Также остался прежним и контроллер памяти: он знаком нам по Deneb, поддерживает двухканальный доступ к DDR3-1333 и обратносовместим с двухканальной DDR2-1066 на платах с разъемом AM2+ и AM2. Общее число транзисторов достигло 904 млн, при 45-нанометровом техпроцессе с использованием SOI, иммерсионной литографии и диэлектрика low-k площадь кристалла равна 346 мм2. В данный момент поставляются процессоры с ревизией ядра E0 (что интересно, самая свежая модификация Deneb на сегодня – C2, очевидно, D была инженерной для Thuban, и именно серьезными оптимизациями разводки и техпроцесса и объясняется экономичность чипа). Функционально Phenom II X6 абсолютно идентичны Phenom II X4 – никаких нововведений в них нет.

Платформа

AMD Phenom II X6 способны работать на всех чипсетах для Socket AM2, AM2+ и AM3 после обновления BIOS материнских плат. Впрочем, устанавливать эти процессоры в платформы прошлого поколения с оперативной памятью DDR2 будет неудачной идеей: для шести ядер даже двухканальный контроллер DDR3 может оказаться «бутылочным горлышком». Большинство производителей плат сообщили, что их продукты на базе чипсетов AMD 700-й серии получат обновление прошивок, тем не менее AMD подготовила и новую серию специально для своих флагманов.

Компания представила два топовых набора логики, вошедших в 800-е семейство. AMD 890GX был продемонстрирован в марте и является обновленным 790GX с северным мостом, оснащенным новым IGP Radeon HD 4290, который производится по нормам 55-нанометрового техпроцесса, и южным мостом SB850. Radeon HD 4290 – это усовершенствованное ядро HD 3300 из 790GX, точно так же снабжено 40 потоковыми процессорами, с частотой 700 МГц, а новшества состоят в поддержке DirectX 10.1 и блока ускорения и обработки видео UVD2.

Флагманский чипсет AMD 890FX – фактически тот же 790FX, укомплектованный SB850, единственное серьезное отличие – появление IOMMU (блока управления памятью для ввода/вывода) на шине PCI Express. Он нужен для трансляции виртуальной памяти в физическую и предоставления устройствам DMA-доступа в виртуальное адресное пространство, на практике это даст программистам ПО возможность упростить драйверы, повысить надежность виртуальных машин, быстродействие при работе со всевозможными контроллерами (например, RAID с собственным кэшем или GPGPU-ускорителями). Прочие характеристики остались неизменными: 38 линий PCI Express 2.0 для устройств (доступны конфигурации 2×16 и 4×8 для видеокарт), поддержка шины HyperTransport 3.0, осуществляющей по 2600 передач данных между CPU и чипсетом в секунду в каждом направлении.

Главное изменение в новых чипсетах – именно южный мост SB850. Его отличия от SB750 довольно значительны: появился шестипортовый контроллер SATA 6 Gbit/s, количество разъемов USB 2.0 увеличено с 12 до 14, реализован сетевой контроллер Gigabit Ethernet, теперь южный мост предоставляет внешним контроллерам две линии PCI Express 2.0. Для обеспечения достаточной пропускной способности всем интегрированным устройствам шина A-Link Express III между южным и северным мостами расширена вдвое – до 2 ГБ/с в каждом направлении (физически это четыре линии PCI Express 2.0). Реализовывать USB 3.0 в чипсете AMD все же не стала, оставив поддержку новой версии интерфейса на усмотрение производителей материнских плат.

Intel Gulftown

AMD Thuban и Intel Gulftown новые флагманы
AMD Thuban и Intel Gulftown новые флагманы
Вверху – кристалл Intel Bloomfield, внизу – Intel Gulftown

Микроархитектура Intel Nehalem была представлена еще в ноябре 2008 г. в виде CPU с ядром Bloomfield, и с тех пор для сегмента энтузиастов процессорный гигант существенных обновлений не выпускал. Линейка Core i7 для платформы Socket 1366 постепенно пополнилась флагманами с ненамного повышенной частотой (Core i7 975 Extreme Edition) и промежуточными моделями (Core i7 930, 950 и 960). Такое слабое внимание в целом понятно: компании требовалось дождаться распродажи топовых Core 2 Quad, к тому же суммарная стоимость ПК на базе Socket 1366 была недоступна большинству покупателей. Потому основной силой на стороне Nehalem выступили модели среднего класса Lynnfield, а затем и их двухъядерные последователи на обновленном ядре Clarkdale, производимые по 32-нанометровому техпроцессу и принесшие эту архитектуру в остальные сегменты рынка.

Тем не менее забывать об энтузиастах, выступающих своего рода «почетной гвардией» любого вендора, было бы неразумно, и Intel подготовила для них поистине шикарный подарок: первый шестиядерный десктопный процессор Core i7 980X, основанный на 32-нанометровом ядре Gulftown. Этот кристалл ранее был известен как WestmereEP – серверная модификация того же чипа, на котором базируются Core i5 и Core i3, но с полным набором функций и составных частей. Для адаптации его к настольным платформам была просто отключена одна из шин QPI и поддержка регистрового ОЗУ; тем самым процессор ограничили односокетными системами, некритичными к ошибкам памяти.

На данный момент в десктопном сегменте Gulftown представлен единственной моделью – вышеозначенной Core i7 980X, относящейся к семейству Extreme Edition и оцененной производителем в $999. В линейке Xeon у этого CPU есть брат-близнец Xeon W3680, позиционирующийся для рабочих станций и во всем идентичный ему по характеристикам, включая и цену, но поддерживающий регистровую память, а среди серверных ему соответствует X5680, предназначенный для двухсокетных систем и стоящий $1663.

В III квартале серия должна пополниться младшим процессором Core i7 970, который скорее всего будет работать на частоте 3,2 ГГц, что поставит его как раз между четырехъядерными Core i7 Extreme 965 (3,2 ГГц) и 975 (3,33 ГГц). Также будет представлена новая флагманская модель Core i7 990X с повышенной частотой, и на этом эволюция Nehalem в топовом сегменте закончится. Тем не менее жизнь платформы Socket 1366 обещает быть еще долгой: топовые процессоры с архитектурой Sandy Bridge ожидаются не ранее III квартала 2011 г., вначале же будут представлены двух- и четырехъядерные модели среднего ценового диапазона. Впрочем, очевидной необходимости в каких-либо «резких движениях» тоже нет: со стороны AMD в топовом сегменте процессоров в первой половине 2011 г. должны появиться первые устройства с архитектурой Bulldozer (восьмиядерные Zambezi и шестнадцатиядерные Interlagos), ориентированные на HPC, и первые APU Llano, которые с точки зрения вычислительной мощности в обычных приложениях не станут большим шагом вперед. К тому же и Bulldozer, и Llano потребуются новые материнские платы с другими разъемами, что также замедлит их проникновение на рынок. Таким образом, даже отбрасывая все возможные сложности AMD с техпроцессом и допуская, что продажи Bulldozer будут активными как минимум до осеннего сезона 2011 г., в топовом сегменте Intel может чувствовать себя абсолютно спокойно.

Архитектура

Как мы уже упоминали, новый флагман производится по 32-нанометровому техпроцессу, отлаженному Intel на процессорах Clarkdale. Кристалл содержит 1170 млн транзисторов, при этом занимаемая площадь составляет 248 мм2 (Bloomfield с 731 млн – 263 мм2).

По сравнению с AMD Thuban Intel Gulftown выглядит более стройным: на снимке кристалла четко видны две группы по три ядра, к каждой из которых примыкает по 6 МБ кэша L3. Эти группы разделены между собой диспетчером очереди команд, другой логикой и uncore-частью ядра. Подчеркнем, что хотя физически кэш третьего уровня и поделен на две части, логически он является общим для всех шести ядер. За счет перехода на более тонкий техпроцесс Intel удалось сохранить ТDP таким же, как и у четырехъядерных Bloomfield – 130 Вт, при этом два добавившихся ядра принесли и пропорциональное увеличение L3, который, как известно, является одним из основных источников тепла в процессоре.

С точки зрения функциональных особенностей Gulftown – своего рода гибрид между настольным вариантом Westmere, известным как Clarkdale, и Bloomfield, выполненным по уменьшенному техпроцессу. Как и «старые» Core i7, этот CPU лишен встроенного в кристалл контроллера PCI Express и не содержит на подложке чипа с графическим ускорителем. Контроллер памяти также остался от «настоящего» Nehalem, обеспечивая трехканальный доступ к DDR3-1066 (естественно, поддерживаются и более скоростные модули, но с точки зрения Intel это уже нештатные режимы работы). Напомним, что в Clarkdale модифицированный двухканальный контроллер из чипсета X48 официально совместим с DDR3-1333. Наконец, на месте высокоскоростная шина QPI, отвечающая за обмен данными между процессором и чипсетом, которая в CPU среднего и начального уровней заменена на более медленную DMI. В то же время от Westmere, кроме, собственно, техпроцесса, Gulftown получил возможность полного отключения кэша третьего уровня вместе с блоком Uncore и поддержку аппаратного исполнения инструкций AES-NI, радикально ускоряющих работу с алгоритмом шифрования AES.

Существенных изменений в вычислительных блоках Gulftown, помимо внедрения поддержки AES-NI, нет, потому в приложениях, не генерирующих большого количества потоков, новый флагман Intel сможет опередить Bloomfield лишь в случае, если ПО критично к объему кэша. А вот сравнение с Core 2 и архитектурами AMD оказывается не в пользу последних: поддержка Hyper-Threading, как мы уже неоднократно отмечали, часто приносит очень значительное увеличение производительности, и тут Gulftown смотрится весьма внушительно: CPU способен одновременно обрабатывать 12 программных потоков.

Судя по формуле Turbo Boost, несмотря на 32-нанометровый техпроцесс, 6 ядер и 12 МБ L3 подвели Gulftown опасно близко к порогу TDP: процессор разгоняется всего на 133 МГц в случае простоя 1–3 ядер и на 266 МГц – если в спящий режим переходят сразу 4–5. Таким образом, максимальная тактовая частота может составить 3,6 ГГц.

Что касается платформы, то тут выбор невелик: Socket 1366 поддерживается единственным чипсетом Intel X58, и изменения сложившейся ситуации не предвидятся, поскольку NVIDIA так и не получила лицензии на разработку логики для системной шины QPI. Дизайн преобразователя питания остался старым, потому абсолютно все материнские платы с этим разъемом после обновления BIOS должны отлично заработать с Gulftown.

Позиционирование

Несмотря на то что мы рассматриваем Intel Gulftown и AMD Thuban в рамках одного материала и даже оба протестированных нами процессора являются «элитными» (Extreme Edition и Black Edition), позиционируются они совсем по-разному. С Core i7 980X все однозначно – это априори самый быстрый из присутствующих на рынке CPU для настольных систем, и этой нише соответствует и ценник. Конкурентов данной модели сегодня попросту не существует.

AMD Phenom II X6, с другой стороны, хоть и являются флагманскими моделями в линейке калифорнийского производителя, конкурируют лишь с процессорами среднего класса Intel. Прямыми соперниками для модели 1090T Black Edition, предлагаемой за $295, будут Core i7 860 (Lynnfield) и 920-930 (Bloomfield), а также двухъядерный Clarkdale Intel Core i5 680 с частотой 3,6 ГГц. Младший Thuban – 1055T за $199 – будет соперничать с уже устаревшими четырехъядерными Core 2 Quad Q9400 и двухъядерными Core i5 660-661.

Нюанс такого, на первый взгляд, абсурдного позиционирования в том, что если шесть ядер против четырех обычно будут бороться на близкой частоте, то двухъядерные модели Intel обладают намного большей и в приложениях со слабой степенью параллелизации будут значительно быстрее, однако общий комфорт от работы на них окажется ниже из-за невозможности запустить «тяжелое» приложение в фоновом режиме.

Имеют ли эти гиганты шанс на рынке? Ближайший осенний сезон продаж покажет, а пока перейдем к тестированию, чтобы узнать, что же собой представляют новые флагманы Intel и AMD.

+22
голоса

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT