`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Новые вершины производительности

Статья опубликована в №43 (611) от 13 ноября

+11
голос

Поколение процессоров, ранее известное под кодовым названием Penryn, является развитием микроархитектуры Core, дебютировавшей в 2006 г. с ядром Conroe. Согласно стратегии выпуска новых продуктов Intel, именуемой «тик-так», раз в два года выходит новая архитектура («тик» – в данном случае это Conroe), которая через год переводится на следующий техпроцесс («так» в виде Penryn). Таким образом, ключевое отличие новинок от Conroe/Kentsfield именно в применении 45-нанометрового процесса, в то время как улучшение дизайна – это уже приятное дополнение.

45 нанометров

Сложно оценивать, легко ли дался Intel переход на следующую ступеньку минитюаризации транзисторов. Если судить по итоговому результату в виде QX9650, то никаких проблем не возникло – производительность, энергопотребление и частотный потенциал улучшились по сравнению с предыдущим поколением. Но с точки зрения инженера 45 нм явно оказались «крепким орешком». Для того чтобы реализовать этот техпроцесс, разработчикам пришлось изменить одну из фундаментальных характеристик – материалы, применяемые в производстве. Вместо используемого с 1960-х годов оксида кремния в качестве диэлектрика взят силицид гафния – изолятор с высокой диэлектрической проницаемостью (high-k). А затвор транзистора выполнен из металла вместо поликристаллического кремния. Благодаря этому удалось решить ключевую проблему – миниатюризация транзисторов привела к невозможности дальнейшего эффективного использования оксида кремния в качестве диэлектрика. Попутно существенно (в 5–10 раз) были снижены токи утечек. Важно, что для производства по 45-нанометровому техпроцессу по-прежнему применяются 300-миллиметровые пластины и 193-нанометровая литография, что означает отсутствие необходимости обширных модернизаций фабричных мощностей. На сегодняшний день техпроцесс освоен двумя фабриками: опытные партии изготовлялись на D1D в Орегоне, а серийные CPU начали выпускать на Fab 32 (штат Аризона). В следующем году к списку добавятся еще Fab 11x в штате Нью-Мексико и израильская Fab 28 (Кирьят-Гат).

Что касается практических преимуществ нового процесса, то они традиционны – повышение производительности, улучшение частотного потенциала, снижение энергопотребления, уменьшение габаритов ядра (сравните: кристалл Conroe с 290 млн транзисторов занимает 143 кв. мм, а Wolfdale при 410 млн – 107 кв. мм).

Позиционирование 45-нанометровых CPU
Сегмент Наименование ядра Предшественник
Настольный Yorkfield Kentsfield
Wolfdale Conroe
Мобильный Penryn Merom
Серверный Harpertown Clovertown
Wolfdale-DP Woodcrest
Dunnington Tigerton

Архитектура

Наиболее очевидное улучшение архитектуры Core в новых процессорах – это увеличившийся объем L2-кэша: теперь каждый кристалл имеет по 6 МБ памяти второго уровня, разделенной между двумя ядрами. Собственно, кэш-памятью занята бoльшая часть площади ядра. Это уже не первый раз, когда Intel использует возможности новых техпроцессов по уплотнению транзисторов в ядре одного и того же размера для наращивания объемов кэша. И стоит отметить, что ход весьма оправдан – очень многие приложения позитивно реагируют на увеличение L2.

В Yorkfield и Wolfdale появилась поддержка нового набора SIMD-инструкций, названного SSE4.1. Он состоит из 47 новых инструкций различных типов, ускоряющих работу процессора, в первую очередь в таких задачах, как обработка видеопотоков, 3D-графика и научные расчеты. Интересно, что данный комплект инструкций является только частью полноценного SSE4 – полный набор будет включать еще 7 инструкций и появится в процессорах поколения Nehalem. Как всегда, прирост производительности от SSE4 наблюдается только в ПО с поддержкой новых расширений: на сегодняшний день это DivX 6.7 и TMPEG Xpress 4.4. Тем не менее там, где оптимизация есть, эффект от новых инструкций более чем заметный (QX9650 на десятки процентов быстрее QX6850).

Другие изменения по сравнению с предыдущим поколением заключаются в появлении блоков Fast Radix-16 Decoder и Super Shuffle Engine, существенно ускоряющих выполнение операций с делением и битовой перестановкой. Кроме того, была усовершенствована технология виртуализации.

Технические характеристики процессоров
Название Core 2 Extreme QX9650 Core 2 Extreme QX6850
Кодовое наименование ядра Yorkfield Kentsfield
Тактовая частота, МГц 3000
Разъем Socket LGA775
Технический процесс, нм 45 65
Количество ядер 4
Количество кристаллов 2
Объем кэш-памяти L1, КБ 4×32
Объем кэш-памяти L2, КБ 2×6144 2×4096
Частота FSB, МГц 1333
Поддержка SIMD-инструкций SSE 4.1 SSSE3
Поддержка EM64T Есть
Поддержка Intel VT
TDP, Вт 130
Количество транзисторов, млн 2×410 2×291
Площадь кристалла, кв. мм 2×107 2×143
Рекомендуемая цена, $ 999

Ассортимент

В первую очередь следует отметить, что привычное название Penryn не совсем правильно – по отношению к 45-нанометровым процессорам Intel оно означает конкретно мобильный вариант ядра, выходящий в первом квартале следующего года. Кодовые названия настольных ядер – Yorkfield и Wolfdale для четырех- и двухъядерного варианта соответственно. Серверные процессоры в корпусе типа LGA771, дебютирующие 12 ноября, относятся к линейкам Harpertown (4 ядра) и Wolfdale-DP (2 ядра), а ожидаемая во второй половине 2008 г. замена для Xeon 7300 именуется Dunnington.

Кроме Harpertown и Wolfdale-DP, до конца этого года будет доступен только один 45-нанометровый процессор – Core 2 Extreme QX9650, ориентированный исключительно на энтузиастов (что подтверждается традиционной для «экстремальных версий» стоимостью $999). Остальные пользователи смогут ощутить преимущества новых CPU только в следующем квартале, т. е. после нового года. Планы по выведению на массовый рынок Wolfdale и Yorkfield известны – в январе в ассортименте Intel появятся семь моделей серий E8xxx и Q9xxx. Они займут те же ниши, которые сейчас принадлежат продуктам на базе Conroe и Kentsfield, распределившись в диапазоне от $163 за двухъядерный процессор с частотой 2,66 ГГц до $530 за четырехъядерный 2,83 ГГц. Стоит отметить две необычные младшие модели: Core 2 Duo E8190 будет полностью аналогичен E8200, но с отключенной поддержкой виртуализации (что не скажется на цене), а Core 2 Quad Q9300 выделяется среди остальных Yorkfield вдвое уменьшенным объемом L2-кэша – всего 6 МБ. При этом подобное «урезанное» двухъядерное решение выйдет позже, не ранее II квартала 2008 г. А вот QX9650 не долго будет иметь статус флагмана – в первые месяцы следующего года должен появиться Core 2 Extreme QX9770, выделяющийся тремя показателями. Во-первых, это будет первый настольный CPU от Intel с шиной 1600 МГц, официальную поддержку которой обеспечит чипсет X48. Во-вторых, заявленный TDP для него составляет 136 Вт (хотя вряд ли Yorkfield на частоте 3,2 ГГц реально потребляет столько энергии). В-третьих, рекомендованная розничная стоимость составит эпические $1399 – столько за десктопные процессоры, даже топовые, не просили уже давно...

Линейка настольных CPU
Наименование модели Цена, $ Количе- ство ядер Тактовая частота, МГц Частота FSB, МГц Объем L2-кэша, МБ TDP, Вт Дата выхода
Core 2 Extreme QX9770 1399 4 3200 1600 2×6 136 I квартал 2008 г.
Core 2 Extreme QX9650 999 3000 1333 130 11/12/07
Core 2 Quad Q9550 530 2830 95 Январь 2008
Core 2 Quad Q9450 316 2660
Core 2 Quad Q9300 266 2500 2×3
Core 2 Duo E8500 266 2 3160 6 65
Core 2 Duo E8400 183 3000
Core 2 Duo E8200 163 2660
Core 2 Duo E8190

Kentsfield vs. Yorkfield

Именно в таком формате проходили практические тесты нового CPU. Увы, единственный доступный на рынке процессор, достойный сравнения с Core 2 Extreme QX9650, – это его же предшественник QX6850 на ядре Kentsfield с той же тактовой частотой и системной шиной. Двухъядерные Core 2 Duo ему явно не конкуренты, да и наиболее производительный Athlon 64 X2 6400+ находится в совершенно другом ценовом диапазоне. Скорый выход Phenom, разумеется, добавит остроты (наконец-то можно будет сравнить принципиально разные четырехъядерные CPU между собой), но пока K10 еще не добрались до Тестовой лаборатории.

С другой стороны, сравнение двух практически идентичных по основным характеристикам процессоров позволяет хорошо оценить эффективность нового технологического процесса и оптимизаций микроархитектуры. Правда, к сожалению, разный объем кэш-памяти второго уровня все-таки вносит неясность.

Результаты тестов демонстрируют, что, несмотря на сохранение прежних частот ядра и системной шины, Yorkfield во всех задачах быстрее Kentsfield. Кое-где разница эта едва заметна, кое-где составляет несколько процентов и лишь в редких случаях оказывается выше 20%. Для столь незначительных, в принципе, изменений в архитектуре – отличный результат!

Однако более интересны другие замеры, показывающие преимущества нового техпроцесса.

Во-первых, это температурный режим. Несмотря на то что заявленный TDP у QX9650 составляет 130 Вт, на практике тепловыделение (и потребление энергии, соответственно) явно существенно ниже, чем у QX6850 с тем же значением TDP. Особенно впечатляет эффективность реализации схем снижения энергопотребления при простое – четырехъядерный Yorkfield не горячее обычного Conroe.

Во-вторых, потенциал разгона. Для энтузиастского продукта, каковым является Core 2 Extreme QX9650, данный показатель и так очень важен, но наш интерес определяется еще и тем, что хорошо отлаженный техпроцесс, при прочих равных, должен улучшать предел максимально достижимой тактовой частоты. На сей раз мы рассмотрели этот вопрос еще глубже, чем раньше, сравнив разгон Kentsfield и Yorkfield в трех различных условиях: при обычном воздушном охлаждении (ThermalTake BlueOrb II), с использованием системы фазового перехода Asetek VapoChill LS [AC] и... специально изготовленного теплообменника для жидкого азота. Во всех случаях QX9650 нас порадовал – в среднем его потенциал на 300 МГц выше, чем у QX6850 при одинаковом охлаждении. Что касается производительности в экстремальных режимах, то тесты под жидким азотом проводились только в двух бенчмарках, представляющих интерес для оверклокеров – PiFast (18,13 с при 5230 МГц) и SuperPi 1M (8,56 с при 5280 МГц).

Настоящий экстрим, или Как заморозить процессор

Новые вершины производительности
Новые вершины производительности
Тестовый стенд для охлаждения жидким азотом в сборе

Апофеозом оверклокерских технологий с точки зрения эффективности является охлаждение процессора жидким азотом. К нему прибегают только ради установки рекордов разгона. Но так как автор этой статьи – один из основателей бенчмаркинг-команды Team MXS (ModLabs eXcessive Speed), мы не смогли удержаться от того, чтобы не проверить новый флагман Intel «в боевых условиях».

Организация охлаждения с помощью жидкого азота на самом деле достаточно простая вещь – скажем, сборка самодельной системы фазового перехода на порядок сложнее. Более того, по материальным затратам эксперименты с жидким азотом (или сухим льдом – технология та же самая) тоже заметно более демократичны.

Во-первых, необходимо изготовить так называемый «стакан» – сосуд с металлическими (медными или алюминиевыми) дном и стенками, устанавливаемый непосредственно на процессор. Дальше нужно качественно теплоизолировать сам стакан и материнскую плату, чтобы образующийся от огромного перепада температур конденсат не замкнул на ней контакты. Также следует раздобыть сосуд Дьюара и приобрести на кислородном заводе необходимое количество азота. В Киеве один его литр стоит $1, при расходе в среднем 3–4 л на час работы компьютера. Более подробно процесс азотного охлаждения ПК описан на сайте ModLabs.net:

Главным злом для всех экстремальных оверклокеров выступает так называемый «cold bug» – температурное ограничение работы какого-то компонента, когда при снижении температуры ниже определенного предела он перестает стартовать или ведет себя нестабильно. В частности, наш экземпляр Yorkfield отказывался работать ниже -100 °С, что, возможно, и не позволило нам достичь большего.

Кроме тестирования для данного материала, участники киевского подразделения Team MXS показывали «азотный разгон» QX9650 публично на выставке «Цифромания»

Итоги

Новые вершины производительности
Новые вершины производительности
Новые вершины производительности
Новые вершины производительности
Новые вершины производительности
Новые вершины производительности
Новые вершины производительности

Причина, по которой Intel вот уже полтора года не спешит поднимать частоту своих процессоров, проста – отсутствие конкуренции в верхнем ценовом диапазоне. Если в массовых сегментах AMD серьезно борется за победу по показателю «единиц производительности на доллар» (что в ответ приводит, например, к появлению трехгигагерцевого E6850 за $266), то рынок энтузиастов полностью принадлежит топовым четырехъядерным CPU от Intel. В случае, если Phenom удастся сдвинуть нынешние модели с трона – у Intel есть в запасе огромный потенциал роста тактовых частот Yorkfield. Рискну утверждать, что уже сегодня, не дожидаясь новых степингов (которые, как всегда, улучшают этот показатель), не составило бы особых проблем запустить в производство QX9xxx с частотой 3,6 ГГц. Откровенно говоря, наличие целого гигагерца стабильной частоты «над головой» у флагманского процессора ненормально, такого не было даже во время максимально отточенной архитектуры NetBurst, отличавшейся высокими абсолютными значениями тактовой частоты. Впрочем, это наглядная демонстрация того, чем же плоха монополия даже в отдельном сегменте. Так что пока обеспеченные оверклокеры ликуют, ожидая появления Core 2 Extreme QX9650 в розничной продаже невзирая на цену, более рациональным потребителям остается лишь... надеяться на успех AMD. От того, насколько удачным получится Phenom, зависит и то, насколько быстро цены на 45-нанометровые процессоры Intel будут падать, а их штатные частоты (откровенно заниженные сейчас по маркетинговым соображениям) – расти.

Что же касается нашего впечатления от QX9650, то оно исключительно позитивно: очень быстрый, не слишком горячий и отлично масштабирующийся по частоте. Чего еще желать?

Конфигурация тестового стенда
Материнская плата ASUS Blitz Extreme (Intel P35)
Охлаждение Thermaltake BlueOrb II; Asetek VapoChill LS [AC]; жидкий азот
Оперативная память OCZ FlexXLC OCZ3FX16002GK (@ DDR3-1333, 7-7-7-21)
Видеокарта ASUS GeForce 8800 Ultra
Жесткий диск Seagate Barracuda 7200.9 80 ГБ
Блок питания Hiper Type-R II 770W
Операционная система Windows XP Professional SP2
Продукты предоставлены
ASUS Представительство ASUS в Украине www.asus.com
Intel Представительство Intel в Украине www.intel.com
Hiper, OCZ, Asetek Nebesa www.nebesa.com
+11
голос

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT