`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Intel Xeon: дуальному Pentium 4 -- быть!

0 
 

В начале 2002 г. одновременно с выходом последнего варианта Pentium 4 Northwood компания Intel выпустила обновленную версию своего CPU для двухпроцессорных рабочих станций и серверов начального уровня -- Xeon, использующий ядро Prestonia (родственное ядру Pentium 4). До этого долгое время многие недоумевали, почему на рынке практически отсутствовали предыдущие варианты Xeon (с ядром Foster), также поддерживающие двухпроцессорные конфигурации. Теперь же, когда Xeon'ы с частотами до 2,2 GHz прошли тестирование в нашей лаборатории, все наконец-то стало на свои места...
Pentium 4 и Xeon: в чем различия?

Intel Xeon дуальному Pentium 4 -- быть!
Процессор Intel Xeon 2,2 GHz (Socket 603), вид спереди и сзади
Intel Xeon дуальному Pentium 4 -- быть!
Назначение ножек разъема Socket 603
Наверняка любой из интересующихся вопросом специалистов знает, что Xeon Foster за глаза называли "Willamette с поддержкой SMP", а Xeon Prestonia -- "Northwood с поддержкой SMP". Это сравнение напрашивается: то, что в основе всех этих CPU лежит одно и то же ядро, как говорится, -- секрет Полишинеля. Что же касается пар "Foster -- Willamette" и "Prestonia -- Northwood", то они изготовляются по одному и тому же технологическому процессу и имеют одинаковые объемы кэш-памяти второго уровня. Да, разъем у этих CPU действительно разный, однако при взгляде на блок-схему распределения сигналов по ножкам процессора формата Socket 603 хорошо видно, что подавляющее их большинство отвечает либо за питание, либо за заземление, т. е. они не являются "значащими". Так что же -- действительно "просто добавили многопроцессорность"? Все-таки нет. Однако почти ничего принципиально нового Xeon на ядре P4 на самом деле не содержит (за исключением разве что технологии Hyper-Threading, появившейся в Xeon Prestonia). Просто в него "перекочевали" некоторые функции, присутствовавшие еще в Pentium III Xeon (Slot 2). На них мы более подробно и остановимся.

Processor Information ROM (P.I. ROM) -- это, как и явствует из названия, доступное для считывания ПЗУ, содержащее сведения о процессоре. В частности, в нем содержатся электрические характеристики ядра и кэша второго уровня, степпинг процессора и электронная подпись (для проверки подлинности?).

Scratch EEPROM -- интересная возможность, которую Intel предоставляет поставщикам оригинального оборудования (OEM). Фактически это просто изначально пустое перепрограммируемое ПЗУ, куда, как указано в спецификации, поставщики могут записывать "whatever data they wish" (любые данные, которые сочтут нужным). Также это ПЗУ может использоваться собственно системой для хранения сведений о компьютере, процессоре, установок по умолчанию и прочей информации. В принципе, многие могут спросить: "а чем оно лучше просто еще одной микросхемы на плате?". Ответ столь же очевиден: ПЗУ представляет собой унифицированное решение, которое присутствует по определению в любой системе на базе Xeon. Именно в этом, как нам кажется, и состоит основная его ценность.

Machine Check Architecture (MCA) -- подсистема процессора, которая отвечает за отслеживание и протоколирование ошибок (faults) при работе системной логики. Отслеживаются ошибки пяти основных подсистем: внешней и внутренней шины, кэша, Translation Look-aside Buffer и Instruction Fetch Unit. Применение MCA может находить самое разное: например, при необходимости информация о сбоях может быть прочитана серверной ОС (с целью попытки автоматического устранения причины ошибок или же информирования администратора). Ну и, естественно, в случае обращения владельца системы в сервисный центр MCA служит серьезнейшим подспорьем для инженеров-ремонтников.

Hyper-Threading -- разработанная Intel технология повышения производительности в многозадачных системах, позволяющая на одном физическом процессоре создавать два логических CPU путем параллельного выполнения двух программных потоков (threads), которые в один и тот же момент времени используют разные блоки процессора (например, ALU и FPU). Эта технология впервые появилась в процессоре Xeon с ядром Prestonia и, судя по всему, будет поддерживаться в будущих серверных процессорах Intel. Безусловно, детальное знакомство с Hyper-Threading заслуживает отдельной статьи. Но эта технология является в основном серверной, а поскольку предмет нынешнего тестирования -- Xeon для рабочих станций, в этот раз подробно останавливаться на Hyper-Threading мы пока не будем.

Основные стремления разработчиков всей серии Xeon (включая сюда же предыдущий P-III Xeon) становятся довольно прозрачными при взгляде на все три дополнительных блока "целиком". Пользователи десктопов, возможно, сочтут их функциональность избыточной, но не стоит забывать, что в данном случае речь идет о совсем другой области применения, где надежность и совместимость являются чуть ли не основными требованиями. Причем избыточность защитных механизмов в данном случае воспринимается намного спокойнее, чем недостаточность.

Возьмем, к примеру, P.I. ROM, содержащий в том числе и такую важную информацию, как электрические характеристики CPU. Да, с известной долей уверенности можно установить процессор новой ревизии в старую системную плату в надежде, что он заработает. А если нет? А если BIOS неправильно определит напряжение питания? Учитывая общую стоимость компонентов high-end-систем, извечное славянское "авось" может обернуться ущербом в несколько тысяч долларов! Поэтому действительно кажется намного более разумным не принуждать систему к попыткам что-то "определять", предоставив ей возможность просто узнать ("спросив" у самого процессора). Что же касается MCA, то этот механизм (опять-таки, может быть, и несколько избыточный) предназначен для того, чтобы защитить процессор или вовремя поднять тревогу даже в том случае, если другие подсистемы компьютера по каким-то причинам не успеют или не смогут этого сделать.

Фактически все эти функциональные блоки служат одной-единственной цели: сделать выход из строя дорогостоящей системы с важными данными почти невозможным. Естественно, такая вероятность невелика и без них, но это именно тот случай, когда за повышение надежности на единицы процентов потенциальный покупатель вполне готов платить даже очень большие деньги. Ибо возможный ущерб все равно во много крат больше.

К слову: из всего вышесказанного становится более понятным основное различие между Pentium III-S и Athlon MP, с одной стороны, и Xeon -- с другой. Первые два -- это фактически модификации десктопных процессоров для SMP-систем, Xeon же содержит блоки, свойственные "большим" серверным CPU. Между прочим, забавное получилось "распределение ролей": ведь не секрет, что именно P-III-S Intel позиционирует как процессор серверный, а текущие версии Xeon предназначаются, по идее, для использования в рабочих станциях.


Чипсет Intel i860

Intel Xeon дуальному Pentium 4 -- быть!
Микросхемы чипсета Intel i860
Intel Xeon дуальному Pentium 4 -- быть!
Структурная схема платы на чипсете Intel i860
Intel Xeon дуальному Pentium 4 -- быть!
Так выглядит PCI-пространство платы на i860, "разложенное" утилитой ICDiag
Хотя чипсет i860 предназначен для производительных рабочих станций, получился он в достаточной степени "серверным". Вкратце его можно было бы охарактеризовать так: это i840 для SMP-процессоров с ядром Pentium 4. Такое достаточно смелое утверждение целиком оправданно, и вот почему. Чипсет использует ту же "хабовую" архитектуру (Accelerated Hub Architecture), знакомую еще со времен i810/i820, работает только с памятью типа RDRAM и имеет двухканальный контроллер памяти (соответственно, модули RIMM устанавливаются парами). Наличествует поддержка 64-битовой PCI, реализованная через отдельный мост Intel 82806AA PCI 64 Hub (Intel P64H).

Набор микросхем Intel i860 предназначен для процессоров Intel Xeon, работающих на частоте шины 100 MHz (использующей, как и все семейство Pentium 4, "учетверенную" пропускную способность, что теоретически эквивалентно частоте 400 MHz). Чипсет состоит из двух хорошо знакомых основных компонентов:
  • Intel 82860 Memory Controller Hub (MCH);
  • Intel 82801BA I/O Controller Hub (ICH2).
Кроме этих двух, возможно использование дополнительных чипов, расширяющих базовые возможности чипсета. Основные параметры i860 следующие:

  • работа с одним/двумя/четырьмя процессорами Intel Xeon (применительно к чипсету, сами же сегодняшние Xeon могут работать только в двухпроцессорных конфигурациях);
  • поддержка до 2 GB RDRAM-памяти;
  • поддержка AGP 4X, Ultra DMA/100/66/33, интерфейса LPC (Low Pin Count) и четырех портов USB (версии 1.1);
  • наличие интегрированного сетевого контроллера 10/100 Mbps -- Intel.
Естественно, будет излишним перечислять поддержку ACPI, Suspend-to-RAM/Disk, Wake-on-LAN и пр. -- все эти возможности неизменно присутствуют, как и в любом современном чипсете.

Но самое, на наш взгляд, примечательное -- это разветвленная структура чипсета, которая поддерживает целых шесть (!) шин PCI. Все они обозначены на структурной схеме чипсета (точнее, это схема основанной на нем материнской платы Supermicro P4DC6+). Для того чтобы "увидеть" все шесть шин PCI, нам пришлось заполнить слоты картами расширения, потому как иначе неиспользуемые сегменты попросту отключались чипсетом. Но после установки дополнительных карт и запуска утилиты ICDiag мы получили картину, где в PCI-пространстве все шесть шин PCI оказались видны как на ладони. Привлекает внимание тот факт, что компоненты системы (SCSI-контроллер, слоты PCI 32-бит и 64-бит) расположены на разных шинах, т. е. потоки данных хорошо разнесены. Стоит ли говорить, насколько важна такая архитектура для системы, где идет активный обмен данными между всеми компонентами... Впрочем, подобная активность более характерна для серверов, почему мы и называем i860 "вполне серверным" чипсетом.

Еще один примечательный факт -- AwardBIOS V6.0 "Medallion", нехарактерный в прошлом ни для "тяжелых" плат, ни для компании Supermicro, тяготевшей до недавнего времени только к продуктам American Megatrends (AMI). Эффект неожиданности несколько приглушает меню CMOS Setup, выполненное в стиле Phoenix Technologies, таком характерном для серверных решений от Intel и Tyan.

Стоит сказать несколько слов о работе с памятью в i860. Видимо, после неудач пары i840+SDRAM Intel не стала в этот раз "выводить гибрид" и обеспечивать возможность работы i860 с SDRAM-памятью. Да и большого смысла в этом не было: во-первых, цены на RDRAM упали до вполне приемлемых значений, а во-вторых, использование PC133 SDRAM наповал убило бы всю производительность процессоров Xeon, хоть и предназначенных для систем класса "Performance Workstation". Что же касается максимально поддерживаемого объема памяти, то хотя штатным значением является 2 GB, есть возможность довести его до 4 GB. Достигается это путем использования двух микросхем Intel 82803AA MRH-R (Memory Repeater Hub -- RDRAM), устанавливаемых на материнской плате "между" чипом Memory Controller и двумя каналами памяти.


Плата Supermicro P4DC6+

Intel Xeon дуальному Pentium 4 -- быть!
Материнская плата Supermicro P4DC6+ на чипсете Intel i860
Intel Xeon дуальному Pentium 4 -- быть!
Разъем SO-DIMM на плате Supermicro P4DC6+ для установки контроллера Zero Channel RAID
Компания Supermicro, одна из немногих выпустившая материнские платы на i860, имеет в своем арсенале три двухпроцессорные модели на этом чипсете под Socket 603 : P4DCE, P4DC6 и P4DC6+. Все они выполнены на основе общего дизайна в формате Extended ATX, поддерживают до 2 GB RDRAM-памяти (четыре разъема под модули RIMM), имеют одинаковый набор слотов (AGP 4X/Pro 1,5 B, два слота PCI 64-bit/66 MHz и четыре PCI 32-bit/33 MHz) и интегрированный сетевой адаптер -- Intel 82559. Первая из них, P4DCE, не содержит SCSI-контроллера, а плата P4DC6 поставляется с интегрированным Ultra 160 SCSI-чипом Adaptec AIC-7899W. Третья модификация, P4DC6+, дополнительно к SCSI-контроллеру содержит разъем SO-DIMM для установки карты Adaptec 2005S -- недорогого контроллера Zero Channel RAID (ZCR), использующего интегрированный SCSI-чип. Еще одним отличием трех плат является то, что у P4DCE и P4DC6 блоки VRM выполнены в виде отдельных дочерних карт. В то же время у Supermicro P4DC6+, которую мы применяли для тестов Intel Xeon, компоненты обоих VRM расположены прямо на плате.

P4DC6+ выполнена очень аккуратно, с удачным расположением компонентов. Есть несколько перемычек, отключающих интегрированные сетевой и SCSI-контроллер или задающие частоту 64-битового сегмента PCI (33/66 MHz). Заметим, что интегрированная графика, характерная для серверных плат, отсутствует, и это еще раз свидетельствует о нацеленности на рабочие станции. Отличительная черта всей линейки моделей Supermicro на i860 -- использование одного 8-контактного или двух (4- и 8-контактного) дополнительных разъемов питания. Как было сказано выше, оказалось достаточно непривычным видеть AWARD BIOS на плате от Supermicro.

Традиционно для компании с платой P4DC6+ поставляются два кулера для процессоров (в данном случае с вертикальными ребрами и прикрепленным сбоку вентилятором) -- достаточно шумные (4700 об/мин, 16.2 CFM), но весьма эффективные. Также в комплект входят шлейфы (FDD, IDE, 50-контактный и длинный 68-контактный SCSI), планка для задней панели корпуса, CD-ROM и дискеты с драйверами, а также весьма толковое руководство пользователя.

Известно, что кроме Supermicro еще две компании -- Iwill и Tyan -- выпустили платы на чипсете i860, однако на нашем рынке эти модели пока недоступны.


Конфигурации систем и методика тестирования

Так уж получилось, что "новый" и "старый" Intel Xeon попали в нашу лабораторию практически одновременно, в результате чего образовалась линейка процессоров с частотами 1,7 GHz (Foster), 1,8 и 2,2 GHz (Prestonia). В итоге мы получили возможность не только протестировать старший из линейки Xeon, но и сравнить производительность Foster и Prestonia на близких (хотя и не совсем равных) тактовых частотах. Наверняка читатели заметят аналогию со сравнением двух модификаций Pentium 4 (Willamette и Northwood), которое мы проводили в середине января. Естественно, в этот раз тестировались двухпроцессорные системы, потому что именно поддержка SMP является основным преимуществом Xeon. Но устоять перед соблазном было нелегко, и мы включили в тесты однопроцессорную систему с Pentium 4 2,2 GHz -- было крайне любопытно, как соотносится производительность Xeon и Pentium 4, имеющих одинаковые тактовые частоты и очень похожие ядра.

В качестве "наиболее вероятного противника" выступала дуальная система с процессорами Athlon MP 1900+, собранная на базе хорошо известной платы Tyan Thunder K7. Кроме того, мы включили в тесты еще одну систему -- на базе Pentium III-S 1,26 GHz (ядро Tualatin, 512 KB L2-кэша) и платы на чипсете ServerWorks ServerSet III HE-SL. У кого-то это может вызвать удивление, ведь сколько раз мы ругали в общем-то хороший чипсет за отвратительную драйверную поддержку со стороны ServerWorks. В частности, это приводило практически к полной неработоспособности AGP, из-за чего использовать такие платы для графических станций было почти невозможно. Дошло до того, что Tyan вообще убрала AGP-порт при разработке новой ревизии своей платы на чипсете ServerSet III HE-SL -- Thunder HEsl-T.

Однако то, чего не сделала ServerWorks, сделала... Microsoft. Как выяснилось, Windows XP (а точнее, еще Windows 2000 начиная с Service Pack 2) научилась "понимать" этот чипсет. И как бы удивительно это ни звучало, но AGP-порт на ServerSet III HE-SL заработал нормально, после чего платформа в один миг стала полноценным решением для графических станций. Соответственно, она также была включена в тесты -- в конце концов, как мы писали в упомянутой выше статье, никто не запрещает использовать "серверный" процессор Pentium III-S в рабочих станциях, были бы только подходящие материнские платы. Благо, они есть: Supermicro оставила AGP-порт в плате P3TDE6, которая и стала основой одной из тестовых систем. Ну а в качестве операционной системы для всех платформ использовалась именно Windows XP Professional.

Конфигурации тестовых систем
CPU Intel Xeon Intel Pentium 4 Intel Pentium III-S AMD Athlon MP
Ядро Foster Prestonia Northwood Tualatin Palomino
Частота 1,7 GHz 1,8 GHz 2,2 GHz 2,2 GHz 1,26 GHz 1900 + (1600 MHz)
Частота FSB, MHz 400 400 400 133 266
L1-кэш, KB 16 16 16 32 128
L2-кэш, KB 256 512 512 512 256
Чипсет Intel i860 Intel i850 ServerSet III HE-SL AMD-760MP
Материнская плата Supermicro P4DC6+ Intel D850MD Supermicro P3TDE6 Tyan Thunder K7
Память 512 MB PC800 RDRAM 512 MB Reg'd PC133 SDRAM 512 MB Reg'd DDR SDRAM
Видеокарта NVidia GeForce3 (ASUS V8200, 64 MB DDR SDRAM, Detonator 21.85)
Жесткий диск Seagate Cheetah X15 36LP, 36,4 GB, Ultra 160 SCSI
ОС Windows XP Professional


Таким образом, в этом тесте в очередной раз собрались "топовые" (в случае Athlon MP добавим -- из доступных) процессоры для разных платформ. Все системы оснащались одинаково (см. таблицу): 512 MB памяти соответствующего типа, 36-гигабайтовый SCSI-винчестер Seagate Cheetah X15 36LP и AGP-видеокарта на базе GeForce3. Надеемся, наших читателей не смутит такой выбор для графической подсистемы рабочей станции -- как известно, эта в общем-то "игровая" видеокарта достаточно неплохо справляется с профессиональным OpenGL, использующимся в workstation-задачах.

В качестве тестов применялась наша стандартная методика оценки производительности "тяжелых" систем с некоторыми дополнениями. Были задействованы приложения следующих классов:
  • работа с 2D-графикой (скрипт для Adobe Photoshop 6.0.1);
  • трехмерное моделирование -- 3D Studio MAX 4.26, Lightwave 7b и A|W Maya 4.0.1;
  • 3D-визуализация с использованием профессионального OpenGL (SPEC ViewPerf 6.1.2);
  • кодирование DivX и MP3 (DivX 4.12 и GOGO-no-coda 2.39c), архивирование (WinAce 2.11 со словарем 4096 KB).
Кроме того, мы включили в методику два CAD-теста с использованием конструкторско-инженерных приложений SolidWorks 2001 и Solid Edge V10. Изобретать велосипед мы не стали и задействовали стандартные тесты SPECapc for SolidWorks 2001 и SPECapc for Solid Edge V10. Сути этих тестов мы коснемся ниже, при анализе результатов тестирования, к которому и переходим.


Результаты тестов

Помнится, мы не раз высказывали недоумение по поводу того, что Intel, давным-давно выпустившая Xeon "Foster", не особо спешила начинать его массовые поставки. Да, крупные сборщики уровня Compaq и Dell обеспечивались процессорами и выпускали двухпроцессорные рабочие станции на Xeon. Но в массовой продаже чипы практически не появлялись, и за редкими исключениями не доходили до Украины (впрочем, как и до России) -- несмотря на то, что спрос на них появился уже давно.

Теперь же, глядя на диаграммы с результатами тестов, становится вполне понятно, почему Intel не особо торопилась с продвижением Xeon. Сравнительно невысокая производительность Xeon Foster могла бы изрядно подпортить репутацию новому семейству, поэтому массовое продвижение было отложено до выхода Xeon Prestonia -- 0,13-микронного процессора с удвоенным кэшем (объем которого, как известно, весьма существенен для ядра Pentium 4) и ощутимо более высокой производительностью.


Кодирование видео и аудио, архивация

Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Для DivX, похоже, основным критичным параметром является скорость работы с памятью (точнее, именно она является узким местом). Иначе трудно объяснить одни и те же результаты всех процессоров на ядре P4 -- частоты у них различаются (по максимальному разрыву) на 500 MHz, а показатели -- практически одинаковые. Значит, нужно искать, какой компонент в этих системах не меняется, и мы получим ответ, во что "уперлась" производительность. Поскольку видеокарта на кодирование одного формата в другой (фактически -- считывание данных их файла, преобразование "внутри" процессора и запись в другой файл) влиять никак не может, остается память -- двухканальная PC800 RDRAM или... жесткий диск! Впрочем, последнее предположение опровергают результаты Athlon MP и Pentium III-S -- они все-таки существенно хуже, чем у конкурентов. Но еще более интересно другое. Как легко заметить, мы оставили в этой диаграмме и одно-, и двухпроцессорные системы, несмотря на то, что кодек DivX не поддерживает SMP. Сделано это было специально, поскольку обнаружилась одна интересная особенность: если SMP-системам на базе "классических" ядер, наследников архитектуры Pentium Pro (Pentium III-S и Athlon MP), многопроцессорность даже немного помогает, то в случае всех Xeon (ядро P4) -- она мешает! Конечно, весьма несущественно мешает, но, согласитесь, -- факт забавный, из серии "а вот бывает и так!".

С кодеком GOGO дела обстоят проще: как и во многих других приложениях, "звездная группа чемпионов" состоит из Pentium 4 2,2 GHz (в случае с однопроцессорными конфигурациями), Xeon 2,2 GHz и Athlon MP, идущих примерно наравне. А вот с "младшенькими" Xeon вплотную "схлестнулся" уже Pentium III-S, лишний раз доказывая, что существуют приложения, в которых старый конь борозды не испортит, а молодой... скажем так, может и запутаться.

Результаты WinAce (мы приводим данные только для однопроцессорных систем ввиду их полной идентичности дуальным конфигурациям) довольно оригинальны: пожалуй, впервые за время тестирования система на базе Athlon MP проиграла всем без исключения. Предположений по поводу возможных причин можно сделать массу, однако напрашивается одно: если WinAce использует SSE, то он мог просто не обнаружить поддержку этого дополнительного набора инструкций у Athlon MP, такие случаи иногда происходят с программами, написанными не очень грамотно (сначала они проверяют производителя CPU и просто отказываются выяснять ситуацию с поддержкой SSE, если это не Intel). Впрочем, это лишь одно из предположений...


Программы 3D-моделирования

Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Мы решили объединить комментарии к результатам всех трех программ для 3D-моделирования, которые использовались в тестах, поскольку в них явно больше сходств, чем различий. Почти везде на первом месте оказывается одно- и двухпроцессорная система на базе Xeon 2,2 GHz, за исключением 3D Studio MAX 4.2, где она демонстрирует примерно одинаковую производительность с системой на базе Athlon MP 1900+. Последний по скорости в остальных приложениях делит второе место с Xeon 1,8 GHz, иногда его обгоняя, что еще раз подтверждает относительную "правильность" рейтингового наименования, принятого AMD для своих процессоров. Небольшим "откровением" стали результаты быстродействия систем в пакете LightWave 7b. Наши читатели, наверное, помнят, что в LightWave 6.5 процессоры Athlon XP/MP оказались существенно быстрее Pentium 4, сейчас же ситуация полностью изменилась. Впрочем, NewTek (компания--разработчик пакета) не скрывает, что седьмая версия была существенно переделана, и именно с учетом особенностей архитектуры новых процессоров Intel. Также легко заметить, что Pentium 4 2,2 GHz везде идет наравне с однопроцессорной системой на базе Xeon 2,2 GHz, что еще раз косвенно подтверждает их большое сходство на уровне ядра. Что же касается Pentium III-S, то он кое-где успешно "тягается" с Xeon "Foster" 1,7 GHz, за исключением LightWave (при рендеринге сцены без ray-tracing).


Растровая графика
Intel Xeon дуальному Pentium 4 -- быть!

Adobe Photoshop последней версии, несмотря на выход модифицированных фильтров с поддержкой SSE2 для процессоров на ядре Pentium 4, новое ядро от Intel "не сильно любит", отдавая предпочтение классическому Pentium III и... Athlon MP от AMD! Хотя за счет частоты новым процессорам Intel все же удается вырвать пальму первенства из рук конкурента -- двухпроцессорная система на Xeon 2,2 GHz победила в общем зачете, правда, с минимальным отрывом от дуального Athlon MP. Хотелось бы в очередной раз отметить, что в среднем (т. е. если использовать не одну-две функции, а полный набор команд и фильтров Photoshop, что и реализовано в нашем скрипте) выигрыш от SMP в этой программе невелик. Впрочем, это во многом обусловлено самой концепцией данного графического редактора: большинство фильтров представляют собой подключаемые модули (plugins), причем разработанные зачастую даже не самой Adobe. Естественно, при такой "разношерстности" исполняемого кода на существенную его оптимизацию под SMP рассчитывать не приходится. Скорее всего, какой-то выигрыш присутствует за счет того, что некоторые модули способны задействовать второй процессор, а мал этот выигрыш потому, что количество их в общей массе невелико.


SPEC ViewPerf

Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
В диаграммах с результатами SPEC ViewPerf мы приводим показатели производительности только однопроцессорных систем. Это решение было принято по простой причине -- результаты тех же стендов после установки на них второго CPU были практически такими же либо более низкими. Что, впрочем, не вызывает удивления -- данный тест, как и большинство OpenGL-приложений, практически не получает выигрыша от SMP.

AWadvs-04. Подтест, результаты которого комментировать проще всего. Почти все системы идут вровень, и лишь Pentium III-S в комбинации с чипсетом ServerWorks ServerSet III HE-SL отстал на 22%. Причины этого понятны, и мы говорили о них не раз: приложениям для визуализации, активно задействующим OpenGL и текстурирование, уже не хватает пропускной способности памяти стандарта PC133. Другой вывод менее очевиден, но на нем тоже имеет смысл остановиться: а вот PC2100 DDR SDRAM (система на базе Athlon MP + AMD-760MP) все еще в состоянии выдержать требуемую нагрузку, хотя и проигрывает по пропускной способности двухканальной PC800 RDRAM в системах на основе i850/i860.

DX-06. Мы не приводим результатов этого теста, хотя он и был выполнен. Дело в том, что замеченная нами ранее еще при исследовании производительности Pentium 4 Northwood особенность ядра IBM Data Explorer (положенного в основу DX-06) опять дала о себе знать: все процессоры на ядре P4 с кэш-памятью второго уровня объемом 512 KB оказались медленнее тех, у которых объем L2-кэша равен 256 KB. Если бы подобная ситуация повторялась еще в каком-либо приложении, то можно было бы говорить о тенденции, но поскольку DX-06 оказался в "гордом одиночестве", мы просто сделали вывод о нецелесообразности использования этого теста для оценки производительности процессоров на ядре Northwood/Prestonia, ибо на их результаты явно влияет какая-то ошибка в коде программы.

DRV-07. Судя по нашей статистике использования этого подтеста, он в большей степени, чем другие составляющие SPEC ViewPerf, может претендовать на роль "комплексного", т. е. на результаты влияет и производительность ядра CPU, и быстродействие подсистемы памяти, и скорость 3D-акселератора. В данном случае места распределились вполне в соответствии с нашими представлениями: верхнюю строчку таблицы занимают системы на базе ядра Northwood/Prestonia, но с другой -- разница между их производительностью невелика (видимо, узким местом становится видеокарта). Xeon "Foster" 1,7 GHz существенно проигрывает (скорее всего, за счет вдвое меньшего объема кэша второго уровня). А вот Athlon MP 1900+ показал не самый высокий результат по другой причине -- все-таки пропускная способность PC2100 DDR SDRAM (2,1 GBps) существенно ниже, чем у двухканальной PC800 RDRAM (3,2 GBps). Что же касается системы на базе Pentium III-S, то она проиграла по совокупности всех возможных причин -- самая маленькая частота работы ядра плюс самая медленная память.

MedMCAD-01. А вот в данном случае явно наблюдается тот же эффект "бутылочного горлышка", что и в случае с AWadvs-04, -- практически все системы "уперлись" в производительность графического акселератора, и лишь Pentium III-S с памятью PC133 существенно отстал. Впрочем, некоторая разница между Athlon MP и системами с процессорами на ядре P-4 есть, и, стоит отметить, не в пользу первого.


CAD-приложения (инженерное проектирование)

Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Intel Xeon дуальному Pentium 4 -- быть!
Несмотря на то что мы использовали для проведения тестов два пакета от абсолютно разных производителей, результаты их настолько похожи, что нет смысла отдельно комментировать быстродействие систем в SolidWorks 2001 и Solid Edge V10. Так как в обоих случаях использовались тесты от SPEC (Standard Performance Evaluation Corporation), категории, на которые разбита оценка производительности, в обоих случаях применяются одинаковые. Мы остановили свой выбор на трех из них: Composite Score (общий балл), Graphics Score (интегральная оценка быстродействия графической подсистемы) и CPU Score (собственно, скорость процессора).

Composite Score. В обоих пакетах первые места занимают системы на базе Pentium 4 2,2 GHz (в однопроцессорном классе), Xeon 2,2 GHz и Athlon MP, в то время как Xeon 1,7 GHz и Pentium III-S оказываются в хвосте. Xeon 1,8 GHz в SolidWorks немного вырвался вперед, так что применительно к этому пакету можно говорить о наличии второго и третьего места, а вот Solid Edge между 1,7 и 1,8 GHz Xeon разницы практически не чувствует, несмотря на то, что у последнего кэш второго уровня в два раза больше. Кстати, по общему баллу очень хорошо заметно, что SMP-оптимизация в пакетах практически отсутствует -- скорость двухпроцессорных систем больше, чем у однопроцессорных, на считанные доли процентов. Честно говоря, странно и даже немного обидно -- уж где-где, а в CAD-приложениях, по идее, каждый мегагерц должен быть на счету, и отсутствие задействования возможностей второго CPU в такого класса приложениях выглядит странно.

Graphics Score. Как ни удивительно, именно в этой категории сильнее всего ощущается разница в производительности между системами... на разных CPU! Вот уж действительно, не поймешь, что к чему имеет отношение в компьютерной отрасли: видеокарта во всех тестах использовалась одна и та же, а скорость графической подсистемы на разных конфигурациях отличается иногда почти в два раза. Впрочем, лидеры в этом подтесте не сменились, а даже еще больше обогнали остальных конкурентов -- снова в первых рядах Pentium 4 2,2 GHz, Xeon 2,2 GHz и Athlon MP.

CPU Score. Здесь "мнения" приложений разделились. Solid Edge явно тяготеет к классической процессорной архитектуре -- Pentium III-S по производительности вычислительной подсистемы даже превзошел Athlon MP, работающий на существенно большей частоте (впрочем, не будем забывать о том, что у P-III-S в два раза больше кэш второго уровня). Обогнать же его удалось только Xeon 2,2 GHz, который и занимает первое место. Как нам кажется, сыграл свою роль и большой объем L2 у этих процессоров. "Взгляды" SolidWorks 2001 оказались более "современными" -- в нем лидирует наша стандартная тройка: Pentium 4 2,2 GHz, Xeon 2,2 GHz и Athlon MP.


Выводы

Особых чудес не произошло, да их никто и не ждал. Просто Intel после достаточно затянувшейся паузы выпустила новый процессор для дуальных систем, который без преувеличения можно назвать удачным. Вряд ли здесь необходимы развернутые комментарии: отныне есть такой же высокопроизводительный процессор от Intel, как и Pentium 4 (поддерживающий SSE/SSE2, имеющий достаточно объемный L2-кэш и обладающий вполне умеренным тепловыделением), но теперь поддерживающий и SMP. Также есть довольно мощный чипсет Intel i860, позволяющий строить современные и сбалансированные системы, и есть качественные и мощные платы на нем, в чем мы убедились на примере Supermicro P4DC6+. Можно с уверенностью сказать, что с началом поставок Intel Xeon выбор платформы для производительных рабочих станций (да, в общем-то, и для двухпроцессорных серверов) станет значительно проще.

Впрочем, стоит четко понимать один момент: сборка и покупка однопроцессорных систем на базе Xeon лишена всякого смысла. Производительность однопроцессорных компьютеров на базе Xeon и Pentium 4 фактически одинакова, поэтому у значительно более дорогой (и за счет процессора, и за счет материнской платы) платформы Xeon+i860 в этом случае не будет никаких преимуществ. Вместе с тем двухпроцессорная система на базе Xeon во многих приложениях показывает практически удвоенное быстродействие по сравнению с Pentium 4 "Northwood" той же частоты -- а это, согласитесь, очень немало.

Что же до конкуренции Xeon с другими workstation-платформами -- здесь, как нам кажется, все достаточно просто. "Серверный" Pentium III-S 1,26 GHz смотрится на фоне Xeon уже довольно бледно, и хотя в некоторых приложениях эта платформа почти на равных конкурирует с Xeon 1,8 GHz, но в большинстве случаев недостатки архитектуры ощущаются очень сильно. Положение же Athlon MP, производительность которого вполне сравнима с Xeon, остается несколько неопределенным: казалось бы, многие производители материнских плат объявили о планах поддержки дуальных Athlon и готовящемся выпуске плат на AMD-760MPX. Однако воз и ныне там, платы по-прежнему доступны только от Tyan, а это не может не сдерживать распространение платформы.

Судя по всему, обновленный Xeon с ядром Pentium 4 ждет большое будущее. В течение этого года появятся новые версии процессора, работающие на частоте FSB 533 MHz, и чипсеты с поддержкой DDR-памяти. Кроме того, в течение первого квартала 2002 г. выйдет версия Intel Xeon, оснащенная кэшем третьего уровня и поддерживающая 4-процессорные конфигурации. Можно сказать, что новая эра двух- и вообще многопроцессорных систем от Intel началась, и началась успешно.

Оборудование для подготовки материала предоставлено:
Процессоры Intel Xeon, материнские платы Supermicro "Оникс" (044) 205-5567
Процессор Pentium 4 2,2 GHz, материнская плата Intel D850MD Украинское представительство Intel (044) 490-1221
Процессоры Pentium III-S 1,26 GHz "ELKO-Киев" www.elko.kiev.ua
Процессоры Athlon MP K-Trade (044) 252-9222
Модули памяти RDRAM (Samsung) MTI (044) 458-3434
Модули памяти Registered PC133 ECC, жесткие диски Seagate Cheetah X15 36LP "ASBIS-Украина" www.asbis.com.ua
Материнская плата Tyan Thunder K7, модули памяти Reg'd PC2100 DDR SDRAM Entry (044) 246-8462
0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT