`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Quo vadis, Pentium 4?

0 
 

"Давненько не брал я в руки шашек", как говаривал небезызвестный герой Гоголя. Давненько не было у нас полномасштабных обзоров новых процессоров, и вот представился замечательный случай в виде инженерного сэмпла выходящего в апреле этого года процессора Intel Pentium 4 2,4 GHz. Однако делать еще один "развернутый комментарий к диаграммам" почему-то не хотелось.. Тем более что говорить о производительности применительно к моделям CPU сейчас стало практически бессмысленно. Pentium 4? А какой именно? С частотой 1,4 GHz или 2,4 GHz? На ядре Willamette или Northwood? С памятью RDRAM или DDR?..
Pentium 4 и масштабируемость

Само понятие масштабируемости применительно то ли к компьютеру или архитектуре целиком, то ли к одной из составляющих системы до сих пор четкого определения "в умах" не имеет. Почему мы оговорились "в умах"? Да потому, что несмотря на наличие определения формального, каждый специалист трактует его для себя по-своему. Мы в данном случае будем понимать под масштабируемостью процессора Intel Pentium 4 увеличение производительности системы с прочими неизменными характеристиками (чипсет, память, жесткий диск, видеокарта) при установке в нее CPU с более высокой тактовой частотой. Причем волновать нас будут три вопроса.
  • Как вообще соотносится увеличение частоты работы ядра с повышением реального быстродействия системы в случае использования процессора Intel Pentium 4?
  • Не наблюдается ли тенденция к уменьшению прироста производительности с увеличением частоты, если да, то каков предположительный предел, за которым рост частоты перестанет влиять на скорость вообще?
  • Ну и наконец, каковы перспективы подсистемы памяти на базе PC2100 (DDR266) -- достаточно ли она производительна для данных CPU и не становится ли "бутылочным горлышком" для верхних моделей Pentium 4?
Почему мы считаем эти вопросы важными? Здесь необходим небольшой исторический экскурс. Как легко заметить, компания Intel "расстается" со своими любимыми x86-архитектурами в общем-то достаточно радикально. Когда Pentium приходил на смену 486, конкуренты еще довольно долгое время занимались "доводкой" старой архитектуры -- выходили так называемые "586-е" процессоры, содержащие в себе признаки ядра нового поколения, но совместимые со старыми платами, увеличивались частота и коэффициент умножения "стандартных 486" и т. д. и т. п. Intel же "четко сказала -- нет!" -- компания сразу стала ориентироваться на то, что магистральным продуктом является Pentium, а все остальное -- старые, не соответствующие требованиям сегодняшнего дня решения, от которых необходимо отказаться, причем чем скорее -- тем лучше. Время показало, что Intel оказалась права: конкуренты, возившиеся со старой архитектурой, дали Intel ощутимую фору. Поэтому когда Pentium стал стандартом де-факто, несколько лет компания могла чувствовать себя совершенно спокойно: у нее уже готовились разработки процессорных ядер следующего поколения, в то время как конкуренты только заканчивали проектирование своих первых Pentium-совместимых CPU. Фактически Intel оказалась "на коне" за счет того, что действительно безошибочно предугадала тот ключевой момент, когда индустрия уже "недовольна" быстродействием систем сегодняшнего дня и многие согласны платить деньги (пусть и немалые) за нечто более быстрое и совершенное. Когда аналогичная ситуация повторилась с платформой Pentium II -- никто уже и не удивлялся. Правда, "ворчания" по поводу не очень удобных для индустрии переходов с сокета на слот и потом обратно на сокет было довольно много, но это все же было именно ворчание, т. е. Intel "журили", но правоту ее особым сомнениям не подвергали.

Итак, мы наблюдаем, что несмотря на часто раздающиеся обвинения Intel в излишнем консерватизме, "хоронит" старые процессоры эта компания весьма быстро, и даже, можно сказать, несколько безапелляционно. До сих пор эта политика себя оправдывала потому, что ее инженерам удавалось находить действительно прогрессивные решения (пусть даже их прогрессивность понималась не всеми и не сразу), которые обеспечивали довольно старой в общем-то архитектуре еще четыре-пять лет жизни, причем со стабильным ростом общей производительности систем. Сейчас на роль "могильщика старого мира" Intel выдвигает Pentium 4, но ни для кого не секрет, что как благодаря стараниям конкурентов, так и из-за общей ситуации в индустрии этот самый "старый мир" умирать почему-то не торопится, мало того -- даже собственные процессоры Intel (Pentium III и особенно Celeron) являются не менее жестокими конкурентами Pentium 4, чем процессоры AMD и VIA. Именно поэтому исследование масштабируемости систем на основе Intel Pentium 4 сейчас так необходимо. Естественно, большинству, наверное, хотелось бы, чтобы Intel снова "оказалась права". Хотя бы потому, что в производство плат и чипсетов для Pentium 4 вложены немалые деньги. С другой стороны, былого безраздельного господства на рынке у компании уже нет, и все чаще даже самые верные сторонники присматриваются к альтернативным архитектурам. Поэтому имеет смысл не гадать на кофейной гуще, а просто попытаться понять: а может ли Pentium 4 претендовать на роль перспективной архитектуры в принципе? Не как некая поименованная совокупность маркетинговой и рекламной политики крупнейшего производителя CPU, а именно как x86-процессор? В этой статье мы попытаемся если не дать ответ на этот вопрос, то хотя бы приблизиться к нему.


Pentium 4 и конкуренты

Итак, позиция Intel ясна. Однако, как уже было сказано выше, конкуренты ее "не дремлют" и тоже предлагают решения, вполне способные продемонстрировать как высокое быстродействие, так и очень хорошее соотношение цена/производительность. На каких же "фронтах" идет соперничество и чем отличаются подходы двух основных соперников сегодняшнего дня -- Intel и AMD? Здесь будет вполне уместным остановиться на основных принципиальных отличиях двух процессорных ядер -- Pentium 4 и Athlon (ввиду того что последнее на самом деле представлено целой плеядой CPU -- Athlon, Duron, Athlon XP, Athlon MP, мы для краткости будем называть это ядро по имени родоначальника -- т. е. просто Athlon). Итак, каковы же основные козыри Pentium 4?

"Мегагерцы". Причем здесь имеет смысл говорить не столько о том, что этот процессор превосходит всех остальных конкурентов по частоте на данный момент, сколько о том, что именно в расчете на очень высокую частоту работы ядра он изначально и проектировался. Грубо говоря, Intel отказалась от попыток существенного увеличения количества инструкций, исполняемых за такт, в пользу стремительного роста этих самых "тактов" на единицу времени. Сделано это было за счет удлинения конвейера и выноса за его пределы блока, декодирующего стандартные x86-инструкции в RISC-подобный микрокод.

SSE2. Новый (и уже который по счету!) дополнительный набор SIMD-инструкций, призванный по возможности избавить программистов от реализации наиболее часто употребляемых алгоритмов обработки потоковых данных с помощью отдельных подпрограмм или задействования инструкций FPU. SIMD (Single Instruction -- Multiple Data, одна команда, оперирующая большим объемом данных) -- весьма специфический вид команд, изначально не претендующий на универсальность. Соответственно, в процессор была введена мощная подсистема, позволяющая ему показывать очень высокую скорость в некоторых типах задач. И, естественно, когда где-то "прибавляется", где-то неизбежно "отнимается" (ибо размер кристалла не безграничен) -- на сегодня новый процессор Intel уже не является чемпионом по количеству исполняющих блоков "обычного" x87 FPU. На самом деле, такой подход весьма опасен для универсального CPU, так как расчет фактически делается на то, что успех процессора будет обеспечен за счет доминирования на рынке (и в компьютерах пользователей) определенного типа программного обеспечения. Однако, как ни странно, этот подход для Intel совершенно не нов -- компания уже однажды сделала ставку на "одни команды против других", введя в состав Pentium мощный FPU (именно тот, который сейчас "подвинули" за счет блока исполнения инструкций SSE2) и противопоставив его быстрым целочисленным блокам конкурентов (AMD и Cyrix). В тот раз Intel удалось убедить производителей ПО в необходимости использования аппаратного FPU. В этой раз ей предстоит сделать то же самое применительно к набору инструкций SSE2.

Быстрая процессорная шина. И опять-таки не секрет, что 400 MHz Quad Pumped Bus, используемая в Pentium 4, является самой быстрой процессорной шиной из всех современных x86 CPU. Причем вряд ли Intel разработала этот мощный канал поступления данных (максимальная пропускная способность -- 3,2 GBps!) только для того, "чтобы было чем похвастаться". Именно такая шина и нужна процессору со сверхдлинным конвейером и очень большой частотой работы ядра, потому что только она в состоянии загрузить этот CPU и свести к минимуму простои, связанные с ожиданием поступления данных из медленной памяти. Кстати, о памяти -- мы не зря выбрали для этих тестов систему на базе чипсета i845B0 с поддержкой PC2100 (DDR266) SDRAM. Да, конечно, пара i850 + PC800 RDRAM все еще является более предпочтительным с точки зрения производительности решением. Однако уже, кажется, всем без исключения понятно, что истинно массовым процессор Pentium 4 начал становиться именно тогда, когда системы на его основе стало возможным оснащать другими типами памяти. Поэтому тестирование в рамках данной статьи можно условно назвать "реально-рыночным" -- мы рассматриваем не некую идеализированную с точки зрения производительности систему на базе Pentium 4, а именно тот ее вариант, с которым, скорее всего, придется иметь дело всем нам сегодня и завтра.

Однако вернемся к теме конкуренции. Какие же ключевые особенности процессорного ядра Athlon "противостоят" концепциям, заложенным в Pentium 4?

Большое количество исполняемых за один такт инструкций. В общем-то, в данном аспекте противостояние Athlon и Pentium 4 является довольно традиционным и укладывается в общую концепцию противостояния процессорных архитектур от Intel и AMD. Последняя всегда немного отставала в технологическом плане -- за "0.xx-микронностью от Intel" угнаться тяжеловато, поскольку такой тип усовершенствования CPU является весьма емким не только с научной и интеллектуальной точки зрения, но и с чисто финансовой. AMD оставалось совершенствовать внутреннюю структуру ядра, пытаться сделать его более "умным", чтобы даже при более низкой частоте ее процессоры могли быть конкурентоспособными с точки зрения производительности. Athlon всего лишь продолжил эту традицию, что, впрочем, неудивительно -- у каждого производителя существуют свои фундаментальные разработки, на доводку которых ушел не один десяток лет, и отказываться от них бессмысленно и расточительно. AMD еще со времен 5x86 занимается совершенствованием способов "выжать" из CPU максимум исполняемых за один такт инструкций, и эта концепция нашла отражение и в самом новом ее процессорном ядре.

Рекордное количество исполнительных блоков "классического" FPU. Три исполняющих блока x87-инструкций -- это для x86-архитектуры своеобразный рекорд. Так и хочется сказать: "AMD отыгралась за долгие годы" -- ранее ее процессоры содержали всего один блок FPU против двух у CPU Intel, и именно это было основной причиной катастрофического отставания AMD K5 от Pentium и K6/K6-2 от Pentium II/III в вычислительных задачах, играх и мультимедийном ПО. Однако не стоит забывать о сказанном выше про SSE2 -- Intel явно стремится "выбить табуретку из-под ног AMD", стимулируя производителей ПО к отказу от применения x87-инструкций и переходу (где только это возможно) на использование своих SIMD-инструкций нового поколения. Однако это -- в будущем, сейчас же мощь FPU "от AMD" является весьма важным козырем Athlon, ведь еще далеко не во все программы успели встроить поддержку SSE2.

Процессорная шина, ориентированная на DDR-технологию. Вот здесь AMD, изначально сделавшая ставку на DDR, оказалась впереди. Intel, долгое время продвигавшая RDRAM, фактически уступила давлению рынка, и, как и всякая уступка, это несколько "поломало" планы компании, вынудив ее переориентироваться буквально "на лету". В данный момент используемая в Athlon процессорная шина EV-6 с пропускной способностью, эквивалентной частоте 266 MHz, является идеальным компаньоном для PC2100 DDR SDRAM, функционирующей на той же частоте, в то время как Pentium 4 с его 400-мегагерцевой системной шиной работает с этим наиболее распространенным в производительных десктопах типом памяти в асинхронном режиме. Впрочем, реакция Intel, нужно сказать, оказалась весьма быстрой: в самом недалеком будущем мы увидим обновленный Pentium 4 с 533-мегагерцевой (133 4) системной шиной, кратной фактической частоте шины памяти DDR266 (133 MHz).


Методика тестирования

Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Quo vadis, Pentium 4?
Мы уже не раз писали, что от практики оценки производительности high-end-процессоров в офисных задачах или же в играх мы с некоторых пор решили отказаться. Какое количество от общего числа потенциальных потребителей высокоуровневых моделей CPU покупает их для того, чтобы работать в Microsoft Word или же играть в Quake? Как нам кажется -- ничтожно малое. Можно даже предположить, что оно вообще близко к нулю. Тем более что в случае с играми производительность все больше замыкается на видеокарту, и даже самый мощный процессор не даст такого существенного прироста, как более современный и быстрый 3D-акселератор. Поэтому дальнейшее усовершенствование нашей методики будет проводиться в двух направлениях: поиск реальных ресурсоемких задач, ориентированных на профессиональную работу с компьютером и позволяющих измерять производительность систем при работе с ними, и исследования в области низкоуровневых тестов различных подсистем, помогающих выявить вероятные слабые места.

На сей раз мы представляем новый тест второго класса: архиватор 7-zip. Это freeware-программа с открытым исходным кодом (GNU/GPL), позволяющая при соответствующих настройках задействовать в процессе сжатия очень большие объемы ОЗУ (в нашем случае -- до 250 MB!) и "тонко" управлять распределением нагрузки между собственно CPU и подсистемой памяти. На данный момент мы разработали два "шаблона" для 7-zip, назвав их "Balance" и "Memory". Как легко догадаться, в первом случае на производительность оказывает влияние как вычислительная мощь CPU, так и скорость работы с ОЗУ, во втором же -- в основном последняя.

За исключением процессора, все тестовые системы были оснащены одинаково: материнская плата на чипсете i845B0, 512 MB PC2100 DDR SDRAM, видеокарта Gainward GeForce4 Power Pack! (графический чип NVidia GeForce4 Ti 4600) и жесткий диск Western Digital WD300BB (UATA/100, 7200 об/мин, кэш 2 MB). В остальном наша методика не претерпела существенных изменений, поэтому желающие ознакомиться с ней в подробностях могут сделать это в разделе Тестовой лаборатории на сайте (itc.ua/testlab.phtml) или же в предыдущих номерах "Компьютерного Обозрения" за этот год.


Комментарии к результатам

Как и было оговорено ранее, в этом материале мы рассматриваем только один аспект: масштабируемость систем на базе процессора Intel Pentium 4. Впоследствии мы наверняка проведем аналогичное исследование и в отношении основных конкурентов процессора, но на данный момент этому во многом препятствуют объективные причины: рассматривать в качестве конкурента нового продукта Intel уже довольно давно вышедший Athlon XP 2000+ было бы не очень корректно (да и результат применительно к "чистой производительности" в общем-то известен), что же касается Athlon XP 2100+, то он до нас "еще не доехал", и, пожалуй, в этом и состоит основная причина некоторой ограниченности данной статьи. Однако вернемся к главному герою.

Четко наблюдается разделение приложений на две группы: программы, где быстродействие систем на основе Pentium 4 растет довольно плавно, т. е. преимущество по частоте Pentium 2,0A GHz относительно Pentium 1,6A GHz примерно равно превосходству Pentium 4 2,4 GHz над Pentium 4 2,0A GHz. Это, как и следовало ожидать, в основном "считалки" -- 3DStudio MAX 4.26, LightWave 7b, A|W Maya 4.0.1, SolidWorks 2001, в немного меньшей степени -- Adobe Photoshop 6.01. Подобные программы довольно малочувствительны к скорости подсистемы памяти, основная масса вычислений происходит в пределах кэша второго уровня, и поэтому увеличение частоты приводит к росту производительности почти по линейному закону (Y=kX, где Y -- производительность, k -- некий коэффициент, а X -- частота работы ядра).

Вторая группа -- это приложения медиа-кодирования, SPEC ViewPerf (профессиональный OpenGL) и любимые нами тесты на архивацию с использованием больших объемов словарей. Особенно хорошо себя показал новый тест в архиваторе 7-zip -- демонстрируемая им картина весьма информативна с точки зрения анализа "узких мест" подсистемы процессор <--> память. Здесь, наоборот, четко видно, что если частота 2 GHz для систем на базе DDR266 является еще более-менее приемлемой, то 2,4-гигагерцевому ядру скорости этого типа памяти начинает не хватать. Результаты SPEC ViewPerf также весьма информативны, но не стоит забывать, что на них оказывает непосредственное влияние еще и производительность 3D-акселератора. Таким образом, мы наблюдаем именно то явление, которое и было предсказано ранее: основная "болячка" новой архитектуры Intel -- ее повышенные требования к подсистеме памяти.


Выводы

Все-таки возникает впечатление, что Intel опять "угадала". Правда, немного менее удачно, чем раньше, -- "вышибить" с рынка основного конкурента за счет явно видимого технологического и концептуального превосходства над всеми его продуктами на этот раз вряд ли удастся. Скорее всего, мы наблюдаем ситуацию, когда "война" заканчивается не разгромом и руинами, а просто частичным переделом рынка. Pentium 4 "будет жить", и, скорее всего, довольно неплохо. Очень быстрая и качественная (и постоянно продолжающаяся!) "работа над ошибками" позволила компании значительно сократить ценовой разрыв между Pentium 4 и Athlon, выбиться в лидеры по чистой производительности в большинстве задач, а появление DDR-платформы для этого CPU вызвало вполне предсказуемый рост ее популярности как у конечных пользователей, так и у производителей чипсетов и материнских плат. Ставка на потоковые вычисления и быструю память себя также оправдала -- соответствующее ПО действительно становится популярным, а увеличение пропускной способности ОЗУ, похоже, стало просто-напросто "модным".

Что дальше? Скорее всего, "ничего выдающегося". Выйдет Pentium 4 3 GHz. Выйдет Athlon XP 2500+. Довольно скоро нам обещают обновленный Celeron на том же P4-ядре. Уже доступна PC2700 (DDR333), а там, глядишь, появится DDR400, DDR-II (или даже сразу QDR). Быть может (чем черт не шутит?), "оживет" и Rambus. Платформы будут развиваться, каждая в своем направлении, холя и лелея положительные черты и пытаясь избавляться от отрицательных. Естественно, в последнем случае мы можем рассчитывать исключительно на "косметику", ибо недостатки каждого CPU являются закономерным следствием его же преимуществ. Безусловно, финансовые и маркетинговые просчеты могут "свалить" любого, даже самого сильного игрока, но нам кажется, что Великая Процессорная Война, по сути, уже закончена -- и, как ни странно, без явно выраженных проигравших. Наверное, процессоров на ядре Pentium 4 на рынке будет количественно больше. Насколько? А что -- это так важно?

Процессоры Intel Pentium 4 2,0A и 2,4 GHz предоставлены украинским представительством Intel: тел. (044) 490-1221
Процессор Intel Pentium 4 1,6A GHz предоставлен компанией "Виола-плюс": тел. (044) 515-2628

0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT