`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Камо грядеши, AMD?

0 
 

Человеку свойственно задумываться о будущем. Особенно важными эти раздумья становятся тогда, когда будущее зависит от выбора, сделанного сегодня. Поддержать "тех" или "этих"? И хотя технические споры подразумевают гораздо меньший эмоциональный накал, чем любые другие, для того чтобы они были аргументированными, необходимо все же знать претендентов.

После того как компания AMD официально опубликовала некоторые детали архитектуры своего процессора нового поколения Opteron, появилась возможность наконец-то разобраться подробнее, что же она предлагает в качестве альтернативы Pentium 4 от Intel. В самом деле -- с флагманским CPU от создателя архитектуры х86 все относительно понятно: частота ядра будет расти, в следующем году ожидается появление на рынке десктопных процессоров с технологией Hyper-Threading, планируется выпуск двухканальных DDR-чипсетов с поддержкой Serial АТА... Вроде бы "из основного" -- все.

Ключевой в архитектуре нового поколения, по мысли AMD, становится идея "бархатной революции". Позднее станет понятно, что "бархатность" ее обеспечивается достаточно новыми (для х86-систем) архитектурными изысками. Для простоты мы перечислим основные (как нам кажется) приоритеты компании на сегодняшний день, а затем рассмотрим их по отдельности:

1.AMD необходимо предложить рынку процессор, который будет лидером по производительности, -- в отличие от Intel, она не может себе позволить надеяться на лояльность покупателей и раскрученную торговую марку. Другими словами, если для Intel достаточно просто сохранять свои позиции, то AMD для завоевания большей доли рынка приходится "атаковать", убеждая поклонников другого брэнда переходить в свой лагерь.

2.Необходимо также ликвидировать те недостатки предыдущего продукта, которые вызвали нарекания пользователей. Соответственно, мы вправе ожидать улучшенной (или, вернее, не зависящей от производителей материнских плат) термозащиты и теплораспределителя, защищающего попутно ядро от сколов.

3.Естественно, кроме скорости, крайне желательно наличие некоторой "изюминки", которая должна быть дополнительным стимулом для перехода на эту платформу.

4.Поскольку бoльшая часть денег на компьютеры тратится в корпоративном секторе (где позиции AMD довольно слабы), желательно получить продукт, который мог бы расширить продажи именно здесь. Например, разработать решение, которое позволило бы строить не только двух-, но и четырех-, и восьмипроцессорные системы. Благодаря этому компания сможет конкурировать на самом доходном рынке серверов высшего уровня. Следует также по возможности разделить серверные и десктопные процессоры.

5.Ну и, наконец, необходимо иметь платформу, на которую можно будет опираться в течение нескольких следующих лет -- ибо архитектура Athlon (K7) уже достаточно стара, и ей все сложнее противостоять напору Pentium 4.

Итак, требования мы сформулировали. Надо заметить, что создать продукт, удовлетворяющий им всем, -- совсем не просто. Присмотримся к тому, что предлагается в качестве ответа на каждый пункт, попутно комментируя нововведения.


Новое процессорное ядро Hammer

Камо грядеши, AMD?
Рис. 1. Схема процессора с ядром Hammer

Обратимся к схеме (рис. 1). Основных новшеств, которые буквально бросаются в глаза, в Hammer два: интегрированный контроллер памяти и фактический отказ от Front Side Bus. В самом деле, вместо FSB, которая традиционно доставляла в процессор данные (и которая присутствует во всех нынешних системах, включая Pentium 4), в Hammer используется HyperTransport -- особая разновидность шины с топологией точка--точка. Интересна она тем, что имеет большую пропускную способность и допускает различные вариации "внутри себя", т. е. спецификация предусматривает несколько комбинаций количества проводников, ширины шины и пропускной способности, тем не менее "все это по-прежнему является HyperTransport". Так, при физической реализации с количеством проводников 103 ее ширина составляет 32 бита (по 16 бит в каждую сторону), а максимальная пропускная способность -- 6,4 GBps. Но если нам необходима бoльшая скорость, то увеличив количество проводников до 197, мы наращиваем ширину до 64 бит (по 32 в каждую сторону), а максимальную пропускную способность -- до 12,8 GBps. Здесь следует заметить, что быстродействие шины при обмене данными "в одну сторону" в два раза меньше, просто оба потока могут передаваться одновременно, не мешая друг другу. В самом мощном из тех процессоров на ядре Hammer, чьи характеристики уже известны (Opteron), предусмотрена реализация трех 32-битовых каналов HyperTransport общей пропускной способностью 19 GBps. К слову, именно такая концепция делает возможным все то, что мы увидим далее.

В случае N-процессорной системы CPU соединяются между собой той же шиной, что позволяет создать очень интересные архитектурные решения. Впрочем, об этом ниже, а пока мы перейдем ко встроенному контроллеру памяти. ОЗУ теперь соединено не с чипсетом, а с главным потребителем данных -- процессором. Вроде бы никаких принципиальных отличий -- но при этом сильно снижаются задержки времени на формирование адреса (в силу того, что контроллер работает на частоте ядра), на доставку данных в процессор, и освобождается пропускная способность каналов ввода/вывода. В результате повышается эффективная скорость работы с памятью, что теоретически должно привести к росту производительности. На текущий момент встроенный контроллер памяти Hammer поддерживает DDR266 или DDR333. Возможно также, что JEDEC утвердит к моменту выпуска реальных процессоров на этом ядре стандарт DDR400 (а особых проблем с добавлением его поддержки быть не должно).

Сейчас планируется выпуск двух модификаций Hammer -- ClawHammer (наиболее вероятное коммерческое название Athlon64) и SledgeHammer (наиболее вероятное название Opteron). Отличаются они прежде всего целевым рынком -- Athlon64 предназначен для систем среднего уровня, тогда как Opteron нацелен на рынок рабочих станций и серверов. Кроме этого, в Athlon64 реализована одна шина HyperTransport и 64-битовая шина памяти, а в Opteron -- три шины HyperTransport и 128-битовая шина памяти.

Итак, мы обсудили встроенный контроллер памяти и контроллер HyperTransport -- а что же остальное? Из остального осталось только ядро процессора. Что нового ждет нас здесь? Практически ничего -- в этом качестве будет применяться частично измененное ядро Athlon. Модификация будет заключаться в удлинении конвейера декодирования команд (12 ступеней конвейера вместо 10). Таким образом, удастся снять проблемы с наращиванием частоты работы ядра, что вменяют в вину сегодняшним CPU от AMD. Кроме того, будет добавлена поддержка SIMD-инструкций SSE2 (что позволит Hammer соперничать с Pentium 4 "на его поле" -- в области SSE2-оптимизированных приложений).

Правда, тут есть один достаточно тонкий момент: дело в том, что предполагаемая частота, с которой стартует первый процессор на ядре Hammer, находится в районе 2 GHz, соревноваться же ему придется с Pentium 4 от 3 до 4 GHz. Процессор Pentium 4 способен запускать на исполнение SSE2-инструкцию каждый второй такт. Следовательно, чтобы на равных соперничать с ним, Hammer, имея практически вдвое меньшую частоту, должен исполнять не менее одной SSE2-инструкции каждый такт. По-видимому, это было одной из причин переделки декодера команд. Второй тонкий момент в том, что для нормальной работы процессора в рамках такой архитектуры должна быть обеспечена соответствующая пропускная способность памяти (собственно, AMD предстоит столкнуться с тем самым подводным камнем, с которым в свое время "близко познакомилась" Intel в начале продвижения Pentium 4). Впрочем, сделать окончательные выводы о том, удалось ли AMD решить все перечисленные проблемы, мы сможем, лишь протестировав финальный продукт.

Что касается производительности Hammer, то на сегодняшний момент официальные комментарии AMD по этому поводу просто отсутствуют. Однако в руки пытливых немецких журналистов на 1 час попала система на тестовом образце ClawHammer (128 KB L1 и 256 KB L2), и они умудрились снять несколько результатов. Согласно синтетическим тестам, пропускная способность L2-кэша у ClawHammer серьезно увеличилась по сравнению с Athlon MP. Как следствие, с учетом встроенного в процессор контроллера памяти возросла и общая производительность подсистемы. Так, линейная пропускная способность связки память--процессор при использовании PC2700 вплотную приблизилось к Pentium 4 + i850 + PC800 RDRAM. Интересными являются результаты тестирования в Quake III -- "главном тесте всех времен и народов".

Как видно, ClawHammer на 30% опережает Athlon MP на одной тактовой частоте и идет практически на равных с Pentium 4, работающем на вдвое большей! Также обратим внимание на то, что ClawHammer использовал самые медленные тайминги памяти -- таким образом, есть надежда еще на некоторый рост производительности. Можно резюмировать, что если Hammer выйдет на запланированной частоте, с его быстродействием все должно быть в порядке.

Камо грядеши, AMD?
Рис. 2. Предположительно так будет выглядеть новый процессор AMD (обратите внимание на наличие тепло-распределителя)

Теперь поклонники продукции AMD могут с облегчением вздохнуть: у Hammer будут все атрибуты современного x86-процессора -- термозащита и теплораспределитель, который кто-то метко назвал "бронекрышечкой". В качестве доказательства можно привести фотографию Athlon64 и Opteron (рис. 2). Как легко заметить, часто используемые аргументы поклонников Pentium 4 по отношению к этим процессорам уже несостоятельны.


"Изюминка"

На самом деле это не просто изюминка -- это целый фунт изюму. Или уксусу -- это уж кому как. Отношение к технологии, которую предлагает AMD в качестве "бонуса", может быть очень разным. Речь идет о том, что "старая" и знакомая система команд х86, по замыслу компании, созрела для того, чтобы быть модернизированной и расширенной до 64 бит. В архитектуре х86 впервые также появится 64-разрядная адресация. Откуда же двоякое отношение?

Как-то так сложилось, что х86 является далеко не самой логичной и "красивой" системой команд. И, опять же, исторически сложилось так, что именно х86 является самой быстроразвивающейся компьютерной архитектурой. Посему модернизации подвергается не самая "стройная" архитектура -- но, без сомнения, самая резвая. Собственно, шаг с расширением адресного пространства похож на тот, который сделала Intel с появлением i386 -- тогда впервые платформа х86 узнала, что такое 32-битовая адресация. Теперь AMD пытается выхватить знамя новатора и провозгласить новую эпоху -- время архитектуры 64-битовой. Надо сказать, что действительно есть категория потребителей, которым уже давно тесно в 4 GB ОЗУ, доступных для адресации х86 CPU (на самом деле это ограничение специальными методами отодвигается до 64 GB, но простым подобное решение не назовешь). Таких потребителей немного, но уже хорошо то, что есть возможность решить их задачи. Всем остальным сегодня особого преимущества от х86-64, скорее всего, ждать не стоит. Впрочем, и расстраиваться по этому поводу тоже -- ведь Hammer полностью обратно совместим с классической х86, а посему все ранее выпущенные программы будут работать абсолютно прозрачно, без каких-либо переделок.

Камо грядеши, AMD?
Рис. 3. Структурная схема однопроцессорной Hammer-системы (офисная/игровая)

Однако есть ряд вещей, которые стоит помнить, -- в х86-64 введены несколько новых режимов работы процессора. Так, в 64-битовом режиме количество регистров общего назначения увеличилось до 16, количество SSE2-регистров -- тоже 16. Таким образом, программирование должно стать более удобным. Кроме этого, AMD всерьез озаботилась созданием собственного компилятора. И это понятно -- разработчик новой технологии должен предоставить хотя бы минимальный набор из документации и инструментария, если желает заинтересовать аудиторию программистов. Помимо этого, поддержка x86-64 дает отличные козыри маркетингу -- теперь каждому будет ясно, что нужно покупать процессоры AMD, ибо они 64-битовые. Видимо, не зря ходят слухи о том, что в будущем ядре Pentium 4 "Prescott" планируется поддержка некоей таинственной технологии Yamhill и что это будет некий функциональный аналог х86-64, только разработки Intel. Также интересно, что Microsoft уже объявила о желании выпустить специальную х86-64-версию операционной системы Windows и некоторых других программ -- а, как мы знаем, поддержка этой корпорации значит очень много.


Чипсет

Надо сказать, с чипсетом AMD "выкрутилась" очень изящно -- чуть дальше станет понятно почему. Собственно, сам набор состоит из трех микросхем: AMD8151, AMD8131 и AMD8111. Эти чипы -- не что иное, как мосты HyperTransport -- AGP, HyperTransport -- PCI-X и HyperTransport -- "все остальное" (PCI32, LPC, SMB, BIOS и т. п.).

Камо грядеши, AMD?
Камо грядеши, AMD?
Камо грядеши, AMD?
Рис. 4. Структурные схемы систем с процессором Hammer:
а -- двухпроцессорный сервер (есть только PCI-X, без AGP);
б -- двухпроцессорная рабочая станция (есть и AGP, и PCI-X); в -- четырех-процессорная система

Самое интересное, что для построения нормально функционирующей системы достаточно всего двух микросхем -- AMD8111 и любой другой. Если поставим AMD8151 -- получим систему с AGP (например, домашнюю машину или рабочую станцию, рис. 3). Поставим AMD8131 -- получим небольшой сервер с мощной подсистемой ввода/вывода, основанной на шине PCI-X (рис. 4,а). Все три -- получим, например, рабочую станцию, на которую можно "повесить" быстрый Ultra 320 SCSI-контроллер и/или парочку адаптеров Gigabit Ethernet (рис. 4,б). Таким образом, достигается необыкновенная гибкость в комплектации систем.

В принципе, можно построить еще более длинные цепочки -- было бы только зачем. Самой большой проблемой в столь экзотических вариантах будет недостаток пропускной способности шин HyperTransport между процессорами. Впрочем, это дело более далекого будущего.

Есть еще один аспект, на который необходимо обратить внимание, -- по существу, вся оперативная память системы состоит из некоторого количества банков, которые присоединены прямо к процессорам. Таким образом, общей памяти у процессоров нет. Это позволяет говорить о том, что подобная архитектура представляет собой NUMA (Non-Uniform Memory Architecture), привнесенную в мир х86. Для максимально эффективной работы ОС должна быть осведомлена о том, каким способом распределена оперативная память в системе, -- хотя бы для того, чтобы минимизировать пересылки. Следовательно, выдвигаются дополнительные требования к части ядра, ответственной за управление памятью. Зато в качестве положительного момента отметим, что подобным образом можно получить гораздо более быструю реализацию многопроцессорных вариантов, нежели традиционная архитектура от Intel с общей шиной. Если уж совсем размечтаться, то можно представить будущие средства динамического конфигурирования системы, позволяющие одновременное функционирование на многопроцессорной машине нескольких независимых аппаратных виртуальных машин, каждая со своей ОС -- принципиально на подобной системе это вполне возможно...

Так что, несомненно, заявку на архитектурное лидерство AMD сделала весьма серьезную -- посмотрим, что из этого выйдет. В любом случае, производительность подобного решения, по идее, должна быть беспрецедентной. Можно резюмировать, что AMD действительно имеет потенциально интересное предложение для корпоративного пользователя.

Перспективы

Камо грядеши, AMD?
Рис. 5. Тот факт, что процессоры соединяются шиной HyperTransport, позволяет построить достаточно экзотические варианты многопроцессорных систем

Что можно сказать о перспективах платформы Hammer? Они зависят от многих вещей... Если в конце 2002 г. ее старт состоится без проблем и задержек, то, похоже, AMD имеет шанс наслаждаться некоторое время (до ввода в строй процесса 90 нм) самой быстрой платформой х86. Естественно, теоретически Intel может иметь какое-нибудь секретное оружие на этот случай -- но практически это маловероятно. При технологии 0,13 микрон тактовые частоты Pentium 4 вряд ли перепрыгнут 3,5 GHz (c приемлемым выходом годных кристаллов), а новое решение от AMD должно обеспечивать не меньшую, а то и большую производительность. Впрочем, на самом деле все станет ясно в конце этого года. Далее обе компании будут некоторое время улучшать техпроцесс, поднимая частоты и наращивая производительность. Также не стоит забывать, что и у AMD, и у Intel есть еще в запасе довольно интересные нереализованные патенты, воплощение которых в процессорах способно устроить не одну революцию. А это уже тема совсем другой статьи...

E-mail автора: kartunov@sky.od.ua

Результаты предварительного тестирования ClawHammer в Quake III: Arena

CPU Тактовая частота, MHz Тип памяти Количество кадров/с
ClawHammer 800 PC333 2,5-3-3 183
Athlon MP 800 PC333 2,5-3-3 130
Athlon MP 800 PC333 2,5-2-2 133
Athlon MP 800 PC333 2,0-2-2 135
Athlon MP 1667 PC333 2,5-3-3 210
Pentium 4 800 PC800-45 111
Pentium 4 1600 PC800-45 182

Источник: TechChannel.de
0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT