Серверная платформа Bensley: Intel внедряет новейшие решения для повышения производительности

16 июнь, 2006 - 14:51Сергей Коваленко

Выход на арену новой платформы Bensley для двухпроцессорных систем является ожидаемым, закономерным и своевременным. Bensley имеет ряд преимуществ, которые дают возможность получить прирост производительности, более полно реализовать потенциал 64-битовых ОС для архитектуры x86 и обеспечить повышение надежности серверных систем.

На данный момент становление 64-битовых операционных систем для архитектуры x86 уже произошло, и это не воспринимается как нечто из ряда вон выходящее – сейчас практически на каждом диске с драйверами от производителей оборудования можно встретить подкаталоги с суффиксом х86-64. 64-битовые расширения получили и десктопные процессоры, включая сегмент low-end. Была подготовлена почва и осуществлен переход на многоядерные процессоры как альтернатива истощившей себя «гонке гигагерц» для наращивания производительности систем. В сегменте серверного оборудования среди решений на базе x86 в течение последнего времени основную роль играла платформа Intel 7520/7525/7320.

С появлением многоядерных процессоров и совершенствованием их архитектуры препятствием для увеличения производительности систем начала становиться подсистема памяти, причем наращиванием частоты существенно повысить этот показатель на сегодня уже практически невозможно. К сожалению, достижение «частотного потолка» – не единственное узкое место, есть и другая проблема. Интерфейс между контроллером памяти и модулями в традиционной организации памяти – параллельный, имеющий большое количество сигнальных шин, что накладывает ограничения на число слотов на материнской плате из-за сложности трассировки и, как следствие, приводит к необходимости увеличения числа слоев печатного монтажа. Это ограничение сказывается и на предельном объеме, и на числе возможных каналов при использовании схемы со сквозным (последовательным) доступом. Поэтому понадобились новые подходы для реализации подсистемы оперативной памяти.

Применение новых технологий ОЗУ стало одним из основных новшеств, использованных в рассматриваемом чипсете. Вообще, данную платформу характеризует целый ряд следующих инноваций: процессоры Dempsey и Woodcrest; две независимые системные шины с FSB 1066/1333 MHz; новая архитектура оперативной памяти FB-DIMM (Fully Buffered DIMM); шина PCI Express для дополнительных контроллеров и связи с южным мостом; отдельный контроллер для реализации PCI-X (PXH 6700); Intel I/O Acceleration technology (Intel I/OAT) – южный мост ESB 6321; встроенные средства для повышения надежности подсистемы памяти – ECC, Intel x4 Single Device Data Correction (x4 SDDC), DIMM sparing, DIMM scrubbing, а также расширенные средства мониторинга и удаленного управления. Далее попытаемся рассмотреть эти новшества подробнее.

Память FB-DIMM

Технология FB-DIMM (Fully Buffered DIMM) позволяет эффективно решить две основные задачи – увеличение максимального объема доступного ОЗУ и повышение быстродействия памяти, что является немаловажным для серверов.

Главное отличие между FB-DIMM и обычными DIMM-модулями заключается в принципиально новом интерфейсе между контроллером памяти и собственно модулями. Этот интерфейс для FB-DIMM – последовательный, по сути, он аналогичен PCI Express, в то время как у обычного DIMM используется параллельный.

Серверная платформа Bensley Intel внедряет новейшие решения для повышения производительности
Серверная платформа Bensley Intel внедряет новейшие решения для повышения производительности
Трассировка печатных плат старого типа (внизу) и нового (вверху). Отчетливо видно существенное уменьшение количества печатных проводников при использовании памяти FB-DIMM

Применение последовательного интерфейса значительно уменьшает количество линий для соединения между контроллером памяти и модулем, что дает возможность использовать больше каналов и, таким образом, существенно увеличить общую пропускную способность. Данная технология позволяет реализовать до шести каналов памяти, причем максимальное число модулей на каждый канал может достигать восьми. Общая пропускная способность интерфейса памяти возрастает пропорционально количеству каналов. Так, для одного канала DDR2-533 она составляет 4,264 MBps, соответственно для двух – 8,528 MBps, а при четырех каналах теоретическая пропускная способность интерфейса возрастет до 17,056 MBps.

Последовательный интерфейс FB-DIMM использует 10 пар проводов для передачи сигналов от чипсета к модулю памяти и 12 или 14 – от модуля к северному мосту чипсета. Сигналы по каждой паре передаются дифференциально, т. е. на каждом втором проводе пары сигнал следует в противофазе каждому первому аналогично тому, как это происходит в сетевых кабелях на витой паре. Это обеспечивает наилучшие условия для приема информации.

Интерфейс использует различные пути для передачи данных от чипсета к модулю и от модуля к чипсету (в обычных модулях оба процесса осуществляются по одной и той же шине). Таким образом, обмен данными можно выполнять в дуплексном режиме, что позволяет еще более повысить производительность подсистемы памяти.

Первоначально модули FB-DIMM будут реализованы на основе памяти DDR2, затем планируется переход на технологию DDR3 по мере ее внедрения. Таким образом, что очень важно, становится возможным переход на новый вид памяти без смены интерфейса. Фактически FB-DIMM, построенный на основе DDR3, можно установить в те же разъемы, поскольку изменения в физической реализации RAM будут скрыты внутри модуля и не коснутся внешнего интерфейса.

Другим немаловажным преимуществом использования памяти FB-DIMM является существенное упрощение дизайна материнских плат. Модуль FB-DIMM использует тот же стандартный 240-контактный сокет DDR2-DIMM. Но, по сравнению с предшественником, в нем задействованы только 69 контактов. Все это дало возможность значительно упростить трассировку печатных плат, которую можно реализовать всего на двухслойных PCB – причем вместе с разводкой питания.

На прилагаемых иллюстрациях показан фрагмент разводки четырех модулей обычных DIMM на одном канале. Причем очевидно, что для модулей FB-DIMM на двух каналах, несмотря на кажущееся усложнение, он значительно проще.

При такой разводке и применении памяти DDR2, двухканального контроллера и четырех сокетов DIMM на сегодняшний день можно получить максимальный объем доступного ОЗУ до 8 GB и обеспечить пропускную способность 10 GBps при использовании модулей DDR2-800. Память FB-DIMM, соответственно, позволит достичь максимального объема 192 GB (шесть каналов по 8 модулей на канал) и пропускной способности 40 GBps для технологии DDR2-800. Многие производители памяти, в том числе Samsung, Elpida, Infineon, Micron, Hynix, Nanya, Kingston, уже анонсировали свои модули FB-DIMM.

Единственным недостатком этого типа памяти в настоящее время является только цена. Так, Crucial 667 MHz 4 GВ FB-DIMM в эквиваленте стоит около $7500, модуль такой же емкости, рассчитанный на 533 МHz, – $ 6100. Для сравнения: после недавнего снижения цен компанией Intel процессоры Itanium 2 можно приобрести за $4230.

Такие заоблачные цены за единицу объема характерны в первую очередь для высокоемких модулей, а вот продукт той же Crucial емкостью 512 MВ (533 MHz) доступен за вполне скромную цену – около $145. FB-DIMM емкостью 1 GB стоит $255. Такой разброс объясняется прежде всего тем, что компании только начали осваивать выпуск памяти FB-DIMM, особенно большой емкости. Однако будем надеяться, что с выходом платформы Bensley на рынок возрастут объемы производства, и, соответственно, снизятся цены.

Процессоры

Dempsey

Серверная платформа Bensley Intel внедряет новейшие решения для повышения производительности

Процессоры Intel Xeon 5000 (кодовое название Dempsey) изготовляются по 65-нанометровой технологии и содержат два ядра с архитектурой NetBurst, причем – и то и другое – со своим отдельным кэшем L2 объемом 2 МВ и технологией HyperThreading, т. е. 4 МВ в сумме на кристалле. Каждое ядро также имеет свой отдельный арбитр шины. Используется процессорный разъем Socket LGA-771, частота шины FSB – 1066/667 MHz. Тактовая частота процессоров – от 3,46 GHz. Потребляемая мощность: Dempsey TDP 3,75 GHz/ 1066 FSB – 130 Вт; Dempsey MV 3,20 GHz/1066 FSB – 95 Вт; Dempsey 667 SKUs – 95 Вт. В Dempsey, как и в предыдущих моделях, используется обычный термодиод для мониторинга температуры.

Woodcrest

Серверная платформа Bensley Intel внедряет новейшие решения для повышения производительности

Процессоры Intel Xeon 5100 (кодовое название Woodcrest) также изготовляются по технологии 65 нм. Представляют собой двухъядерный кристалл архитектуры Intel Core Micro-Architecture с общим разделяемым кэшем L2 емкостью 4 МВ и общим арбитром шины. Они не поддерживают технологию HyperThreading. Используется разъем Socket LGA-771. Частота шины FSB – 1333/ 1066 MHz. Тактовая частота процессоров 2.xx–3.xx GHz. Потребляемая мощность: Woodcrest TDP – 65 Вт; низковольтный LV Woodcrest TDP – 40 Вт, т. е., как и было обещано, достаточно сильно снижена по сравнению с Xeon предыдущих поколений. В Woodcrest для мониторинга температуры используется новый, более точный интерфейс PECI.

Оба процессора имеют встроенные средства VMX (Virtual Machine Extension) для реализации функций виртуализации, поддержку которых разработчики программного обеспечения (VMware, Microsoft, Xen, Red Hat, Novell) обещают внедрить в свои продукты до конца 2006 г.

Чипсет

В выходящей 5000-й серии чипсетов для двухпроцессорных платформ, аналогично 7520/ 7525/7320, также существует три варианта: 5000P (Blackford) – для high-end-серверов, 5000X (Greencreek) – для рабочих станций, 5000V (Blackford – VS) – для low-end-серверов. Чипсет состоит из двух основных компонентов: MCH Intel 5000P/X/V (Memory Controller HUB) и ESB2 Intel 6321 (Enterprise South Bridge). Дополнительно предусмотрен PCI-E–PCI-X мост PXH Intel 6700 для реализации на материнской плате шины PCI-X.

Серверная платформа Bensley Intel внедряет новейшие решения для повышения производительности
Структурная схема нового чипсета серии 5000 изобилует инновациями, такими как отдельная шина для каждого процессора, наличие четырех каналов доступа к памяти и другими, которые в совокупности позволяют существенно повысить производительность платформы

Южный мост MCH имеет две независимые шины для связи с процессорами – DBI, четыре или два канала памяти FB-DIMM и несколько шин PCI-E в зависимости от версии P/X/V: 5000P – четыре канала памяти (максимальный объем 64 GB), три шины PCI-Е x8 и один x4 ESI-интерфейс; 5000X – четыре канала памяти (максимальный объем 64 GB), одна шина PCI-Е x16, одна шина PCI-Е x8 и один x4 ESI-интерфейс; 5000V – два канала памяти (максимальный объем 16 GB), две шины PCI-Е x4 и один x4 ESI-интерфейс.

MCH 5000X, кроме того, отличается от остальных наличием так называемого Snoop-фильтра, который представляет собой дополнительный кэш L3 объемом 12 MB – общий для обоих процессоров. Его основное предназначение – буферизация данных, которые считывает и один, и другой процессор. Он позволяет выиграть время, когда первый CPU обращается к ячейкам памяти, данные из которых у него в кэше не записаны, но второй уже считывал эти ячейки, и содержимое их, естественно, занесено в память Snoop-фильтра. В этом случае они извлекаются из него без обращения к памяти, на что требуется значительно меньше времени.

Для связи с ESB2 используются одна шина x8 (x4) PCI-Е и x4 ESI-интерфейс, а остальные предназначены для подключения дополнительных контроллеров – в первую очередь тех, для которых требуются высокоскоростные соединения – SAS/SATA II, Ethernet и др., устанавливаемых на материнскую плату, а также распределяются между слотами PCI-Е для подключения внешних контроллеров. Часть каналов может быть использована для подключения моста PXH 6700 для того, чтобы получить на материнской плате разъемы PCI-X. В платформах для рабочих станций шина x16 PCI-Е, естественно, применяется для подключения графического адаптера.

ESB2 Intel 6321 представляет собой современный серверный южный мост с полным набором интерфейсов для подключения внешних устройств. В нем интегрированы два гигабитовых Ethernet-контроллера (для согласования с линией требуется внешний чип), имеется шина x8 PCI-Е или две x4, кроме того, шина x4 или четыре x1, один интерфейс PCI-X и один PCI-32/33. ESB2 содержит шестиканальный SATA-контроллер 3 GB, совместимый с Intel Matrix Storage, с функциями Host RAID. Поддерживает RAID уровней 0, 1, 5, 10. Кроме того, есть интерфейс ATA/100 на два устройства, восемь каналов USB 2.0, блок для внешнего SIO, поддерживающий legacy-интерфейсы (COM, LPT, PS/2) и средства мониторинга.

Как появление Bensley повлияет на серверный рынок?

Дмитрий Кручинин
директор департамента систем хранения и обработки данных корпорации «Инком»

Сегодня в сегменте серверов, выполняющих стандартные задачи, наиболее востребованными остаются решения на базе процессоров Intel, а в секторе высокопроизводительных х86-серверов – на основе АМD. Я считаю, что сам по себе выход систем на Bensley не так значителен, нежели связанное с этим грядущее появление процессоров Woodcrest, вычислительная мощность которых, по заявлениям Intel, должна не только сократить разрыв с решениями АМD, но и вывести системы Intel на совершенно новый уровень. Отмечу, что наконец-то конкуренция между производителями CPU, как и полагается, приносит благо конечному пользователю.

Задачи, выполняемые серверами на новых продуктах Intel, могут быть разнообразны. С учетом ожидающегося роста производительности (о результатах можно будет говорить лишь по завершении соответствующих испытаний, которые ведутся в настоящее время), серверы смогут позиционироваться как для решения типовых задач (файл-серверы, коммуникационные и т. д.), так и, не исключено, в качестве серверов баз данных.

Мария Молотай
менеджер по продажам компании «Оникс»

Мы начали поставки решений на основе AMD осенью прошлого года, а сегодня их доля в общем количестве продаж двухпроцессорных систем нашей компании достигла 8%. По имеющейся информации, на данный момент практически во всех тестах серверы на базе двухъядерных Opteron при меньшем тепловыделении и энергопотреблении опережают аналогичные решения на Xeon по производительности.

В целом заявленные характеристики Bensley выглядят довольно многообещающе. Я считаю, что новые платформы, подкрепленные продуманной ценовой политикой Intel, имеют все шансы притормозить резкий рост продаж систем на базе процессоров AMD. Тем не менее реальную расстановку сил можно будет определить исключительно после проведения первых тестов.

Андрей Санин
заместитель директора по маркетингу отделения «Проектные решения» компании «АМИ»

На мой взгляд, в ближайшее время ситуация на серверном рынке может измениться. В последние годы AMD удалось потеснить Intel практически по всем фронтам, – это заметно по возросшему спросу на компьютеры на базе AMD Athlon 64 и Sempron в розничном канале, и по участившимся запросам на Opteron со стороны бизнес-клиентов. Причина кроется не столько в неправильно выбранном Intel направлении развития, сколько в действительно удачных продуктах AMD. Даже консервативный корпоративный рынок признал процессоры этого вендора как удачное сочетание производительности, энергопотребления, тепловыделения и цены.

Все это время мы ждали ответного хода Intel, ведь производственная, финансовая и исследовательская мощности данной компании значительно отличаются от AMD. Как один из ключевых партнеров корпорации, мы получили возможность провести полевые испытания серверов «АМИ» на базе Bensley в нашем Центре компетенции. Результаты позволили нам сделать вывод, что архитектура Intel Core является наиболее удачной разработкой со времен первых Pentium. Это однозначно будущий хит продаж, объединивший в себе лучшие черты процессоров прежних поколений. Вполне вероятно, что в 2007 г. нас ожидает очередной передел рынка – Intel вернет себе утраченные позиции.

По доступной нам информации, новые платформы будут ненамного дороже решений предыдущих поколений, поэтому мы планируем перевод всего модельного ряда серверов «АМИ» на новую микроархитектуру после отладки соответствующих технологических процессов.

Сергей Толокунский
директор по развитию компании Entry

Несмотря на технологические и маркетинговые успехи AMD, последние три года лидером серверного рынка была и остается корпорация Intel, с той лишь разницей, что если раньше она полностью доминировала в сегменте x86-совместимых решений, то теперь, благодаря усилиям AMD, у клиентов появилась возможность выбора.

Наша компания производит одинаковое количество систем на базе процессоров обоих вендоров. Однако, по моим данным, в целом по стране доля продаваемых серверов на базе AMD Opteron не превышает нескольких процентов. Я считаю, что обусловлено это скорее не технологическим превосходством, а стереотипами, подкрепленными мощной маркетинговой поддержкой, которую Intel предоставляет системным интеграторам.

Появление Bensley – привычное событие в непрерывной «гонке вооружений», ведь AMD также выводит новую платформу на новом разъеме с поддержкой DDR2. Отличительная особенность решений от Intel – акцент на энергосбережении.

Bensley призвана прийти на смену Lindenhurst, и вряд ли есть основания говорить об изменении целевой ниши. Серверы на ее основе станут mainstream- решениями и окажутся востребованными в ресурсоемких задачах, связанных с базами данных, документооборотом, бухгалтерией, OLAP-системами и т. п.

Подводя итоги

Итак, что же получило серверное направление с появлением новой платформы Bensley? Можно долго спорить о ее недостатках и достоинствах, но вместо этого мы попытаемся подвести итог всему, о чем было рассказано выше. Итак, ранее применявшаяся шина в Bensley будет заменена на новую DIB (Dual Independent Bus), обеспечивающую подключение каждого процессора через индивидуальную шину FSB, при этом ее скорость увеличится до 266 MHz (FSB 1066), что предположительно даст ощутимый прирост пропускной способности до 8,5 GВps на каждый процессор. Контроллер памяти рассчитан на поддержку не только двухканальной DDR2-400, но и четырехканальной DDR2-533, что, в конечном итоге, обеспечит возрастание пропускной способности интерфейса с 6,4 до 17 GBps.

Хотя все это выглядит весьма заманчиво, результаты можно будет увидеть только после проведения тестирования и при решении реальных задач. Забегая вперед, скажем, что предварительные значения, полученные на инженерных образцах, показывают несомненный прирост быстродействия в серверах, причем в ряде случаев очевидно, что причиной такого ускорения являются именно две независимые процессорные шины.