`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Intel Xeon 5500: начало новой эпохи

Статья опубликована в №12 (678) от 7 апреля

+22
голоса

Очередное колебание «маятника» стратегии Intel Tick Tock принесло глобальное обновление линейки серверных процессоров корпорации – Xeon 5500 (Nehalem EP). Важность этого события сложно переоценить – слишком уж много весьма нетривиальных архитектурных изменений проведено в новых процессорных ядрах по сравнению с предшествующими, а сама компания делает на Nehalem очень большую ставку. Попробуем внимательнее рассмотреть, что же несет в себе эта микроархитектура и чего ожидать от нее при практическом использовании.

Intel и серверный рынок: долгий путь на вершину

История присутствия корпорации Intel на рынке серверных процессоров началась более чем на два десятилетия позднее выхода в свет самого первого CPU от этого производителя. До появления в ноябре 1995 г. Pentium Pro продукция компании присутствовала лишь в персональных компьютерах, а рабочие станции и серверы чаще всего строились на основе процессоров с той или иной вариацией RISC-архитектуры (Sun SPARC, IBM POWER, DEC Alpha и т. д.). Именно Pentium Pro проложил платформе x86, занявшей прочные позиции на рынке настольных ПК, путь в «высшую лигу» – мир компьютеров, содержащих не один, а несколько CPU и способных выполнять сложные задачи.

Затем последовал период довольно быстрого роста популярности x86 в сегменте SMP: появились Pentium II и, что не менее важно, Celeron, основанные на той же архитектуре, что и серверные процессоры. Таким образом, многопроцессорные конфигурации стали доступны не только крупным корпорациям, но и частным лицам.

Название «Xeon» впервые появилось в номенклатуре Intel в 1998 г. с выходом Pentium II Xeon – CPU, значительно отличавшихся от десктопных аналогов не только архитектурно (объемом кэша и его частотой), но и механически. С тех пор эти процессоры выпускаются со специфическими разъемами, что позволяет корпорации разграничить серверную и десктопную линейки и управлять ценами на них по своему усмотрению. В 2001 г. бренд Pentium был окончательно сконцентрирован в настольном сегменте, и все x86-совместимые серверные процессоры Intel стали носить имя «Xeon».

Intel Xeon 5500 начало новой эпохи
Новая серверная платформа: Intel Xeon 5500, контроллер ввода-вывода и южный мост

С того момента других кардинальных различий, кроме разных процессорных разъемов, между серверными CPU Intel Xeon и настольными Pentium, а затем Core и Core 2, не было. Обе платформы строились по одинаковому принципу: объединенные в одном кристалле ALU, FPU, кэши L1–L3 и разнообразная логика «общались» с остальными подсистемами ПК посредством шины FSB, подключенной к северному мосту. В нем, в свою очередь, находился контроллер памяти, обеспечивающий передачу данных между RAM и CPU, и основные контроллеры шин. До недавнего времени подобный подход был вполне удачным, поскольку откровенно узких мест в такой связке не наблюдалось. Однако с появлением CPU с производительной архитектурой Core 2 и постепенной популяризацией многоядерных CPU стало очевидно, что шина FSB ограничивает их быстродействие даже в однопроцессорной конфигурации, не говоря уж о многопроцессорных системах. Особенно удручающей ситуация была в сегменте четырехпроцессорных систем, где решения на основе AMD Opteron 64, оборудованных встроенным контроллером памяти и шиной HyperTransport, чаще всего опережали аналоги на Intel Xeon. Причина была проста: при всей своей вычислительной мощи ядра CPU вынуждены были передавать данные по довольно медленной шине. Необходимость их переноса из кэша одного процессора в кэш другого оказывалась сущей катастрофой для быстродействия сервера: их нужно было считать, передать по FSB в северный мост, оттуда в оперативную память, затем снова считать из RAM и передать по FSB другому процессору. Это «бутылочное горлышко» компания пыталась устранить несколькими способами: наращиванием частоты FSB до 1600 МГц, внедрением в контроллер шины собственного кэша со сверхскоростной памятью SRAM, использованием буферизированной памяти FB-DIMM – но, по большому счету, полумерами проблему решить так и не удалось.

Принятая в 2005 г. Intel стратегия «тик-так» требовала ступенчато увеличивать быстродействие каждый год, чередуя внедрение новых микроархитектур («тик») с миниатюризацией техпроцессов («так»). В конце 2008 г. настало время следующего «тика», и свет увидели новые процессоры, построенные по архитектуре с кодовым именем Nehalem. Первыми стали три CPU для настольного сегмента рынка, получившие название Core i7. 31 марта 2009 г. их дополнили 17 моделей семейства Intel Xeon 5500. Об особенностях Nehalem мы уже рассказывали (ko-online.com.ua/39459) и подробно тестировали десктопные CPU (ko-online.com.ua/39467), однако в серверных моделях применения новшества этой микроархитектуры имеют отдельное значение.

Xeon 5500: что нового?

Intel Xeon 5500 начало новой эпохи
Блок-схема процессора с архитектурой Nehalem

Итак, прежде всего Nehalem отличается от предыдущих поколений процессоров Intel наличием встроенного контроллера памяти и появлением специализированной шины для обмена данными между северным мостом и CPU. Сам процессор разделен на две части, которые, хоть и расположены на одном кристалле, работают на разных частотах. Первая, так называемая Core-часть, включает собственно вычислительные ядра и кэши L1 и L2. В Uncore-части находятся кэш L3, контроллеры памяти и шины QuickPath Interconnect (QPI), о которой мы расскажем чуть ниже. Благодаря такому разделению Intel получила возможность гибко управлять частотами ядер, обеспечить работоспособность и приемлемое тепловыделение большого объема кэша L3.

Каждое ядро процессора снабжено 32 КБ кэша L1 для инструкций, 32 КБ L1 для данных и 256 КБ кэша L2. Казалось бы, в сравнении с Xeon 5400 L2 уменьшился втрое, однако заметного урона производительности это не нанесло. Малый объем кэша нивелируется его низкой латентностью – всего 10 нс, а за хранение данных отвечают 8 МБ общего кэша L3, задержки при обращении к которому также снижены. Если же возникает необходимость передать их от одного ядра другому – проблем не будет, так как кэш L3 инклюзивен.

Интегрированный контроллер ОЗУ

Новый контроллер памяти позволяет работать с DDR3 в трехканальном режиме и поддерживает модули с ECC. Тестирование настольных версий Nehalem показало, что в большинстве десктопных задач принципиального прироста быстродействия от появления третьего канала доступа к памяти не наблюдается, однако для серверного применения ситуация может быть абсолютно иной. Например, популярные сегодня серверы для виртуализации крайне требовательны к пропускной способности RAM. Еще одним косвенным достоинством нового контроллера памяти является то, что использование DDR3 позволит сократить энергопотребление и тепловыделение серверов и снизить латентность подсистемы памяти – из-за дополнительного буфера потребление модулей FB-DIMM на 5–20 Вт выше, чем аналогичных по частоте DDR2, и большинство этой энергии выделялось в виде тепла. Также буфер сильно увеличивает латентность, хоть пропускная способность модуля также заметно растет. Таким образом, DDR3 позволит уменьшить энергопотребление не менее чем на 30% – как минимум за счет сниженного с 1,8 В до 1,5 В номинального напряжения питания. Также DDR3 имеет значительно более высокий частотный потенциал, благодаря чему Intel при необходимости сможет легко наращивать производительность подсистемы памяти в своих серверных платформах. Теоретическая пропускная способность ОЗУ в трехканальном режиме с использованием DDR3-1333 составляет до 32 ГБ/с на контроллер, и добавление каждого следующего процессора будет ее наращивать. Для сравнения, AMD Opteron (Shanghai), поддерживающие DDR2-800, имеют показатель 12,8 ГБ/с.

Конец эпохи FSB

Intel Xeon 5500 начало новой эпохи
Блок-схема новой серверной платформы Intel

Второе крупное нововведение в Xeon 5500 – шина QuickPath Interconnect с топологией «точка-точка», полностью устраняющая основной недостаток архитектуры Intel прошлого поколения. В отличие от десктопных CPU Core i7 серверные модели оборудованы двумя линиями QPI, что позволяет выделить всем критичным направлениям (связь двух процессоров между собой и каждого из них с северным мостом) по собственному соединению. Это соединение представляет собой пару из двух шин разрядностью до 20 бит, функционирующих в режиме полного дуплекса, снабженных задающей тактовую частоту линией. Нынешние модели Intel Core i7 и Xeon 5500 работают с ними в 16-битовом режиме. В секунду QPI может передавать данные от 4,8 до 6,4 млрд раз, что обеспечивает полезную пропускную способность от 9,6 до 12,8 ГБ/с в каждую сторону, не считая данных CRC. Это вдвое выше FSB 1600 МГц у наиболее быстрых чипсетов Intel прошлого поколения. При нарушении сигнала в одной или нескольких из линий контроллер шины может автоматически перенастроить QPI на ширину 15 и даже 5 бит, не теряя работоспособности. Таким образом, серверы на базе Xeon 5500 должны быть крайне устойчивы к сбоям шины.

Появление прямой связи между процессорами позволило Intel реализовать архитектуру доступа к памяти NUMA (Non-Uniform Memory Access), столь необходимую для критичных к быстродействию ОЗУ задач в многопроцессорных средах. Теперь оптимизированные под NUMA операционные системы и приложения смогут при генерации и распределении вычислительных потоков учитывать, в каком сегменте памяти размещать данные, чтобы не обращаться за ними в удаленную и, следовательно, намного менее быструю память. Благодаря этому оптимизированные приложения, генерирующие по одному потоку на ядро CPU, получат вплоть до 5,3-кратного прироста пропускной способности по сравнению с четырехканальной общей FB-DIMM. При этом оптимизацию под NUMA можно отключить в BIOS серверной материнской платы, вновь сделав всю установленную в системе RAM общей, впрочем, вряд ли многим потребителям это понадобится, так как большинство современных операционных систем поддерживают NUMA.

С точки зрения вычислительной производительности ядра Xeon 5500 не претерпели коренных изменений по сравнению с Xeon 5400 с архитектурой Core 2, однако несколько значительных новшеств все же есть. Прежде всего, в Nehalem вернули технологию Hyper-Threading, знакомую нам еще со времен Pentium 4. Она позволяет реорганизовывать очередь микроопераций и запускать их исполнение на тех блоках, которые в данный момент не заняты вычислениями. Таким образом, если производятся как целочисленные вычисления, так и работа с плавающей точкой, можно добиться очень существенного прироста быстродействия. Однако при конфигурировании сервера под конкретные задачи нужно проверять, действительно ли Hyper-Threading приносит пользу: при высокой оптимизации многопотокового кода (особенно в HPC) либо при наличии задач, критичных к памяти, исполняемые на «виртуальных» ядрах потоки могут заметно замедлить систему.

Sun Microsystems выпустила платформу для Solaris на базе новых Intel Xeon

Intel Xeon 5500 начало новой эпохи

Корпорация Sun Microsystems сообщила об усовершенствовании платформы Solaris, включающей ОС Solaris 10 и OpenSolaris, которое направлено на поддержку расширенных функций для повышения производительности, энергоэффективности и надежности, реализованных в новых процессорах Intel Xeon серии 5500.

«Благодаря очередной модернизации ОС Solaris можно будет использовать все преимущества процессоров Intel Xeon серии 5500 и представить на рынке новаторские системы класса предприятия, – заявил Джон Фаулер (John Fowler), исполнительный вице-президент корпорации Sun Microsystems по вычислительным системам.

«Уже два года обе компании сотрудничают в области оптимизации ОС Solaris 10 и OpenSolaris, чтобы в полной мере использовать все преимущества интеллектуальной производительности и автоматизированного энергопотребления процессоров Intel Xeon серии 5500, – отметил, со своей стороны, Дуг Фишер (Doug Fisher), вице-президент группы Software and Services Group и генеральный директор подразделения Systems Software Division Intel. – Результат этой совместной деятельности – создание тесно интегрированного программно-аппаратного комплекса, позволяющего добиться выдающегося быстродействия, энергоэффективности и надежности центров обработки данных».

Sun Microsystems и Intel усовершенствовали функциональные возможности ОС Solaris по управлению питанием, добавив поддержку дополнительных режимов энергопотребления, реализованных в процессорах Intel Xeon серии 5500, чтобы повысить энергоэффективность благодаря регулировке мощности процессора в соответствии с текущей загрузкой системы. Поддержка новых режимов экономии энергии Intel Deep C-States позволяет существенно снизить энергопотребление ядер процессора, находящихся в состоянии ожидания.

30 марта 2009 г. по результатам двухуровневого эталонного теста SAP SD Standard Application Benchmark двухпроцессорный сервер Sun Microsystems на базе процессоров Intel Xeon серии 5500, Sun Fire X4270 (2 CPU/8 ядер/16 потоков) при работе ПО SAP ERP Release 6.0 Enhancement Pack 4 (Unicode) под управлением ОС Solaris 10 установил рекорд производительности для систем своего класса, продемонстрировав следующий результат: 3700 пользователей SAP SD, 20300 SAPS. Номер сертификата SAP – 2009005.

Turbo-режим

Еще одно нововведение, ранее не встречавшееся ни в процессорах Intel, ни в продуктах AMD – это технология Turbo Boost. Суть ее состоит в том, что в случае простоя одного или нескольких ядер и наличия запаса до верхнего порога тепловыделения (TDP) активно используемые ядра могут повысить свою частоту путем подъема множителя на 1-3 позиции (133–400 МГц). Это можно назвать своеобразным «саморазгоном» CPU, однако он в то же время никогда не превысит собственного теплового пакета и максимального уровня энергопотребления. Учитывая, что идеально отлаженного ПО с высокой степенью параллелизации, способного полностью загрузить восемь ядер сервера, очень мало, эта функция будет активна большую часть времени, благо 45-нанометровый техпроцесс позволяет удерживать тепловыделение со значительным запасом прочности. С точки зрения практического применения Turbo Boost будет полезна почти везде: несмотря на неполную загрузку ядер, базы данных получат снижение времени отклика и обработки транзакций, приложения, выполняющие рендеринг – уменьшение времени обработки однопотоковых фильтров и т. д.

Виртуализация

Intel Xeon 5500 начало новой эпохи
Схема электрического отключения ядер в Xeon 5500

Для задач виртуализации Intel внедрила в Xeon 5500 и чипсет для них (под названием Intel 5520) новое поколение своего комплекса Intel Virtualization Technology (VT-x, VT-d и VT-c). VT-x теперь включает в себя функцию аппаратной трансляции памяти виртуальных машин в физическое ОЗУ и возможность предоставления гостевым ОС функции перестроения очереди задач хост-системы без ее участия. Также технология предусматривает легкую миграцию с серверов Intel предыдущих поколений и гибкое управление нагрузкой (FlexMigration и FlexPriority).

VT-d предусматривает предоставление чипсетом выделенных портов и устройств ввода-вывода отдельным гостевым ОС, минуя виртуальную машину, что снижает задержки и устраняет дополнительную нагрузку на систему в целом.

К функциональности VT-c относится управление сетевым трафиком и маршрутизацией виртуальных машин непосредственно силами контроллера Ethernet. Новая серверная платформа, кроме процессоров с архитектурой Nehalem и чипсета для них, будет содержать и новый сетевой контроллер Intel 82599 10 GbE.

Тепловыделение и энергопотребление

Естественно, описывая продукты для серверного рынка, кроме быстродействия, необходимо остановиться и на показателях тепловыделения и энергопотребления. Большинство Xeon семейства 5500 будут иметь TDP 80 Вт. Три наиболее производительные модели, ориентированные на серверы высшего класса – X5570, X5560 и X5550, рассчитаны на тепловыделение 95 Вт. Также в линейке серверных процессоров имеются два CPU со сниженным до 60 Вт TDP. Что касается моделей для рабочих станций, номера которых начинаются с буквы W, то для них установлено значение 130 Вт, однако учитывая сборку в полноразмерных корпусах, это не должно быть проблемой. Отметим, что с новым семейством Xeon Intel перестала поставлять в комплекте с процессорами системы охлаждения. Теперь их нужно будет приобретать отдельно, выбрав из трех возможных моделей – пассивной низкопрофильной, активной с простым алюминиевым радиатором для Xeon среднего класса и активной со сложным радиатором и тепловыми трубками для топовых продуктов.

Что касается снижения энергопотребления системы, то этому направлению Intel уделила самое пристальное внимание. Прежде всего, каждое ядро и процессорное гнездо в целом имеют четыре состояния питания (C-states): С0, С1 (С1Е для разъема), С3 и С6. В состоянии С0 ядра и разъем получают питание в полном объеме, и все блоки активны. В режиме С1 отключается питание функциональных блоков ядер, однако вся остальная логика процессора и его разъема остаются включенными. Состояние C3 предусматривает полное отключение тактового генератора ядра/ядер, выгрузку содержимого кэшей L1-L2 в кэш L3 и отключение ядер и их кэшей. Наконец, наиболее глубокий режим покоя процессора – C6 – полностью электрически отключает ядра и кэши L1-L2 от питания с помощью специального ключа. Таким образом, в режиме простоя Core-часть процессора может вообще не потреблять ток и, соответственно, не выделять тепла. Итоговое энергопотребление CPU составляет около 10 Вт, приходящихся на кэш L3, шину QPI и контроллер памяти. Учитывая тот факт, что постоянная полная загрузка процессоров в реальных эксплуатационных условиях встречается довольно редко, для большого парка серверов экономия на электроэнергии и кондиционировании с течением времени может составить значительную сумму.

Собственные подсчеты Intel говорят, что средний цикл обновления парка серверов в вычислительных центрах составляет три–пять лет. Таким образом, если взять парк из 184 серверов поколения 2005 г., то замена их на 184 сервера на базе Xeon 5500 позволит снизить энергопотребление на 18% при росте производительности в девять раз. Если же осуществлять замену без увеличения быстродействия, то понадобится всего 21 новый сервер, а экономия на электроэнергии составит 92%. Кроме того, в уравнении появится множество новых факторов: цена лицензий на ПО, установленное на этих серверах, стоимость площадей для серверных комнат и их инфраструктуры, обслуживания и ремонта серверов и т. д.

Quo vadis, Xeon?

31 марта корпорация Intel представила 17 моделей Xeon с архитектурой Nehalem, четыре из которых ориентированы на рабочие станции, а остальные – на серверы разных уровней производительности. Среди них есть четыре энергоэффективные модели и даже один процессор бюджетного уровня всего с двумя ядрами, частотой 1,86 ГГц и ценой $188. Отметим, что CPU начального уровня лишены поддержки Hyper-Threading, Turbo Boost и оборудованы всего 4 МБ кэша L3. Еще три процессора Xeon для однопроцессорных рабочих станций – W3570, W3540 и W3520 – поступят на рынок с небольшой задержкой. Они будут практически идентичны имеющимся с ноября прошлого года в продаже процессорам Core i7 965, 940 и 920 соответственно, главное отличие между ними состоит лишь в поддержке памяти DDR3 с коррекцией ошибок.

Соотношение новинок с продукцией прямого конкурента очень напоминает ситуацию на десктопном рынке. В ассортименте AMD нет моделей Opteron, способных конкурировать с двумя самыми производительными Xeon X5570 и X5560 (наиболее быстрый Opteron 2389 с частотой 2,9 ГГц стоит $989 и противопоставляется Xeon X5550). Если сравнивать тактовые частоты, то заметно, что продукты AMD работают в среднем на 100–200 МГц быстрее соответствующих им по цене моделей Intel, однако, как мы видели в тестировании AMD Phenom II X4, такого преимущества в частоте может быть недостаточно. У AMD остался последний козырь в лице Opteron 8300 (Barcelona и Shanghai), способных работать в четырех- и восьмипроцессорных конфигурациях, но ответ на него в архитектуре Nehalem будет дан во втором полугодии 2009 г. Кроме того, AMD планирует бороться с Nehalem EP выпуском шестиядерных процессоров с кодовым названием Istanbul, которые, по неофициальным данным, могут появиться на рынке уже в июне. Смогут ли они напрямую конкурировать с новыми Xeon по производительности или придется обратиться к проверенным годами ценовым методам привлечения потребителей – пока неясно. Тем временем уже сейчас на рынке CPU для двухпроцессорных серверов и рабочих станций новые Xeon способны сильно пошатнуть позиции соперника.

НР выпускает HP ProLiant G6 и предлагает пересмотреть подход к оптимизации затрат

Intel Xeon 5500 начало новой эпохи

31 марта HP представила новое поколение серверов НР ProLiant G6, производительность которых по сравнению с оборудованием предыдущего поколения выросла вдвое, что обеспечивает большую отдачу вложенных средств. Компания выпустила 11 обновленных моделей HP ProLiant G6, что стало самым масштабным пополнением линейки.

Новые модели отличаются от других серверов стандартной архитектуры x86 повышенной энергоэффективностью, охватывая множество функций, сокращающих энергопотребление: HP Sea of Sensors, Common Power Slot, HP Dynamic Power Capping.

Инструмент HP ProLiant Onboard Administrator упрощает настройку сервера и дает возможность проверить его состояние из любой точки, даже когда сервер выключен. Консоль управления HP Insight Control Environment (ICE) впервые представлена в едином наборе с HP ProLiant; позволяет сократить операционные расходы (до 48 тыс. долл. на каждых 100 пользователей) благодаря мониторингу и управлению серверной инфраструктурой, в том числе в удаленном режиме.

По сравнению с предыдущим поколением серверов НР ProLiant G6 поддерживает в два раза большие объемы оперативной памяти и дискового пространства, а также повышает производительность на 100% благодаря применению Intel Xeon 5500 и нового HP Smart Array Modular Controllers.

HP Server Migration Pack упрощает процедуру обновления за счет автоматизации миграции со старых серверов на НР ProLiant G6. Несложный процесс, управляемый интерактивным помощником, позволяет аккуратно и безошибочно перенести ОС, приложения и данные с одного сервера на другой.

Линейка серверов HP ProLiant G6, основанная на процессорах Intel Xeon 5500, включает в себя следующие модели: HP ProLiant DL380, DL370, DL360, DL180 и DL160 в корпусах, предназначенных для монтажа в стойку; лезвийные серверы HP ProLiant BL 490c, BL 460c и BL 280c; HP ProLiant ML370 и ML150 в корпусах типа «башня».

Представленные продукты уже доступны, начальная цена на серверы HP ProLiant G6 зависит от конкретной конфигурации и варьируется от 880 до 2790 евро.

+22
голоса

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT