`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Атака на серверном фронте

Статья опубликована в №12 (678) от 7 апреля

+22
голоса

Процессоры Xeon c архитектурой Nehalem призваны вернуть Intel доминирующие позиции во всех сегментах корпоративного рынка – от рабочих станций для систем проектирования до многопроцессорных серверов для HPC. Смогут ли они это осуществить?

Быстродействие серверных платформ – показатель довольно специфический, так как очень многое здесь зависит от аппаратной конфигурации, настроек операционной системы и ПО, особенностей конкретных архитектур и т. д. Сервер на базе самого быстрого в высокопроизводительных вычислениях (HPC) процессора может оказаться на последних местах в задачах виртуализации, а аутсайдер, наоборот, займет первое место. В случае Intel Xeon с архитектурой Core 2 такие ситуации не были редкостью: эти CPU демонстрировали отличное быстродействие в рендеринге в пакетах CAD/CAM/CAE и видеоредакторах, разного рода СУБД, однако часто уступали AMD Opteron в HPC и виртуализации, особенно в многопроцессорных системах.

Адекватное всестороннее исследование быстродействия серверных платформ в типичных приложениях – задача, требующая не только значительного количества времени, но и глубоких знаний зависимостей и принципов работы этих приложений. Потому при подготовке данного материала мы обратились за содействием к компаниям-партнерам Intel, разрабатывающим и реализующим серверные решения на базе процессоров корпорации под конкретные нужды клиентов – «Юстар» и Entry. Стоит сразу оговориться, что конфигурации платформ этих компаний не идентичны и не могут сравниваться между собой напрямую. К сожалению, у нас не было в наличии сходного по уровню производительности либо по позиционированию сервера на основе AMD Opteron, потому мы ограничились сравнением платформ Intel двух поколений.

Значительная часть всех устанавливаемых серверов в нынешнее время в большей или меньшей степени используется для работы с базами данных. Конкретные реализации могут быть разными – от систем поддержки принятия решений, анализа рисков до back-end складского и бухгалтерского учета. Потому мы включили в тестирование две задачи, ориентированные на базы данных – 64-разрядный тест в «1С:Предприятие 8.1» и 32-разрядный синтетический тест OLTP в пакете Sysbench.

Технические характеристики серверов
Производитель сервера «ЮСТАР» uSystem ErgoLan SR1560SFHS «ЮСТАР» uSystem ErgoLan SR1630BC Entry x217 Entry x7002
Материнская плата Intel S5400SF Intel S5500BC Tyan GT24 B5397G24W4H Tyan GT20-B7002
Процессоры 2×Intel Xeon E5440 2×Intel Xeon X5560 2×Intel Xeon E5440 2×Intel Xeon X5560
Частота CPU 2,8 ГГц
Объем, тип ОЗУ 4 ГБ DDR2-667 FB-DIMM 4 ГБ DDR3-1066 reg. 8 ГБ DDR2-667 FB-DIMM 8 ГБ DDR3-1066 reg.
Контроллер жестких дисков Intel 6321ESB Intel ICH10R Adaptec SAS RAID 5405
Жесткие диски 250 GB SATA + 128 GB SATA II SSD 4x 147GB Hitachi UltraStar 15K300 RAID-10
Операционная система Microsoft Windows Server 2008 x64

База данных OLTP: Sysbench 0.4.12

Тестирование в Sysbench ориентировано на замер количества обработанных транзакций в ПО MySQL и предъявляет очень высокие требования к подсистеме ввода-вывода. Несмотря на то что размер генерируемой пакетом таблицы в 100 000 рядов составляет всего 10 КБ (т. е. пропускная способность интерфейса некритична), число обращений к дисковой подсистеме крайне высоко. Это означает, что система хранения должна иметь максимально низкую латентность. Идеальным вариантом было бы разместить базу данных в оперативной памяти, однако Sysbench не поддерживает такую функцию, поэтому на всех тестовых системах БД размещалась на SSD-накопителях, а режим доступа к таблице был ограничен чтением.

Результаты замеров весьма интересны и ярко иллюстрируют тезис о том, что быстродействие системы в целом – результат работы как аппаратного, так и программного обеспечения. Суть теста Sysbench состоит в том, чтобы выяснить, каково среднее время выполнения транзакции и сколько их процессор способен обработать в секунду. Пакет выполняет достаточно простые запросы, не требующие сложных вычислений от процессора, однако этих запросов очень много и исполняются они в многопотоковом режиме. Один из основных факторов, влияющих на эффективность, – работа планировщика потоков в ОС и качество реализации связи с ним в СУБД. В случае MySQL существует проблема, возникающая на мультипроцессорных системах при числе потоков более восьми – появляются непредвиденные задержки при обработке запросов. Поэтому для адекватной оценки быстродействия нам пришлось выключить Hyper-Threading в этом тесте, ограничившись восемью физическими ядрами процессоров. Как видно на диаграмме, производительность новых CPU в OLTP выросла очень существенно: система на базе двух Xeon X5560 обгоняет аналог на двух Xeon E5440 на 85%. Поскольку по «чистой» вычислительной производительности Nehalem опережает Core 2 примерно на 20%, основная заслуга в результате, очевидно, принадлежит встроенному трехканальному контроллеру памяти, быстрой шине QPI и значительно ускоренным кэшам в Nehalem. Кроме того, не стоит забывать и о функции Turbo Boost, которая в данном случае повышала частоту ядер на два множителя, т. е. на 266 МГц, в результате чего частота процессора поднималась до 3066 МГц.

Entry выпустила серверы на основе Intel Nehalem

Атака на серверном фронте

Компания Entry начинает поставки серверов на базе новой архитектуры Intel Nehalem и CPU Xeon серии 5500. Представленное семейство Entry x70xx охватывает 2-процессорные системы, оптимизированные под задачи корпоративной инфраструктуры.

По заявлению компании, новые серверы в ряде приложений обеспечивают прирост производительности на 70–125% по сравнению с системами на базе Xeon 54xx. Тестовая эксплуатация показала, что наибольший эффект наблюдается на ресурсоемких задачах, в которых используется множество параллельных потоков данных и частое переключение между сегментами памяти.

Причиной такого роста называют нововведения в микроархитектуре Intel Nehalem. За счет интегрированного в процессорное ядро контроллера памяти, технологии Hyper-Threading и шины QuickPath обеспечивается высокая полоса пропускания, востребованная в многопотоковых нагруженных средах. Благодаря Turbo Boost ускоряется выполнение задач с одним базовым управляющим процессом.

«1С:Предприятие 8.1»

Атака на серверном фронте
Атака на серверном фронте
Атака на серверном фронте
Атака на серверном фронте
Атака на серверном фронте
Атака на серверном фронте

Заранее оговоримся: впервые в роли тестовой платформы выступает «1С:Предприятие 8.1» (x86-64, 13 релиз) в конфигурации «УПП для Украины» (ред. 1.2.2), в которой используются «живые» данные. Впервые это тестирование проводится на платформе Windows Server 2008 + Terminal Service + + MS SQL Server 2005. Ну и новизна самой платформы Intel Xeon 55xx (Nehalem EP) наложила свой отпечаток.

Тестирования производились в файловом и SQL-режимах, но публикуются только самые показательные результаты. Для Xeon 55xx был включен HT. Более подробно методика описана в прошлых публикациях (ko-online.com.ua/27963/).

Выгрузка данных – это относительно короткая операция, и прирост производительности у новой платформы невелик – от порядка 8% для файловой версии до чуть более 10% для SQL. Загрузка данных – это фактически «восстановление из резервной копии», операция намного сложнее. Результат – Nehalem на 16% быстрее в файловом режиме и на 24% – в SQL. Тестирование и Исправление ИБ (все включено, режим исправления) – довольно тяжелая и длительная задача. Xeon 55xx на 21% быстрее в файловом режиме и на 28% – в SQL. По всем трем тестам хорошо прослеживается следующая тенденция: чем выше нагрузка, тем больший отрыв демонстрирует новая платформа от старой.

Специализированная обработка «Тиражирование справочников» – несложный тест, простейший вариант Insert для одной таблицы. С ростом нагрузки растет отрыв в производительности нового серверного CPU относительно старого – на 14, 17 и 24% для трех, пяти и семи потоков. Еще интереснее результаты получаются у обработки «Тиражирование документов». Здесь еще больше проявляется «любовь к нагрузкам» Nehalem-EP – 14, 24 и 42% прироста для трех, пяти и семи потоков. Отмеченная в монопольных тестах тенденция, что с ростом нагрузки растет и отрыв в производительности нового Xeon относительно старого, подтвердилась и на многопотоковых тестах, причем еще более явно.

«Тиражирование последовательности документов с их проведением» – самый жесткий тест. Он наиболее интересен в многопотоковом режиме, потому что показывает способность системы справиться с множественными запросами к различным связанным таблицам одновременно. Именно в этом тесте новый серверный процессор от Intel проявил себя «во всей красе» – дав прирост 57, 72 и 94% производительности при трех, пяти и семи потоках соответственно! Построение отчета «Взаиморасчеты» – простой Select по одной таблице, зато он выполняется одновременно многими пользователями и очень часто (брался большой период). Здесь рост не столь потрясающий и даже слегка странный – для трех и пяти потоков 28%, а вот для семи – уже 47%. Возможно, это вызвано скоростью отработки не самой «1С», а MS SQL Server 2005, который «не заметил» разницы между тремя и пятью потоками, но «отреагировал» на семь.

Что осталось за кадром: система на базе Xeon 54хх после запуска задач плавно перемещала их с одного ядра на другое, и только через некоторое время исполнение задачи фиксировалось на каком-то одном ядре (и то не всегда). Совершенно по-другому вел себя Xeon 55хх – на нем задача жестко закреплялась за каким-то одним ядром и оставалась на нем до конца. Безусловно, такое поведение вполне оправдано и явно позволяет повысить быстродействие – но как это удалось сделать Intel, учитывая, что ПО было одинаково на обеих платформах? Возможно, это «первые ласточки» оптимизации? И какими будут результаты, когда ПО будет еще более оптимизировано под Nehalem?

Второй момент – ощущение, что далеко не все удалось «выжать» из платформы. К сожалению, сделать тесты с большей нагрузкой в отведенное нам время не удалось, но можно с уверенностью предположить, что при ее дальнейшем увеличении выигрыш окажется даже более существенным. Уже тот факт, что RAM работала в двухканальном (а не трехканальном) режиме и на частоте 1066 МГц, а не на максимальной 1333 МГц (на момент начала тестов мы просто не нашли ее в Украине), позволяет надеяться на еще более впечатляющие результаты в реальной жизни для высокоуровневых серверов.

Рендеринг 3DStudio Max 2008

Xeon 5500 демонстрируют отличную производительность в рендеринге 3DStudio Max: со всеми активными функциями новая платформа опережает предыдущее поколение почти вдвое. Если выключить Hyper-Threading и Turbo Boost, тем самым уравнивая и тактовые частоты процессоров, и количество ядер в системе, преимущество Nehalem EP снижается, но все же остается, составляя чуть более 10%. Фактически этот прирост обеспечивается именно небольшими улучшениями в вычислительной части процессора – быстрым кэшем L2, детектором циклов, блоком предсказания ветвлений и т. д. Данный пакет CAD не критичен к оперативной памяти, потому другие подсистемы, включая даже кэш L3, влияют на производительность незначительно.

Nehalem EP и HPC

Корпорация Intel возлагает большие надежды на архитектуру Nehalem в сфере HPC. Предыдущее поколение Xeon не могло обеспечить достаточный уровень масштабируемости при увеличении числа процессоров в связи с низкой производительностью шины FSB. В частности, именно поэтому Xeon устанавливались максимум в четырехпроцессорные конфигурации – восьмипроцессорный вариант был бы технически крайне сложен и малоэффективен. Появление в Xeon 5500 новой шины QPI, соединяющей процессор как с чипсетом, так и с другим CPU в системе, полностью устраняет этот недостаток и позволяет наращивать мощность сервера без снижения быстродействия отдельных блоков. Представленные Intel 17 моделей Xeon 5500 ориентированы на двухпроцессорные системы, однако во втором полугодии будут выпущены Xeon с архитектурой Nehalem MP, которые позволят строить серверы по принципу Full Mesh, когда каждый блок системы связан с другим отдельным прямым соединением. Учитывая очень высокую пропускную способность шины QPI, можно будет рассчитывать практически на линейную масштабируемость быстродействия при добавлении каждого нового CPU.

Если же оценивать производительность имеющихся в нашем распоряжении процессоров, то можно говорить о росте вычислительной мощности на уровне 10–15% в двухпроцессорных конфигурациях по сравнению с предыдущей платформой. В LINPACK при размерности матрицы 30 000 Xeon X5660 обеспечивает 85,8 GFLOPS, а Xeon 5440 – 77,4 GFLOPS. Стоит учитывать, что этот тест – простое перемножение матриц заданной размерности, и потому зависимость от быстродействия подсистемы памяти проявляется только на очень больших размерностях. В данном случае при установленных в сервер 8 ГБ DDR3 она невелика, кроме того, высокая интенсивность вычислений не позволяет эффективно работать технологии Hyper-Threading. В основном, HPC-приложения используют для расчетов множество разнообразных данных, потому интегрированный контроллер ОЗУ сможет обеспечить значительное преимущество новых Xeon над старыми. Так, в сети есть информация о том, что в моделировании столкновений с помощью пакета LSDyna Nehalem EP опережает работающие на равной частоте Xeon X54xx практически вдвое.

IBM представила ряд серверов System x нового поколения

Атака на серверном фронте

Компания IBM анонсировала новое поколение серверов и программного обеспечения линейки System x на базе платформы Intel Xeon 5500. Модели характеризуются простотой развертывания виртуализированных вычислительных сред, снижением операционных затрат, повышенной производительностью, упрощенным управлением и увеличенной нагрузочной способностью. В линейку входят System x3550 M2, System x3650 M2, BladeCenter HS22, iDataPlex dx360 M2.

Выпуском новых систем IBM прежде всего отвечает на запросы современных ЦОД, где стоимость электроэнергии и обслуживания часто практически не зависит от степени загрузки вычислительных блоков. Четыре стоечных и лезвийных х86-сервера отличаются уникальной конструкцией, за счет которой возможно сокращение издержек на электроэнергию на 93%. Кроме того, некоторые модели отличаются удвоенной производительностью по сравнению с прошлым поколением и поддерживают больший объем ОЗУ, расширенные СХД и СВВ. Системы System x могут быть укомплектованы от 96 ГБ до 1 ТБ оперативной памяти.

Анонсированное ПО Systems Director Active Energy Manager дополняет набор IBM Systems Director 6.1 и предоставляет мощные средства для автоматического управления виртуальными и физическими ресурсами, отличаясь легким в освоении веб-интерфейсом со встроенными мастерами настроек и интерактивными учебниками. При этом экономия на обслуживании может достигать 34,5% для Windows и 43,8% – для систем под управлением Linux. Заявлена поддержка IBM Power Systems, System z, хранилищ данных и серверов архитектуры х86 других производителей.

Модель System x3650 M2 продемонстрировала рекордные результаты в тесте SPECPower_ssj2008, двухуровневом SAP SD Standard Application Benchmark и виртуализационном тестовом пакете VMware VMmark для двухпроцессорных систем, а IBM BladeCenter HS22 – также и в тесте SPECjbb2005.

Помимо стоечных и лезвийных, во II квартале IBM также планирует выпуск башенных серверов, базирующихся на Intel Xeon 5500, которые также будут полностью поддерживать все основные функции новой платформы.

Итоги тестирования

Семейство процессоров Intel Xeon 5500 – безусловно, новая ступень развития серверных платформ корпорации, призванная вывести их на первое место во всех сферах применения подобной продукции. Архитектура Nehalem, уже отлично показавшая себя в настольных решениях, лучше всего раскроется как раз в серверных процессорах, поскольку устраненные в ней недостатки предыдущего поколения наиболее ярко проявлялись именно в этом сегменте. Xeon 5500 превосходит Xeon 5400 с равной тактовой частотой примерно на 10–15% по чистой вычислительной производительности, но технологии Hyper-Threading, быстрая шина QPI и встроенный контроллер памяти при равномерной загрузке всей системы в целом приносят дивиденды, иногда измеряемые даже сотнями процентов. Такое быстродействие, дополненное сниженным энергопотреблением и тепловыделением, а в будущем – беспроблемным масштабированием в многопроцессорных средах, практически обеспечивает успех Nehalem EP.

Благодарим компании «ЮСТАР» и Entry
за помощь в организации тестирования

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

+22
голоса

Напечатать Отправить другу

Читайте также

Странно вроде одни люди всю тему недели писали....
В первой статье хаем старый Зеон - "полумеры для разгона", "оптимизированные приложения", "ориентация на корпоративный сектор", "высокая цена".
В последней ~10% прироста производительности в чистом виде. Все остальное - те же костыли, только более усовершенствованные (SSD, HT, прочее).
Меньше энергии потребляет - хорошо. Виртуализация - еще лучше. И все.

Вопрос.
1С на одном камне с включенной НТ не пробовался? Есть подозрение, чот дело не в кол-ве ЦП. Этот глюк еще лет 6 назад можно было наблюдать, когда вышли первые Зеоны с НТ.

Странно, что в качестве "старой" системы был выбран процессор-середняк 5440, в то время как 5560 - это без минуты топовый камень. Логичнее было бы взять 5460 для этих целей. Или даже наоборот - показать, что в новом семействе средний процессор гораздо более производителен, чем топовый в старом. А так собственно, все логично - топовый в новом быстрее, чем средний в старом.
Может конечно рассчет делался на одинаковую частоту 2.8ГГц - пардон, сравнивать по частоте вроде как перестали еще году в 2002, как АМД начал вводить свои рейтинги.

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT