`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Тестирование платформы Bensley: первые результаты

+11
голос

До официального представления процессоров Woodcrest осталось совсем немного времени, но поскольку к нам в Тестовую лабораторию попали первые инженерные образцы новых разработок от Intel, мы решили опубликовать ряд результатов, которые, бесспорно, заинтересуют наших читателей. Правда, с определенной оговоркой – все-таки стоит делать поправку на то, что в серийных изделиях они могут оказаться иными.

Вступление

Прошло около года с момента публикации предыдущего материала, посвященного тестированию двухпроцессорных серверов с использованием в качестве тестового приложения платформы «1С:Предприятие» 7.7 в наборе с MS SQL Server 2000 и терминальным доступом – наиболее распространенного режима эксплуатации корпоративных вариантов ERP-подобных систем на базе платформы 7.7. от «1С» . Еще тогда нам очень хотелось протестировать двухъядерный серверный процессор от Intel новой архитектуры, поскольку именно в тестах на основе ПО «1С:Предприятие» 7.7 мобильные ПК на базе Pentium M демонстрировали весьма впечатляющие результаты. Однако достать его, к сожалению, не удалось (равно как и сервер на основе процессоров Pentium M). И вот наконец нашей Тестовой лаборатории представилась возможность оценить совершенно новые платформы, причем в нескольких конфигурациях – тесты проводились на двухпроцессорных, четырехъядерных, 8-потоковых серверах на архитектуре Bensley c новыми процессорами под кодовыми названиями «Dempsey» и «Woodcrest».

Тестирование платформы Bensley первые результаты
Прототип сервера нового поколения, разработанный компанией Supermicro, на базе которого производилось тестирование. Предоставлен компанией Onix www.onix.kiev.ua
Тестирование платформы Bensley первые результаты
Применение новой трассировки для памяти нового типа позволило разместить на плате Super X7DB8+ рекордное количество слотов – 16 штук. Пока это единственная в мире плата, допускающая установку такого количества модулей FB-DIMM
Тестирование платформы Bensley первые результаты
Процессоры нового поколения отличаются очень низким TDP по сравнению с предшественниками, что позволило применить схему охлаждения с значительно пониженным уровнем шума

Для начала коротко напомним, в чем особенность тестов именно на платформе «1С:Предприятие» 7.7 в наборе с MS SQL Server 2000 и с терминальным доступом. В примененном тестовом ПО задачи выполняются однопоточно, в режиме интерпретации, с объектно-ориентированным кодом и большим количеством труднопредсказуемых переходов. С точки зрения специалиста по аппаратным средствам, реализация такого кода в пределах сессии возможна только в виде одного потока со множеством обращений к различным сегментам памяти (что требует высокой ассоциативности кэша, как можно более длинных TLB и низкой латентности подсистемы памяти в целом) и довольно частым непопаданием блоков предсказания ветвления. Само приложение MS SQL Server 2000 великолепно использует все возможности многопотоковых сред и при этом отличается «потоковым» подходом к работе с подсистемой памяти, к чему традиционно оптимизированы процессоры Intel последних поколений.

Терминальный доступ с его количеством потоков как нельзя лучше использует многопотоковые среды, и, наряду с MS SQL Server 2000, получает наибольшую выгоду не только от многопроцессорности и многоядерности, но и от появления логических процессоров – технологии Hyper-Threading. В то же время он предусматривает частые переключения процессоров между различными потоками инструкций, а подсистемы памяти – между ее сегментами, сильно снижая эффективность кэш-памяти CPU. Здесь, как и в «1С:Предприятие» 7.7, желательны низкая латентность доступа к данным, высокая ассоциативность кэшей и наиболее длинный буфер прямых ассоциаций между логическим и физическим сегментами данных (TLB).

Проводились три группы тестов: «сервисные», «узкие места», и «производительность». Выполнялись они только в режиме SQL, на БД объемом 1,4 GB, которая полностью помещалась в RAM – с целью уменьшения влияния дисковой подсистемы. Подробнее методика, условия тестирования и применяемое ПО описаны в уже упоминавшейся статье.

К существенному отличию систем, кроме процессоров, следует отнести применение в обеих тестируемых платформах, Dempsey и Woodcrest, нового типа RAM – FB-DIMM, отличающегося как бoльшей потоковой пропускной способностью, так и существенно возросшей латентностью.

Стоит отметить, что, помимо тестов на базе «1С:Предприятие» 7.7, они выполнялись и по оцифровке видеопотока, что весьма интересно для сравнения с предыдущими разработками Intel. Впрочем, их результат, хоть и достаточно наглядно демонстрирует возможности новой системы, но все-таки не отражает картину работы пользователя с реальными задачами.

Процесс тестирования

Тестирование платформы Bensley первые результаты

Тесты по обработке видеопотока проводились при помощи TMPG-кодера на базе файла большого объема (свыше 12 GB) в формат MPEG-2 с максимальными параметрами качества в двухпроходном режиме. Отдельная диаграмма отображает время, затраченное на данную операцию, как параметр, представляющий наибольший интерес для частного случая использования подобных систем. Поскольку этот тест можно назвать исключительно сопроводительным, останавливаться на нем подробнее нет смысла, поэтому перейдем к тестам на базе «1С:Предприятие» 7.7.

Блок «сервисных» тестов

Тестирование платформы Bensley первые результаты

Выгрузка БД. Фактически это стандартная операция архивирования, довольно регулярно выполняемая администратором. Из ее особенностей отметим плохую распараллеливаемость задачи и потоковый характер.

На графике хорошо заметно, что система с Dempsey, несмотря на двухъядерность, удвоенный объем кэш-памяти (2×2 MB) и возросшие частоты (3,8 GHz), оказалась медленнее своего одноядерного предшественника с меньшими частотой (3,2 GHz) и объемом кэш-памяти (1 MB) DDR2. И дело здесь отнюдь не в процессоре – это первый из сюрпризов нового типа полностью буферизированной памяти.

В свою очередь, весьма впечатляющие результаты показал Woodcrest, на 16% превзошедший результат Dual Core Opteron, причем с той же высоколатентной памятью. Правда, тестируемый Woodcrest работает на частоте 2,66 GHz, а Dual Core Opteron – 2,2 GHz, и разница частот у них составляет 21%.

Тестирование платформы Bensley первые результаты

Загрузка БД. Также стандартная операция, применяемая для восстановления из архива или для создания копии БД. Из особенностей – плохая распараллеливаемость задачи и частые обращения к различным сегментам памяти. В этом тесте были получены сходные результаты – сравнительно низкие показатели Dempsey и при этом значительно их превышающие Woodcrest.

Тестирование платформы Bensley первые результаты

Тестирование и исправление БД. Стандартная процедура, отличающаяся высокой ресурсоемкостью и продолжительностью. Для нее характерна высокая расчетная нагрузка на процессор и частые обращения к различным сегментам памяти.

В данном тесте хорошо заметен прогресс в серверных системах от Intel, в то же время, из-за невысокой латентности обращений к RAM в решениях от AMD даже Woodcrest не смог догнать более низкочастотный Dual Core Opteron, хотя и улучшил показатели относительно Xeon почти на 30%. Кроме того, впервые в наших тестах проявила себя с хорошей стороны система на Dempsey, на 10% превзойдя одноядерный Xeon.

Блок тестов «узкие места»

Тестирование платформы Bensley первые результаты
Тестирование платформы Bensley первые результаты

Специализированная обработка «Тиражирование справочников». Несложный тест, интересный преж-де всего в многопользовательском режиме. Выполнялся путем последовательного (с промежутком в 2 с) запуска трех таких обработок с трех терминальных клиентов с фиксацией времени по завершении в последней из запущенных сессий.

В монопольном режиме показатели Dempsey улучшились относительно одноядерного Xeon всего на 4%, а вот Woodcrest продемонстрировал 22%-ный прирост.

Более любопытна ситуация в многопотоковом режиме – именно в этом тесте, имитирующем простой Insert в потоковом режиме, системы от Intel традиционно показывают великолепные результаты. Обе новые платформы продемонстрировали «неожиданный» рост (около 20%) и почти одинаковую производительность. Что, по мнению авторов, прежде всего свидетельствует о наличии у обеих систем одинакового элемента – подсистемы RAM на базе FB-DIMM. А это первый положительный результат для нового типа памяти. Отставание же систем от AMD в данном тесте выглядит не лучшим образом, хотя с переходом этой платформы на DDR2 есть надежды на их исправление.

Однако не все так гладко и у Intel. Еще одноядерные Xeon именно в этом тесте «теряли отклик» на системном уровне. И если для них это замедление составляло 5–6 с (в многопользовательском режиме), для Dempsey оно сократилось до 3–4 с. А вот Woodcrest «теряли отклик» более чем на 10 с, а то и на все время проведения теста. Такая ситуация для серверов, нагруженных большим количеством запросов, неприемлема. Но списывать это лишь на платформу и процессор Woodcrest нельзя, поскольку мы все-таки тестировали не серийный образец, и работа с дисковой подсистемой была в нем далеко не идеальной.

Тестирование платформы Bensley первые результаты
Тестирование платформы Bensley первые результаты

Специализированная обработка «Тиражирование документов». Технология выполнения данного теста, имитирующего все тот же Insert в потоковом режиме, но в более сложном варианте, аналогична предыдущим.

Результаты его неоднозначны. Это первый тест, в котором в монопольном, фактически однопотоковом (SQL здесь не очень загружен) режиме Woodcrest продемонстрировал результаты, даже более низкие, чем одноядерный Xeon. Показатель Dempsey также хуже, чем у одноядерного Xeon с DDR2, что наводит на мысль о новой подсистеме памяти, но все это не может быть единственной причиной такого эффекта.

Резко меняется ситуация в многопотоковом режиме – здесь Woodcrest проигрывает Dual Core Opteron всего 12%, а Dempsey несколько обходит одноядерный Xeon с DDR2. Как видим, налицо преимущества двухъядерных процессоров и объемного кэша для Dempsey и Woodcrest – убедительная демонстрация возможностей общего кэша для обоих ядер на примере Woodcrest.

Блок тестов «производительность»

Тестирование платформы Bensley первые результаты
Тестирование платформы Bensley первые результаты

Специализированная обработка «Тиражирование последовательности документов с их проведением». Это самый «жесткий» тест. Он интересен в режиме импорта данных из другой БД или в монопольном, так как демонстрирует производительность системы при проведении сложных документов. Еще более важен он в многопользовательском режиме, потому что показывает способность системы справиться с множественными запросами к различным связанным таблицам одновременно. В последнем случае при тестировании применялась следующая методология: в первой и второй пользовательских сессиях запускался отчет «Движения партий», который очень интенсивно работает с регистром «Партии запасов», активно задействованным в проведении всех тиражируемых документов, а в третьей – сама обработка. Таким образом, удалось достичь «наибольшего уровня помех» для выполняющейся процедуры. К сожалению, одновременно обработать три потока в трех пользовательских системах по-прежнему не сумела до конца ни одна из тестируемых аппаратных платформ.

Глядя на результаты, продемонстрированные системой на базе Woodcrest в монопольном режиме, так и хочется сказать: «Велик и могуч Intel!». Превзойти показатели конкурента почти на 60% – это очень много по любым меркам, не говоря уже о том, что одноядерный Xeon был в 4,5 раза медленнее! Весьма порадовали и результаты Dempsey, который в этом тесте улучшил достижения своего одноядерного собрата более чем в 2 раза.

Гораздо менее сенсационными были показатели в режиме, более приближенном к реальной жизни, – многопользовательском. Тут превосходство Woodcrest над Dual Core Opteron составляет 16%, а Dempsey на 30% медленнее одноядерного Xeon с DDR2...

Здесь все очевидно и без дополнительной информации – узким местом обеих новейших платформ от Intel оказалась подсистема оперативной памяти. Там, где обращений к RAM было немного, объемные кэши Dempsey и просто огромный у Woodcrest вполне справлялись с «бестолковыми» обращениями к различным сегментам RAM, а при повышении нагрузки на подсистему памяти были далеко не так эффективны. Учитывая, что мы использовали все четыре канала памяти, получить большую производительность вряд ли удастся в пределах технологии FB-DIMM. И есть серьезное подозрение, что с ростом нагрузки ситуация будет ухудшаться.

Для полноты картины озвучим и дополнительную информацию.

В процессе выполнения многопотокового теста Dempsey каждый раз загружал почти на 100% два логических ядра одного из процессоров, а не использовал его второе ядро или вообще другой CPU. С выключенным Hyper-Threading результаты здесь могли быть и лучше. Но зато четко прослеживался другой момент – 100%-ная загрузка канала памяти при среднем использовании CPU на уровне 9–13%.

Несколько иначе ведет себя с распараллеливанием задач Woodcrest. Он вполне успешно и более-менее равномерно смог распределить задачи между всеми четырьмя ядрами, чего ранее для систем от Intel не наблюдалось. Но, с другой стороны, при той же занятости канала памяти на 100% загрузка ядер колебалась в пределах 40–60%, что указывает на отличный потенциал самого CPU и слабую приспособленность к задачам такого типа подсистемы памяти новой серверной платформы Bensley.

Тестирование платформы Bensley первые результаты
Тестирование платформы Bensley первые результаты

Построение отчета «Взаиморасчеты». Тест представляет собой классический Select по двум таблицам и по частоте использования уступает только отчету «Остатки товаров», который является более простым (Select по одной таблице).

В общем-то, результат теста легко предсказуем. Потоковая обработка данных, как мы уже поняли, конек всей платформы Bensley и снабженного большим общим для двух ядер кэшем Woodcrest. Хотя стратегическим преимущество в 13% над Opteron Dual Core назвать трудно. Результаты же Dempsey не совсем понятны, так как этот тест, особенно в многопотоковом варианте, хорошо распараллеливается. Опять-таки, остается только грешить на подсистему памяти, не слишком подходящую для данного CPU в наших задачах.

Выводы

Честно говоря, делать какие-то выводы, имея на руках инженерный образец с неотлаженной BIOS и т. д., не совсем корректно. Но вот тенденции отметить можно. Очевидно, что компания Intel представила очень интересный CPU Woodcrest, который впервые, с момента появления AMD Athlon MP (а это около 6 лет!), оказался по совокупности результатов не хуже систем от AMD в весьма специфических тестах на основе платформы «1С:Предприятие» 7.7. А ведь такой же характер нагрузки имеют и многие другие задачи, к примеру связка PHP/MySQL. Кроме того, показатели, полученные при выполнении теста на кодирование видеопотока, честно говоря, достаточно интересные.

Пока трудно сказать, но впечатления от новой подсистемы памяти платформы Bensley весьма неоднозначные. Здесь можно предположить, что «совершенно новую» RIMM-подобную технологию компания Intel сумеет довести до ума, так как сама идея, по сути своей, – весьма разумная. Хотя, с точки зрения авторов, имеет смысл предложить потребителям и серверные платформы для Woodcrest с поддержкой DDR2. Тем не менее Woodcrest в очередной раз подстегнет «гонку вооружений» в области и микропроцессоров, и серверных платформ. А в выигрыше, как и положено, останутся потребители всех этих чудес технологической и инженерной мысли. В будущем было бы очень интересно провести большое тестирование не только иженерных образцов, но и сравнение Bensley/Woodcrest с AM2/DDR2 и Xeon LV (Sossaman). А в качестве тестовой платформы будет любопытно использовать не только «1С:Предприятие» 7.7, но и новые продукты 8-й версии.

+11
голос

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT