Горизонты однопроцессорных серверов

1 декабрь, 2014 - 16:54Андрій Тищенко

В интеловской стратегии разработки новых процессоров «тик-так», как в двухдольном музыкальном метре, чередуются слабая (легкая) и сильная (тяжелая) доли. «Тик» — это миниатюризация технологического процесса. По сути, внутреннее дело Intel, необременительное для остальной индустрии. «Так» — переход на новую микроархитектуру. Накрывает всех, особенно в серверостроении. Меняются не только процессоры, сокеты, материнские платы, обвязка, стандарты памяти. Возникают, смещаются и исчезают роли серверных платформ в инфраструктуре.

Процессорные архитекторы, бывает, ошибаются в оценках рыночных сегментов — и тогда их неоправданные ожидания «сбивают с ритма весь квартал». Предыдущий «так» Intel запомнился расщеплением массовых двухпроцессорных платформ на две линейки: под Xeon E5-2600 (сокет 2011) и E5-2400 (сокет 1356). По замыслу создателя, экономия на материнских платах за счет уменьшения числа каналов памяти, межпроцессорных связей и линий PCI-express должна была стать детонатором продаж бюджетных серверов на E5-2400. Но не стала. Обузой, и для производства, и для канала сбыта стало содержание двух семейств похожих продуктов. Ниши подъедали друг друга. Последний «так» положил конец этому расточительству и монополизировал двухпроцессорный сегмент за линейкой E5-2600 v3 в обновленном сокете 2011.

Зато прижилось семейство E5-1600 (сокет 2011). Однопроцессорным платформам на нем место между серверами начального уровня на E3-1200 (сокет 1150) и двухпроцессорными серверами нашлось. Оказалось, углублять ценовое дно старших систем за счет отказа от части возможностей не так продуктивно, как раздвигать охват младших. Оценим горизонты возможностей.

Общее и различия

Процессоры семейств Intel Xeon E3-1200 и E5-1600 используются в однопроцессорных серверах и рабочих станциях. У всех E3-1200 четыре ядра. У E5-1600 — 4-6, а в новой ревизии v3 есть и 8-ядерные. Позволим себе вольное сравнение CPU: разных сокетов и архитектур, но равных по количеству ядер, близких по частоте и сопоставимых по цене.

Горизонты однопроцессорных серверов

Старшие E3-1200 дотягиваются до младших E5-1600 по частотам, но сильно уступают им в объеме обслуживаемой оперативной памяти и потенциале трафика периферийных устройств: все процессоры E5 в сокете 2011 поддерживают четырехканальный режим работы памяти и 40 линий PCIe 3.0 — против 16 в сокете 1150. Платы под E3-1200 проще, беднее по оснастке, дешевле. Но с ними горизонты не раздвинуть.

Модель применения

Судьбу платформ определяют целевые приложения. Дело не только в балансе производительности основных подсистем и цене реализации. Скорее надо смотреть на модель применения и схему лицензирования ПО. Так, перенос приложений в виртуализированную среду поднял планку запросов к объему оперативной памяти и ресурсам ввода/вывода. Бум облачных вычислений породил интерес к программно-определяемым системам и сделал провайдеров разборчивыми в аппаратных средствах.

Для SQL-сервера, лицензируемого по числу процессорных ядер, покупка двухпроцессорной платформы на 8-10 ядерных Intel Xeon E5-2600 окажется разорительной. Приоритеты для сервера баз данных — запас оперативной памяти, процессорная частота, дисковый I/O. Выигрывают высокочастотные процессоры с малым количеством ядер и поддержкой большого объема RAM.

Подбор подходящей серверной платформы начинается с анализа нагрузок по каждой из подсистем: процессоров, памяти, дискового и сетевого ввода-вывода (I/O). Букет преимуществ однопроцессорных решений на E5-1600 собран на поле нескольких параметров: диапазона частот и количества вычислительных ядер, обслуживаемого объема RAM, запаса подключения периферии.

Частота

К частоте процессора чувствительны OLTP-приложения, где большинство запросов короткие, выполняющиеся на одном процессорном ядре. Практически все системы, использующие интерпретацию кода, масштабируются по производительности почти линейно с ростом частоты. Канонический пример — 1С: Предприятие 8. Потенциал ускорения работы 1С за счет многопоточной обработки тоже есть, часть операций в ней можно выполнять параллельно: проводку документов, обновление справочников, загрузку данных в регистры. Но при двух условиях: а) данные не связанные, б) разработчик 1С грамотный. Неизвестно, что встречается реже.

Производительности одного E5-1600 c 4-8 ядрами (8-16 потоками) достаточно для обслуживания 50-100 пользователей 1С: Предприятие 8 — ранее территории безраздельного господства двухпроцессорных систем.

Ядра

Линейка E5-1600 поначалу была короткой: из одного 4-ядерного и двух 6-ядерных процессоров. За счет того, что процессоры E5-1600 и E5-2600 в однопроцессорных платах взаимозаменяемы, многоядерность достигалась установкой, к примеру, одного 12-ядерного E5-2697 v2 — если того требовало приложение.

В третьем колене семейства E5-1600 v3 отпрысков уже пятеро: два 4-ядерных, один 6-ядерный и два 8-ядерных.

Горизонты однопроцессорных серверов

Интересно сравнить одно- и двухпроцессорные системы на равночастотных CPU. C учетом разницы в цене обвязки, сервер на двух 4-ядерных E5-2623 v3 обойдется примерно в те же деньги, что однопроцессорный на 8-ядерном E5-1660 v3. Но второй обеспечивает меньшую латентность при обработке потока мелких запросов, ему не нужны межпроцессорные пересылки по cистемной шине, он меньше потребляет электроэнергии, проще конструктивно и дешевле по лицензированию ПО — если оно привязано к числу сокетов.

Горизонты однопроцессорных серверов

Оперативная память

Больше всего у процессоров E5-1600 впечатляют лимиты RAM. Скачок от 32GB у E3-1200 до 256GB у E5-1600 развязал руки пользователям, которым хватало ресурсов одного процессора, но недоставало оперативной памяти: в OLTP-серверах, рабочих станциях графических и видео-приложений, в программно-определяемых системах хранения, виртуализированной среде. Коммерческие облачные структуры с распределенными вычислениями и хранением могут стать основным потребителем однопроцессорных систем с большим объемом памяти — благодаря достаточно высокой вычислительной мощности современных процессоров и привлекательности переподписки (overselling).

Чем занять 768GB в однопроцессорных платформах на E5-1600 v3, пока не хватает фантазии.

Линии PCI express

По внешнему виду слотов расширения PCI express на материнских платах не судят об их пропускной способности. К разъемам x16 производитель может подвести меньшее число физических линий: x8, x4, даже x1. Несколько разъемов могут использовать транспортный коридор совместно, понижая скорость работы периферийных устройств в них (мультиплексирование шин). Если на плате под сокет 1150, с пределом обслуживания 16 линий PCI express, есть два разъема x16, радоваться рано. Одна установленная видеокарта получит всю полосу пропускания x16. Две видеокарты разделят ресурс пополам, каждой достанется по полосе х8.

Приложения, работающие с несколькими мониторами, видео высокого разрешения, интенсивным потоковым трафиком I/O (10GbE, RAID, SAS и FC HBA) зачастую упираются не в производительность CPU, а в ограничения пропускной способности периферийных шин. Для них Intel Xeon E5-1600 с его 40 линиями PCI express будет оптимальным по стоимости решением.

Показателен пример Apple. Раньше ее флагманские рабочие станции Mac Pro были двухпроцессорными. Последний Mac Pro («ведро») — однопроцессорный, на E5-1600 v2. C двумя видеоакселераторами AMD Fire Pro, каждому из которых достается полноценная полоса пропускания x16 PCIe 3.0 до 15.7 GB/s. В максимальной конфигурации Mac Pro можно заказать с тем самым 12-ядерным E5-2697 v2.

К чему идет?

Все идет к вытеснению многопроцессорных систем многоядерными, аппаратных монстров — простыми, горизонтально-масштабируемыми инфраструктурами. Все решения тщательно выверяются по затратам и окупаемости.

Однопроцессорные платформы сегодня в тренде. Их доступность и широкий диапазон возможностей обещают им хорошие перспективы... как минимум, до следующего «така».