`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Сопроцессоры возвращаются?

0 
 

Упрекнуть приверженцев hype-стиля подачи технологических новостей трудно -- в конце концов, это способ зарабатывать себе на жизнь. Да и ничего особенно страшного в результате hype-штормов не случается -- это, слава Богу, не цунами. Ну пошумели-пошумели несколько лет по поводу Java -- и утихли. Java, как технологии, претендующей в "стиле hype" на "все и вся", это не помогло никак, остальным -- никак не помешало. Bluetooth-истерика улеглась, и если "кто-то кое-где у нас порой" использует Bluetooth (или Java) -- то по разумному осмысленному выбору, а никак не из-за того, что это было "cool" на страницах журналов полуторагодичной давности.

Предмет нашего обсуждения уже успел вызвать небольшой всплеск интереса даже к первому его анонсу -- причем "волны" от этого всплеска наблюдались в самых далеких от сути предмета "заводях". Иначе даже и быть не могло -- ну кто устоит перед искушением обещания не сегодня завтра трансформировать стандартный ПК в нечто с вычислительной мощностью, доступной разве что суперкомпьютерам? И все это -- одновременно с сохранением как самого ПК, так и всего существующего программного обеспечения, за сравнительно небольшие деньги и несколько дополнительно рассеиваемых ватт мощности. Даже если не вполне понятно, что делать с производительностью cовременных процессоров, подобное искушение становится предложением, от которого трудно отказаться...

Итак, заряд скепсиса, крайне необходимый в случае знакомства с любой новой технологической игрушкой, отправлен в требуемом направлении (достигнет ли он цели -- дело десятое), можно приступать к обсуждению современной реинкарнации компанией ClearSpeed забытых арифметических сопроцессоров.

Приватная фирма ClearSpeed с офисами и проектными центрами в Европе и США -- не новичок в мире производительных вычислений. Но если ранее она специализировалась на узкоориентированной IP (Intellectual Properties -- так принято называть пригодные к производству модели--описания фрагментов интегральных микросхем), то теперь ситуация изменяется: по-видимому, в компании оценили значимость накопленного потенциала (ClearSpeed является довольно весомым правообладателем с обширной патентной базой) и емкость перспективных рынков -- в первую очередь, рынка высокопроизводительных научных вычислений. И первый шаг к расширению области применения своих наработок компания сделала, анонсировав новый сопроцессор CS301. Казалось бы, ничего особенного в этом факте нет -- на рынке существует огромное количество специализированных процессоров для самых разных сфер. Но давайте осмыслим показатели CS301, обещаемые ClearSpeed: производительность на операциях с плавающей точкой -- 25,6 GFLOPS, 100 тыс. 1024-точечных комплексных преобразований Фурье в секунду, тактовая частота -- 200 MHz, потребляемая мощность -- 2 Вт. Уместно для сравнения привести, например, оценочное значение производительности современных 64-битовых CPU, условно говоря, из мира x86: так, наиболее привлекательный для создателей "числодробилок" AMD Opteron с тактовой частотой 1,8 GHz показывает на тестах Linpack где-то в среднем 3 GFLOPS, рассеивая при этом больше 70 Вт. Если учесть позиционирование CS301 именно как сопроцессора для ПК и изначальный расчет разработчика на создание "многосопроцессорных" PCI-плат, содержащих от двух до четырех CS301 "на борту", а также возможность установки в один ПК нескольких таких плат, то картина под названием "Персональный Top 500 суперкомпьютер" (имеется в виду сайт www.top500.org, отслеживающий наивысшие достижения в области сверхпроизводительных вычислений), нарисованная маркетологами ClearSpeed, уже не кажется нереальной. Но не будем спешить...

Итак, первенец -- CS301. Прежде чем начать рассказ об этом "процессоре", целесообразно вспомнить давние времена и почти забытые имена -- в первую очередь, некогда знаменитую маленькую британскую компанию INMOS, оставившую в истории и в памяти многочисленных поклонников новое слово -- Transputer. Параллели между ClearSpeed и INMOS напрашиваются сами собой, но заслуживают отдельного обсуждения. Когда в начале 1980-х годов конструкторская мысль обогнала возможности полупроводниковой технологии, возник неафишируемый тихий кризис -- разработчикам процессоров казалось, что производительность последовательных вычислителей достигла предела (тактовая частота в несколько десятков мегагерц уже была серьезным препятствием), и для дальнейшего ее повышения необходима радикальная модификация архитектуры. В INMOS таким видоизменением стала концепция вполне самодостаточного, но ориентированного на применение в параллельных структурах дешевого процессорного элемента, снабженного адекватной этим задачам интегрированной периферией -- в первую очередь, контроллером и формирователем специальных простых и быстрых "межэлементных" шин, позволяющих с минимальными затратами создавать многопроцессорный вычислитель из отдельных чипов. Требование дешевизны отразилось на внутренней архитектуре транспьютеров -- они получились весьма RISC-подобными (конечно, термин RISC сегодня уже вообще ничего не обозначает, но так уж принято). Довольно быстро развивающаяся INMOS буквально за несколько лет довела транспьютеры от идеи до легендарной модели T800 -- оснащенного 64-битовой арифметикой вычислителя. А вот цена... В 1987 г. T800 стоил порядка $400 в партиях -- такая цифра, мягко говоря, смущала потребителей. Да и изначальная (вспомним Java) ориентация транспьютеров на "все и вся" также не сыграла на руку INMOS. Не помогли и весьма совершенные инструментальные средства (например, трансляторы с языка Occam) -- маленькая компания не обладала достаточным влиянием для того, чтобы вынудить сторонних производителей воспринять транспьютеры как основу новой массовой технологии, что в конце концов привело к несбыточности мечтаний о масштабируемых транспьютерных рабочих станциях и ПК -- ей просто нечего было предложить массовому рынку.

Впрочем, идеям INMOS погибнуть не суждено. Теперь их в какой-то мере повторяет ClearSpeed, но уже на совершенно ином технологическом уровне. Последователь транспьютеров CS301 по сути является аналогом "многотранспьютерного" компьютера, объединяющего 64 вычислительных элемента с помощью трансформированных в высокопроизводительную шину ClearConnect "линков" (именно так в терминологии транспьютеров называлась межэлементная шина). Каждый элемент-"транспьютер" (PE -- Processing Element, "обрабатывающий элемент") включает в себя весьма развитый центральный процессор с 64-байтовым регистровым файлом (иначе -- блоком регистров), арифметико-логическим устройством, процессором плавающей точки и аппаратным умножителем-накопителем (MAC -- специальный вычислитель, способный быстро выполнять трехоперандные команды типа a*b+c, широко используемые в цифровой обработке сигналов, в CS301 эти узлы обеспечивают суммарную производительность порядка 13 млрд. трехоперандных операций в секунду), два программируемых сопроцессора ввода/вывода (байт-ориентированного и потокового) и локальную оперативную память емкостью 4 KB. В принципе, на макроархитектурном уровне PE кристалла CS301 не слишком далеко ушел от упомянутого ранее транспьютера T800 -- в последнем регистровый файл составлял 36 байт (собственно, это был не регистровый файл, а набор регистров со строго определенным назначением) при том же объеме интегрированного локального ОЗУ 4 KB. Существенное отличие заключается в организации ввода/вывода -- у транспьютеров для выполнения этих операций были предусмотрены 4 последовательных "линка", PE же располагает мультиплексируемыми пакетными 64-битными шинами. Но, собственно, на уровне элемента обработки сходство между "предком" и "потомком" заканчивается. Все дело в том, что "посаженные" на свойственную высококлассным серверам и рабочим станциям шину ClearConnect элементы обработки в CS301 управляются централизованно -- этакий гибрид транспьютерного вычислителя (где 4 "линка" заменены возможностью доставки пакета к нужному элементу) и кластера-"фермы" с явно выделенным "ведущим" компьютером. В CS301 роль "ведущего" выполняет отдельный специализированный процессорный элемент, "скрывающий" внутреннюю параллельную архитектуру вычислителя и представляющий его как бы "просто процессором" с определенным набором команд, доступных прикладному программисту. Этот процессорный элемент располагает встроенным конвейером, несложным механизмом предсказания ветвлений, декодером "макрокоманд" и собственным регистровым файлом. Такой архитектурный "фокус" расширяет уже использованную аналогию -- теперь мы можем представить себе CS301 в виде следующей иерархии: виртуальный сопроцессор -- кластерно-транспьютерный вычислитель -- элемент-транспьютер. Учитывая высокую пропускную способность внутренней шины (более 51 GBps), ее пакетный характер и принципиальную возможность реализации любой системы макрокоманд, ориентированной на решение задач параллельной обработки большой сложности, CS301 кажется весьма привлекательной разработкой. Тем более привлекательной, что в ClearSpeed, похоже, учли ошибки предшественников и не собираются повторять печальный опыт технологических революционеров -- CS301 задуман, реализован и оптимизирован для применения именно в качестве сопроцессора для обычных ПК, а не как самостоятельное устройство. Вполне соответствует такому осторожному подходу и выбор, сделанный программистами ClearSpeed, -- CS301 сопровождается интегрированной средой разработки, включающей в себя кросс-транслятор незначительно модифицированного ANSI-стандартного языка С, графический отладчик, макроассемблер и прочие де-факто стандартные инструменты. Никаких экзотических языков типа Occam, судя по всему, не предвидится.

На надкомпонентном уровне (CS301 не является законченным продуктом) сопроцессоры на базе ClearSpeed, как уже отмечалось, будут представлять собой PCI-платы расширения. Кроме нескольких чипов сопроцессоров, платы должны оснащаться специализированным совмещенным контроллером шины PCI (сами микросхемы логику сопряжения с PCI или иными ПК-ориентированными шинами не включают) и локальной памяти. Последняя характеризуется совсем не "сопроцессорными" показателями -- ее емкость может достигать 1 GB (эта цифра соответствует возможностям кристаллов первого поколения класса CS301, впоследствии, вероятнее всего, она будет увеличена). Пропускная способность локальной шины памяти сопроцессора составляет 3,2 GB/сек.


Не для всех и не для всего

Наивно полагать, что высокие характеристики CS301 и их ориентация на роль сопроцессора в ПК на 100% означают прирост производительности на любых задачах. Не менее наивной кажется автору и высокая оценка перспективности подобных разработок для акселерации игрового ПО (хотя в некоторых, близких к игровой специфике, приложениях, например в авиационных симуляторах, подобные сопроцессоры могут оказаться весьма уместными). В ближайшее время вне основной области применения популярность недорогих параллельных "числодробилок", вероятнее всего, не возрастет. Да и в научных вычислениях они не всегда необходимы -- далеко не любые задачи хорошо распараллеливаются. Однако дело даже не в этом...

Вспоминая печальную судьбу компании INMOS, которая так и не смогла найти массовую область применения своим транспьютерам, что вынудило ее вести бизнес по принципу "с трудом окупая разработку" (в случае с разработчиком-производителем это означает завышение цен на продукцию, которое, в свою очередь, ведет к дальнейшему сужению области ее применения), перспективность CS301 надо оценивать, скорее всего, не по техническим показателям чипов, а по первым, "индикативным", шагам компании ClearSpeed на рынке. Ведь анонсированная продукция "ближайшего завтрашнего дня" -- платы-сопроцессоры и инструментальное ПО для разработчика -- далеко не массовая даже на рынке научных вычислений. По мнению аналитиков, преодолеть барьер "экзотичности" компании могут помочь альянсы с именитыми производителями математического и инженерного ПО. Действительно, пользователи дорогостоящих вычислительных пакетов (например, реализующих конечноэлементный анализ) только выиграли бы от существенного прироста производительности за счет умеренного или даже соизмеримого с ценой пакета прироста стоимости (если ClearSpeed обещает предоставить эксклюзивный, попадающий в Top 500, "заряженный" ПК с пятью платами-сопроцессорами где-то за 25 тыс. долл., то для более "приземленных" моделей эта цифра должна быть существенно ниже).

Значительный интерес может представлять и законченное решение, использующее акселераторы ClearSpeed для построения так называемых "ферм рендеринга" (renderfarms) -- кластеров, которые применяются при производстве масс-медиа продукции, в первую очередь, в киноиндустрии.

Вообще использование сопроцессоров в кластерных вычислителях имеет один весьма интересный аспект, с которым, по-видимому, еще только придется столкнуться в будущем. Не секрет, что характеризующиеся малыми временами задержки специализированные межузловые соединения в кластерах довольно недешевы. И чем больше узлов в кластере, тем весомее ценовая составляющая аппаратных средств, обеспечивающих "интерконнект". C другой стороны, применение сопроцессоров-"числодробилок" позволяет радикально повысить производительность каждого узла и, при заданной суммарной производительности кластера, уменьшить требуемое в нем количество узлов. Если ClearSpeed удастся установить выгодный потребителю баланс между снижением цены кластера за счет сокращения расходов на межузловую связь и повышением ее благодаря установке сопроцессоров, решения компании в этом сегменте рынка, без сомнения, приживутся.

Особая среда приложения сопроцессоров нового поколения -- сетевые технологии. Процессорные элементы CS301 не только эффективны при вычислениях с плавающей точкой -- у них очень неплохие целочисленные показатели, обеспечивающие суммарную производительность одного чипа на уровне 13000 MIPS. В сочетании с высокой пропускной способностью внутренней шины и ее пакетным характером, гарантирующим эффективное использование полосы пропускания, этот показатель делает CS301 многообещающим элементом, например высокоуровневых маршрутизаторов.

Еще одна перспективная область применения чипов класса CS301, несмотря на явную "ПК-ориентированность", -- встраиваемые системы с развитыми мультимедийными возможностями. Какие потребительские показатели умудрятся "выдавить" из подобной "числодробилки" разработчики, скажем, цифровых видеокамер, пока никому не известно.


Направление важнее

В нашем обсуждении на самом деле не столь важен факт появления некоторой конкретной разработки, к примеру CS301. Гораздо важнее -- направление движения компании ClearSpeed и привлечение внимания к нему (вот когда пресловутый "hype" не так уж и плох). Идея функциональной мультипроцессорности, о которой мы уже неоднократно упоминали, оказывается, не умерла. Да, мощность современных потребительских CPU очень высока, в большинстве случаев -- намного выше реальных потребностей в ней массового пользователя (если, конечно, не принимать во внимание детища игровой индустрии, стимулирующие "выжирание" производительности). Производители процессоров это прекрасно понимают и... не спешат совершать переворотов. Обвинять их в такой политике как минимум неумно. Потому как массово производить массово-невостребованное -- тоже не очень умное занятие. Но идиллий не бывает -- есть категория пользователей, которой производительности не хватает всегда и которая не столь чувствительна к цене последней. Довести массовую продукцию до уровня их запросов означает оставить за бортом понятия "массовый" 99% пользователей вообще -- нас с вами. Долгое время такими опасными "танцами на углях" увлекались канувшие в Лету производители рабочих станций. "Лезвие" гонки под девизом "производительность -- любой ценой" обоюдоострое: оно ранит и потребителя, которому ненужная вычислительная мощь не по карману, и разработчика, который не может сбыть эту самую мощь по такой цене. Коллапс рынка рабочих станций --тому удачный и поучительный исторический пример.

Возможно, благодаря возвращению идей функциональной многопроцессорности (в том числе и благодаря CS301, как бы ни сложилась дальнейшая судьба этой разработки) проблеме несовпадения интересов найдется решение, устраивающее обе противоборствующие стороны игры "производитель--потребитель". Впрочем, ближайший год покажет, насколько радужные перспективы соответствуют действительности.
0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT