Sun: долой провода!

8 июнь, 2004 - 23:00Сергей Митилино
Бешеная гонка рабочих частот процессоров и скоростей передачи данных заставляет инженеров, проектирующих современные компьютеры, чаще задумываться о пропускной способности интерфейсов, связывающих установленные в системе чипы, нежели о более разумном использовании имеющихся мощностей. И как бы ни торопились разработчики интерфейсов, они безнадежно отстают от полупроводниковой индустрии. Низкая полоса пропускания внутренних шин погубит еще не один новаторский процессор, который способен будет "перемолоть" несколько миллиардов инструкций в секунду, если дадут шанс.

Sun долой провода!
Рис. 1
Sun долой провода!
Рис. 2
Sun долой провода!
Рис. 3
Sun долой провода!
Рис. 4
Инженеры отчаянно изощряются, придумывая новые методики упаковки чипов, и все равно плотность контактов между микросхемой и платой значительно отстает от плотности внутричиповых соединений. Сегодня упомянутые значения, даже в случае использования BGA, различаются в 60 раз!

В корпорации Sun Microsystems проблемой озаботились на самом высоком уровне. По всей видимости, дело здесь в UltraSPARC IV, который содержит два процессорных ядра на одной подложке. Необходимость организовать связь между высокопроизводительными микросхемами, особенно в свете движения к восьмиядерному проекту Niagara, потребовала нетривиального подхода. Поэтому решение задачи "как связать два чипа" предложил коллектив во главе с самим Айвеном Сазерлендом. Без упоминания имени автора первой чертежной программы невозможно представить ни один учебник по компьютерной графике. Итак, Сазерленд вместе с двумя Робертами -- Дростом (Robert J. Drost) и Хопкинсом (Robert D. Hopkins) предложили использовать для межчиповых коммуникаций емкостную связь.

Proximity Communication основывается на электрическом взаимодействии между расположенными в непосредственной близости микросхемами: группа микроскопических металлических площадок-передатчиков образует с такой же группой площадок-приемников соседнего чипа конденсаторы. Произойти мгновенному разряду не позволяют оксидные оболочки микросхем. Чтобы "половинки" конденсаторов на принимающей стороне могли чувствовать любые изменения заряда на площадках-передатчиках, используется обратная связь через инвертор. Эта схема стремится "привести" напряжение на контактной площадке приемника к стандартному значению (рис. 1), которое находится где-то посередине между нулем и наивысшим напряжением на входе. Для полноты картины отметим, что на самом деле стандартных значений два -- VH и VL. Первое из них создается на входе усилителя после увеличения напряжения, второе -- после снижения. Суть в том, что значения эти располагаются соответственно на 100 мВ выше и ниже порогового напряжения переключения приемника (рис. 2).

Элегантным решением по устранению помех стало использование естественного фильтра низких частот, образовавшегося из составного конденсатора и паразитных емкостей. Так что даже паразитные емкости иногда могут приносить пользу.

Концепция Sun не так оригинальна, как это может показаться. Идея беспроводной внутренней шины возникла давно. Ученые из государственного университета Северной Каролины, а именно Стивен Мик (Stephen Mick), Джон Уилсон (John Wilson) и Пол Франзон (Paul Franzon) пару лет назад опубликовали работу под названием "4-Gbit/second High-Density ac Coupled Interconnection". В их конструкции (рис. 3) обмен данными происходит посредством проводящих дорожек, внедренных в подложку (субстрат). Ряд микросхем формируется на общей основе, при этом электрические импульсы "наводятся" во внедренные в субстрат дорожки через изолирующий слой толщиной в несколько микрон (2--5 мкм). Питающее постоянное напряжение подводится посредством больших по размеру контактов -- помещенных в канавки шариков припоя, вытравленных на субстрате и физически соединяющих микросхему и контактную дорожку.


А мы пойдем другим путем

Инженеры Sun поддерживают имидж "альтернативщиков". В их схеме данные передаются без посредников -- из чипа в чип. Таким образом уменьшаются энергетические потери, идет на убыль количество ошибок, повышается надежность связи.

И здесь возникла серьезная проблема: поскольку контактных площадок много, появляется необходимость в их тщательном взаимном ориентировании. Чтобы точно состыковать микроскопические приемники и передатчики, разработчики прибегли к методу Вернье (Vernier), который вам наверняка знаком -- многие еще на уроках труда неоднократно использовали штангенциркули с двумя шкалами. Если расстояние между рисками основной шкалы составляет миллиметр, то десять рисок вспомогательной располагаются на отрезке длиной 0,9 мм. Вспомогательная шкала перемещается вместе с движущейся частью зажима. По положению ее нулевой отметки относительно основной шкалы определяется целое число миллиметров в измеряемом расстоянии. А подсчитав на вспомогательной шкале риски между нулевой отметкой и той, которая точно совпадет с какой-либо риской на основной шкале, вы можете узнать, сколько десятых долей миллиметра нужно прибавить к уже полученному значению.

Этот дедовский способ повышения точности измерений был модифицирован в полном соответствии с духом и буквой технологии (рис. 4). В роли рисок выступают линейки металлических площадок, сформированные в каждой из микросхем пары, а связь между ними осуществляется посредством электромагнитных наводок. Одна "шкала" состоит из 10 площадок и является передатчиком, другая -- из девяти и служит приемником. На площадки передатчика по принципу чет-нечет подаются положительные и отрицательные перепады напряжения: к примеру, на четные идет положительный сигнал, а на нечетные -- отрицательный. От полярности сигнала, принимаемого площадкой-приемником, зависит ее близость к положительной или отрицательной площадке-передатчику. Таким образом определяется совпадение площадок-меток шкал приемника и передатчика. Методика позволяет обеспечить точность расположения до 1,4 мкм. Всего оба экспериментальных чипа содержат четыре пары датчиков (приемник-передатчик), что достаточно для ориентации по трем координатам (смещения вдоль осей x и y, а также вращение вокруг оси z). Такая высокая точность была необходима для уменьшения взаимных помех, создаваемых соседними каналами связи.

Собственно обмен данными осуществлялся с помощью двух матриц 4 4, нанесенных на микросхемы, которые выполнены по технологии 350 нм CMOS. Помимо приемника и передатчика, чипы оснастили массивами памяти с псевдослучайными числами, компараторами и счетчиками битовых ошибок. Очередность передачи блоков данных можно было программировать, поэтому в ходе эксперимента последовательности не повторялись. Контактные площадки матрицы передатчика были разных размеров, что помогло выяснить характер зависимости качества связи от размера "обкладок" конденсатора.

Микросхемы закрепили на двух печатных платах и разместили в зажимах микроманипуляторов. Затем, используя стереоскопический микроскоп с десятикратным увеличением, чипы прижали друг к другу. На прилегающие поверхности нанесли небольшое количество масла, чтобы увеличить коэффициент емкостной связи.

В ходе тестов удалось достигнуть скорости передачи, равной 21,6 Gbps (16 каналов по 1,35 Gbps каждый). При этом частота возникновения битовых ошибок (BER) держалась на уровне меньше 10-10. Статическое потребление энергии составило 3,6 мВт на канал.

Первые коммерческие образцы, по оценкам Джона Густафсона (John Gustafson), ответственного за разработки высокопроизводительных систем корпорации Sun, должны появиться в массовой продукции где-то через 5 лет. Предполагается, что к тому времени скорость передачи данных через беспроводной интерфейс достигнет феноменальных 5 Тbps.

Правда, никто из исследователей не упоминал о тепловыделении. А ведь если проект вычислительного "куба" воплотится в реальности, то охладить такую плотно упакованную систему будет отнюдь не просто. Как сказал технический директор Rambus Крис Хампел (Chris Hampel): "Технология не нова, мы присматривались к ней ранее, но столкнулись с проблемами тепловыделения".

Любопытно, что концепция Proximity Communication является побочным продуктом увлечения Сазерлендом идеей "нетактируемых чипов" (clockless chips). Суть состоит в преодолении принципиальной проблемы проектировщиков процессоров, вставшей перед ними вместе с ростом рабочих частот. При сверхвысоких тактовых частотах конечная скорость распространения электромагнитных импульсов внутри микросхемы превращается в препятствие нормальному функционированию схемы. Блоки процессора получают тактовые сигналы в различные моменты времени вследствие неодинаковой длины пути, который они преодолевают от тактового генератора.

Как и многие другие прогрессивные технологии современности в области компьютерной техники, "емкостная передача" появилась при поддержке и непосредственном финансовом участии DARPA. В июле 2003 г. Sun, так же, как и Cray, и IBM, в рамках конкурса было предоставлено 50 млн. долл. для проектирования высокопроизводительной системы нового поколения. Поможет ли Proximity Communication ей выиграть трехлетнюю гонку и получить средства на изготовление полноценного суперкомпьютера? Для нас важнее ответ на вопрос: сможет ли "емкостная передача" заменить обыкновенные металлические проводники? От этого во многом зависят пути дальнейшего прогресса информационных технологий.