`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Cisco QuantumFlow: сетевой процессор нового поколения

Статья опубликована в №12 (629) от 25 марта

0 
 

Совсем недавно мировому ИT-сообществу был представлен новейший продукт – сетевой маршрутизатор агрегационных услуг Cisco ASR 1000, построенный на основе процессора Cisco QuantumFlow, по словам разработчиков, являющегося «самым совершенным в мире кремниевым продуктом для сетей». Предполагается, что высокая производительность, интеллектуальность и гибкие возможности программирования QuantumFlow позволяют этому устройству удовлетворять не только текущие, но и будущие требования на протяжении как минимум 10 ближайших лет.

ASR 1000 – маршрутизатор агрегационных услуг

Cisco QuantumFlow сетевой процессор нового поколения
Старшая модель из новой линейки ASR 1006 представлена Cisco как решение для высокопроизводительных масштабируемых сервисов пограничной маршрутизации для предприятий и сервис-провайдеров

Прежде чем перейти к описанию этого весьма перспективного процессора, несколько слов стоит сказать о новом семействе маршрутизаторов ASR 1000, созданных на его основе. Для них разработана операционная система IOS XE с функциями виртуализации, оптимизированная для компактных маршрутизаторов, работающих в граничных сегментах сети. Данная ОС может модернизироваться без отключения услуг и отличается избыточностью, но при этом также занимает небольшой объем. Как отмечают специалисты, ранее такое сочетание считалось попросту невозможным.

Помимо широкой граничной сетевой функциональности, IOS XE поддерживает интерфейс командной строки, знакомый и привычный для любого пользователя IOS. Все перечисленные процессорные и программные элементы делают маршрутизатор Cisco ASR самым мощным из подобных устройств, доступных на современном рынке. В его разработку Cisco вложила 250 млн долл., включая 100 млн, израсходованных на процессор Cisco QuantumFlow.

Как создавался QuantumFlow

Cisco QuantumFlow сетевой процессор нового поколения
Условно процессор QuantumFlow можно разделить на два модуля – обработки данных (processor engine) и управления трафиком (traffic manager)

Этот процесс занял более пяти лет и в нем принимало участие свыше ста инженеров Cisco. Многие из них были членами команды, разработавшей Cisco Silicon Packet Processor (SPP) для Cisco Carrier Routing System (CRS-1), выпущенной в 2004 г. В ходе проектирования подано свыше 40 заявок на патенты.

Интересно, что когда QuantumFlow дали старт, инженеры даже не думали о маршрутизаторе ASR 1000 – руководство компании лишь поставило перед Уиллом Этертоном (Will Eatherton), ведущим разработчиком, задачу создать технологию для мультимедийных коммуникационных сетей XXI века. Узнав об этом, архитектор проекта ASR 1000 Майкл Бисли (Michael Beesley) понял, что речь идет о работе значительного масштаба. «Я догадывался, какую функциональность должен поддерживать этот процессор, но не имел ни малейшего представления о его структуре. От Уилла я узнал, что процессор есть, но для него нужен соответствующий продукт. Таким образом, независимо друг от друга мы решили важную проблему, подходя к ней с разных сторон: я создавал для мирового рынка самый совершенный маршрутизатор, а Уилл и его команда делали все возможное, чтобы он действительно стал самым лучшим», – рассказывает Бисли.

Первый образец процессора QuantumFlow появился в феврале нынешнего года. Инженеры, работавшие в разных странах, съехались, чтобы вместе протестировать свое творение. Любой недочет, вскрытый на этом этапе, мог привести к весьма серьезным последствиям и отодвинуть массовое производство нового чипа как минимум на девять месяцев. «Мы все были как на иголках, – вспоминает Уилл Этертон. – Люди не покидали служебных помещений Cisco по нескольку месяцев. Вместе с тем это было удивительное время: мы видели, как CPU слой за слоем превращается из идеи в реальность».

Чипсет под кодовыми названиями Popeye and Spinach (вероятно, не нужно объяснять, откуда они взялись) был протестирован и отлажен в рекордные сроки.

Самостоятельно разработать новый процессор Cisco помогли два принципиально важных приобретения. В 2002 г. она купила компанию Navarro Networks, которая базировалась в г. Плано (штат Техас), и 25 ее сотрудников специализировались на высокопроизводительных микрочипах для сетевых приложений. А два года спустя появлению процессора QuantumFlow и маршрутизатора ASR 1000 помогло поглощение начинающей фирмы Procket Networks, создававшей мощные маршрутизаторы для управления центральными магистралями цифровых коммуникаций.

Технические особенности

В состав процессора входит примерно 800 млн транзисторов (в предыдущем насчитывалось 185 млн). Микросхема объединяет в одном кристалле кремния 40 ядер, одновременно выполняющих до 160 процессов. Как утверждается, это делает новый продукт Cisco уникально приспособленным к сегодняшним сетевым средам. По заявлению разработчика, Cisco QuantumFlow Processor на несколько поколений опережает существующие сетевые устройства.

Остановимся подробнее, что именно выделяет новинку из ряда подобных продуктов. Специалисты компании акцентируют внимание на том, что это не просто очередной чипсет или аппаратное решение, QuantumFlow рассматривается как принципиально новая архитектура, которая будет заложена во всех будущих моделях Cisco.

Итак, данный проект построен на концепции полного ухода от конвейерной обработки данных. Взамен предлагается принцип параллельной с применением централизованной общей памяти. Фактически процессор условно можно разделить на два модуля – обработки данных (processor engine) и управления трафиком (traffic manager). Задачей первого является непосредственная обработка всех потоков от ПО, управляющего их распространением (forwarding-path software), а traffic manager формирует очередность и сроки исполнения как функций системы, так и интерфейсов ввода-вывода. Последний также может перенаправлять пакеты к другим блокам системы, интерфейсам ввода-вывода или возвращать их процессору обработки пакетов посредством обратной связи.

Семейство сетевых процессоров QuantumFlow поддерживает большое количество высокоскоростных интерфейсов, осуществляя обмен данными в диапазоне от 5 до 100 Гб/с по двунаправленным внешним каналам. Все они могут быть использованы как для внешнего, так и для внутреннего обмена трафиком, например, для существующих разделяемых портов-адаптеров (Shared Port Adapter, SPA). Отдельный высокоскоростной интерфейс применяется для управления и программирования процессоров QuantumFlow, входящих в состав хост-системы, также с его помощью происходит и передача специализированных таблиц и баз данных. Еще стоит отметить набор высокоскоростных интерфейсов, поддерживающих связь с блоками внешней памяти различных типов – со сниженной латентностью, троичной системой хранения данных (TCAM) и статическим ОЗУ (SRAM), предназначенным для хранения больших программных библиотек, буферизации пакетов и информации о состоянии очередей.

Важным аспектом архитектуры процессора QuantumFlow является ее универсальность, допускающая построение самых различных систем. В частности, маршрутизатор Cisco ASR 1000 оснащается двумя CPU исключительно для создания избыточности – одного из них вполне хватает для обеспечения всех функций системы, в то время как второй может находиться в режиме stand by до возникновения критической ситуации.

Упрощенная схема работы QuantumFlow

Cisco QuantumFlow сетевой процессор нового поколения

Первый шаг. Полученный кадр (в кэш L2) поступает на процессор и размещается в специальной области памяти пакетов (on-chip packet memory). QuantumFlow может поступить с ним по своему усмотрению, при этом анализируя содержимое пакета, а не только заголовки. Например, он может применить механизмы Network Based Application Recognition (NBAR) и Flexible Packet Matching (FPM) без каких-либо других внешних обработчиков.

Второй шаг. Содержимое полученного пакета распределяется на любой из свободных потоков-«нитей» (PPE thread). Таких потоковых обработчиков, доступных в произвольный момент времени, существует 160, в будущем их количество планируется увеличить.

Третий шаг. Выбранный модуль обрабатывает полученный пакет специализированными программными функциями. При этом PPE использует различные аппаратные средства, реализованные в процессоре.

Четвертый шаг. Обработанный пакет передается в блок traffic manager и собственный буфер, после чего происходит его размещение в выходной очереди для планирования и последующей передачи. При этом traffic manager может выполнить одно из следующих действий: поместить пакеты в очередь для передачи произвольному внешнему интерфейсу; разместить пакет в очередь для передачи другому PPE (например, для многоадресной обработки) или внешнему обработчику, такому как криптографическое устройство или процессор маршрутизации.

Как работает QuantumFlow

Cisco QuantumFlow сетевой процессор нового поколения
Маршрутизаторы серии Cisco ASR 1000 оснащаются двумя CPU QuantumFlow для создания избыточности – второй может находиться в режиме stand by до возникновения критической ситуации

Собственно, все операции с данными производятся Packet Processor Engine, каждый из которых представляет собой 32-битовое ядро с RISC-архитектурой и способен обслуживать четыре независимых потока данных, причем любой из них «самостоятелен» – программная модель не требует жесткой привязки конкретной «нити» к использованию ресурсов внутри процессора.

Обработка пакетов осуществляется посредством выполнения встроенных микропрограмм, написанных на языке ANSI C. Интересная особенность: если для операций с кадром требуется привлечение внешних аппаратных блоков, время ожидания может быть использовано для «помощи» трем другим потокам из блока PPE – так достигается минимальная латентность в обработке пакетов. Помимо собственно операций с потоком данных, процессор QuantumFlow может собирать разнообразную информацию о содержимом трафика и предоставлять ее другим устройствам для дальнейшего применения прочими сетевыми приложениями и сервисами.

Cisco QuantumFlow сетевой процессор нового поколения
Cisco QuantumFlow сетевой процессор нового поколения
Так выглядят на кристалле кремния два основных блока процессора – Cisco QuantumFlow Processor Engine (верхний снимок) и Cisco QuantumFlow Processor Traffic Manager

Как уже упоминалось ранее, каждый PPE в процессе работы может обращаться ко множеству вспомогательных аппаратных модулей (hardware-assist functions). Рассмотрим подробнее, что понимается под этой функцией. Для начала стоит отметить наличие кэш-памяти двух уровней – Layer 1 и Layer 2. Первый из них (16 КБ) доступен каждому из четырех потоков в пределах одного PPE, а второй (два по 256 КБ) – для всех PPE. Такое решение предоставляет возможность быстрого доступа любого из модулей обработки к выполняемым инструкциям, что позволяет существенно упростить и ускорить выполнение однотипных операций с пакетами одного потока.

Каждый поток может получить доступ к собственному пространству кэш-памяти L1, а также к внешней памяти с низкой латентностью, точнее, к выделенному адресному пространству. Кроме того, для любого PPE реализована возможность использования функций аппаратного ускорения поиска сетевых адресов или префиксов, хэширования, средств контроля трафика, WRED (Weighted Random Early Detection), а также TCAM для ускорения обработки средств расширенной классификации и списков управления доступом (ACL).

Ключевой ресурс нового процессора для каждого PPE – встроенный менеджер блокировки (lock manager). С его помощью осуществляется распределение выполняемых потоков таким образом, чтобы для получения результата не ожидать завершения длительных процедур. По сути, посредством менеджера блокировки формируется пакет заказов для оптимизации требуемых операций и сокращения простоев.

Еще одним ключевым ресурсом является использование внешнего аппаратного обработчика. В таком качестве для Cisco ASR 1000 выступает специализированный криптографический модуль. Для его применения PPE пересылает обработанный пакет менеджеру трафика, который помещает его в очередь с последующей передачей криптографическому процессору. После выполнения нужных действий пакет возвращается обратно и вновь передается PPE для прохождения дополнительных операций. Этот пример описывает так называемую многопроходную обработку, также ставшую одной из инноваций в процессоре Cisco QuantumFlow.

Вместо заключения

К сожалению, привести полное описание всех возможностей, заложенных в новый процессор для сетевых устройств, в рамках одной статьи довольно сложно, поэтому вместо итога вкратце отметим наиболее характерные моменты. Очевидно, что разработка Cisco QuantumFlow не предполагала создание сверхмощного вычислительного ядра, напротив, идеология этого процессора подразумевает максимально эффективное управление параллельной обработкой данных с использованием внешних и внутренних аппаратных и программных функций. Такой подход позволил создать весьма гибкую и легко масштабируемую структуру с огромным потенциалом на будущее – ведь для реализации того или иного алгоритма обработки сетевого трафика достаточно будет написать соответствующие программные модули или воспользоваться аппаратными решениями.

0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT