
OpenAI офіційно анонсувала свій перший спеціалізований процесор Jalapeño, який розроблено у співпраці з Broadcom.
Як повідомляє компанія, новинка є першим у світі «процесором інтелекту» (Intelligence Processor), розробленим з нуля виключно для оптимізації процесів інференсу великих мовних моделей.
Цей реліз є частиною стратегії повної вертикальної інтеграції OpenAI, спрямованої на створення власного апаратно-програмного стека.
Перші інженерні зразки Jalapeño вже успішно проходять лабораторні тестування під реальними навантаженнями, запускаючи передові нейромережі, включно з перспективною моделлю GPT-5,3-Codex-Spark.
Процесор був розроблений та виведений на етап фінального проєктування кремнієвої пластини за рекордні дев'ять місяців, що є найшвидшим циклом створення високопродуктивних спеціалізованих мікросхем ASIC у новітній історії напівпровідникової індустрії. Подібної швидкості вдалося досягти не лише завдяки інженерній експертизі Broadcom, а й шляхом залучення чинних моделей OpenAI, які в автоматичному режимі оптимізували окремі етапи проєктування топології мікросхем.
У створенні платформи також взяла участь компанія Celestica, яка відповідає за системну інтеграцію плат, стійок та високопродуктивних мережевих систем.
Офіційне масштабне розгортання платформи у гігаватних дата-центрах Microsoft та інших партнерів заплановане на кінець 2026 року.
Архітектура нового чипа кардинально відрізняється від універсальних графічних процесорів, оскільки вона оптимізована під специфіку переміщення даних, роботу ядер та мережеві патерни сучасних діалогових та агентних систем штучного інтелекту.
Згідно з першими результатами тестів, Jalapeño демонструє суттєво кращу енергоефективність (продуктивність на ват) порівняно з наявними флагманськими рішеннями на ринку, а детальний технічний звіт із точними бенчмарками та конфігураціями пам'яті OpenAI обіцяє опублікувати найближчими місяцями. Нова архітектура суттєво знижує обсяги внутрішнього переміщення даних та балансує обчислювальні, мережеві ресурси та ресурси пам'яті, що дозволяє досягти реальних показників утилізації платформи, які є максимально близькими до теоретичної пікової продуктивності.
«Світ переходить до економіки, що базується на обчислювальних потужностях. Jalapeño є частиною нашої довгострокової стратегії створення повного стека інфраструктури, спрямованої на те, щоб зробити обчислення доступнішими, в результаті чого AI стане швидшим, надійнішим і дешевшим для людей та бізнесу», - зазначив президент та співзасновник OpenAI Грег Брокман (Greg Brockman). Своєю чергою керівник апаратної програми OpenAI Річард Хо (Richard Ho) підкреслив, що архітектуру було оптимізовано навколо тих ядер, алгоритмів переміщення пам'яті та мережевих патернів, які мають найбільше значення для передових моделей AI.
Спільні інвестиції у фізичну інфраструктуру дозволять розпочати масштабне розгортання нових обчислювальних потужностей із ключовими партнерами вже наприкінці 2026 року.
Аналітики зазначають, що презентація процесора Jalapeño - це найсильніший стратегічний хід OpenAI, спрямований на подолання критичної залежності від дефіцитного та наддорогого заліза NVIDIA. Досі стрімке зростання споживання токенів корпоративними клієнтами та звичайними користувачами ChatGPT створювало для компанії значні фінансові ризики через високу операційну вартість інференсу. Розробка вузькоспеціалізованого чипа замість універсального графічного прискорювача дозволяє OpenAI ліквідувати архітектурні компроміси, оптимізувавши кремній безпосередньо під власні математичні алгоритми, що наближає реальну продуктивність дата-центрів до їхнього теоретичного максимуму та суттєво знижує собівартість генерації.
Найбільш значущим аспектом анонсу є замикання технологічного циклу: OpenAI використала поточні AI-моделі для розробки заліза, яке запускатиме моделі наступного покоління. Компресія циклу проєктування архітектури мікросхем до дев'яти місяців перетворює розробку напівпровідників із довготривалого капіталомісткого процесу на гнучку ітеративну процедуру, схожу на оновлення софту. Це дозволить OpenAI та Broadcom оперативно підлаштовувати майбутні релізи кремнію під швидкі зміни в архітектурах нейромереж, що забезпечить компанії довгострокову перевагу у швидкості та вартості генерації відповідей над головними конкурентами на ринку.
Для широкого ринку та кінцевих споживачів цей реліз означає початок ери радикального здешевлення та прискорення розумних інтерактивних сервісів. Зниження енергоспоживання та собівартості обчислень напряму конвертується в миттєві відповіді ChatGPT, складні багатокрокові ланцюжки міркувань без довгих затримок та значне зниження цін на інтерфейси програмування API для сторонніх розробників. Угода з Broadcom та Celestica де-факто закладає фізичний фундамент для масштабування технологій до рівня загальнодоступної та повсякденної послуги, що змінить архітектуру всієї світової цифрової економіки.