Jalapeño inference chipAI ASICLLM acceleratorOpenAI Broadcom ASIC tape out 9 monthsgigawatt scale AI inference chip 2026

OpenAI и Broadcom выпустили чип Jalapeño за 9 месяцев

26 июн 20267 мин. чтенияSarah Chen

// В ЭТОЙ СТАТЬЕ

01Что произошло 02Техническая архитектура 03Кто оказывается под ударом 04Стратегия для разработки ИИ 05Ключевые выводы 06Часто задаваемые вопросы

Девять месяцев от начала проектирования до tape-out. Именно эту цифру OpenAI и Broadcom заявляют для Jalapeño — акселератора инференса, представленного 24 июня. Компании называют это самым быстрым циклом разработки ASIC в истории высокопроизводительных полупроводников. Для сравнения: стандартная программа разработки ASIC аналогичного класса обычно занимает от 18 до 36 месяцев — от спецификации до кремния. Таким образом, речь идёт о сокращении отраслевого норматива в 2–4 раза. Готовый чип был лично передан Сэму Альтману и Грегу Брокману руководителями Broadcom — Хоком Таном и Чарли Каввасом. Подобные постановочные кадры делаются только тогда, когда компании хотят, чтобы рынок воспринял это как вызов Nvidia.

Что произошло

Как сообщила OpenAI, Jalapeño — это первый Intelligence Processor компании и первый AI-акселератор в рамках запланированной многопоколенческой вычислительной платформы, разработанной совместно с Broadcom (NASDAQ: AVGO). Позиционирование предельно конкретное: акселератор инференса, оптимизированный для LLM, — не чип для обучения, не GPU общего назначения. Инженерные образцы уже выполняют ML-задачи в лаборатории на целевой производственной частоте и мощности, в том числе GPT-5.3-Codex-Spark, что свидетельствует о завершении базового этапа отладки и переходе к характеризации рабочих нагрузок.

Состав партнёров выбран намеренно. Broadcom отвечает за реализацию чипа, сетевые функции и подключение, включая сетевой кремний Tomahawk. Celestica занимается интеграцией на уровне платы, стойки и системы. Microsoft названа партнёром по развёртыванию в дата-центрах гигаваттного масштаба начиная с 2026 года. Первоначальное развёртывание запланировано на конец 2026 года, программа охватывает несколько поколений чипов.

Аппаратную программу OpenAI возглавляет Ричард Хо. По его словам, Jalapeño — это проект с чистого листа, а не адаптация акселератора общего назначения под задачи ИИ. Это принципиально важная формулировка: она прямо противопоставляет Jalapeño установленной базе GPU Hopper и Blackwell, которые сейчас обслуживают инференс на фронтире. OpenAI также подтвердила, что использовала собственные модели для ускорения части процессов проектирования и оптимизации — это первое публичное заявление от ведущей лаборатории о том, что её собственные LLM существенно сократили сроки tape-out. Подробный отчёт о производительности обещан в ближайшие месяцы. До его публикации единственный сигнал о производительности носит качественный характер: «существенно лучший» показатель производительности на ватт по сравнению с текущими передовыми решениями.

Техническая архитектура

Архитектурная концепция строится на трёх тезисах. Первый — Jalapeño сокращает перемещение данных. Второй — обеспечивает баланс между вычислительными ресурсами, памятью и сетевым взаимодействием. Третий — достигает реальной утилизации, значительно более близкой к теоретическому пику. Ни одна из этих целей не является новшеством сама по себе — их декларирует каждый производитель акселераторов. Однако интересен подход OpenAI к выбору точки проектирования: архитектура чипа формируется на основе реальных рабочих нагрузок ChatGPT, Codex, API и будущих агентных продуктов. Это петля проектирования с приоритетом рабочей нагрузки: именно ядра, паттерны перемещения данных и паттерны обслуживания реального производственного трафика определяют архитектуру кремния, а не наоборот.

Сетевой компонент важнее, чем кажется из заголовков. Tomahawk — это флагманский коммутационный кремний Broadcom на базе Ethernet, и его сочетание с акселератором означает ставку на то, что масштабируемый инференс в гигаваттном масштабе будет строиться на Ethernet-фабрике, а не на InfiniBand. Если стойки с Jalapeño будут поставляться с Tomahawk в качестве фабрики по умолчанию, это даст направленный сигнал о том, как будут выглядеть инференс-кластеры гипермасштабных провайдеров к 2027 году.

В источнике не раскрываются технологический узел, конфигурация памяти (поколение HBM, ёмкость на корпус, пропускная способность), площадь кристалла, TDP и топология межсоединений между акселераторами. Именно эти четыре параметра позволили бы реально оценить заявление о производительности на ватт. Пока они неизвестны, но логика такова: если Jalapeño нацелен на развёртывание в конце 2026 года в гигаваттном масштабе, он почти наверняка изготовлен по передовому техпроцессу, уже освоенному в производстве (класс 3 нм), и почти наверняка использует HBM3E или HBM4. Без этого заявление о превосходстве по производительности на ватт над кремнием поколения Blackwell попросту не выдержит проверки.

Вопрос, на который стоит обратить особое внимание: каков реальный показатель утилизации? OpenAI говорит о значении «значительно ближе к теоретическому пику». Текущие GPU-развёртывания для инференса, как правило, обеспечивают от 30 до 55 процентов теоретической утилизации FLOPS при декодировании трансформеров. Если Jalapeño достигнет 70 процентов и выше на представительных задачах обслуживания LLM, одного этого достаточно для обоснования программы. Если показатель составит 60 процентов, вся нагрузка ляжет на аргумент о производительности на ватт. Технический отчёт покажет, какой вариант реализуется. Если всё пойдёт как заявлено, в течение следующих двух кварталов OpenAI должна опубликовать показатели утилизации декодирования выше 65 процентов.

Кто оказывается под ударом

Очевидный объект угрозы — Nvidia, однако характер этой угрозы весьма специфичен. Jalapeño предназначен исключительно для инференса, а многопоколенческий роадмап рассчитан на гигаваттный масштаб у одного заказчика (OpenAI) с одним облачным партнёром (Microsoft) на данный момент. Это не вытесняет Nvidia из сегмента обучения и не затрагивает в краткосрочной перспективе более широкий корпоративный рынок GPU. Однако это означает, что крупнейшая в мире инференс-нагрузка — парк серверов OpenAI — получает реалистичный путь к замене текущих решений. Если Microsoft Azure начнёт предлагать конечные точки OpenAI на базе Jalapeño наряду с конечными точками на базе Nvidia в 2027 году, расстановка сил на переговорах изменится.

Вторая группа под угрозой — рыночные производители специализированных ASIC для инференса: Groq, Cerebras, SambaNova, Tenstorrent и, в меньшей степени, позиционирование AMD серии MI в сегменте инференса. Их концепция строилась на тезисе: «мы — специализированная альтернатива GPU общего назначения для инференса». OpenAI только что интернализировала этот тезис. Любой стартап, предлагающий фронтирным лабораториям экономию на стоимости инференса, теперь должен объяснить, зачем лаборатории покупать их чип вместо того, чтобы разработать собственный. Заявление о девятимесячном цикле tape-out делает вариант собственной разработки значительно менее затратным, чем год назад.

Третья группа, менее очевидная, — все, кто запускает инференс на открытых моделях на арендованных GPU. Если стоимость обслуживания на токен у OpenAI существенно снизится в 2027 году благодаря Jalapeño, цены на API на платформе OpenAI могут пойти вниз без ущерба для маржи. Это подрывает экономическое обоснование самостоятельного хостинга Llama или Mistral на арендованных H100. Именно такой расчёт «создать vs. купить» сейчас проводят многие команды в финтехе и iGaming. В ближайшие 90 дней таким командам стоит пересчитать юнит-экономику, заложив снижение стоимости инференса на 30 процентов как сценарий, а не как прогноз.

Стратегия для разработки ИИ

Для технических руководителей, делающих инфраструктурные ставки в ближайшие два квартала, — несколько конкретных шагов. Первый: не перестраивайте архитектуру под Jalapeño прямо сейчас. Нет публичного SDK, нет документации на уровне ядер, нет анонсированных путей доступа для третьих сторон. В первом поколении чип предназначен для собственного парка серверов OpenAI через дата-центры Microsoft. Если вы потребитель API, Jalapeño проявится для вас как более низкая задержка и, возможно, более низкая цена — но не как новая целевая платформа для компиляции.

Второй: выстраивайте абстракцию между прикладным уровнем и провайдером модели. Анонс Jalapeño — сигнал о том, что фронтирные лаборатории продолжат забирать всё больше стека под собственный контроль. Это означает, что риск привязки к конкретному провайдеру будет только расти. Маршрутизируйте запросы через MCP или аналогичный протокольный слой, чтобы смена провайдера в 2027 году стала изменением конфигурации, а не переписыванием кода.

Третий: воспринимайте заявление о девятимесячном tape-out как серьёзный ввод для планирования, даже если дисконтировать его вдвое. Если фронтирные лаборатории способны итерировать собственный кремний с циклом менее двух лет, используя собственные модели для ускорения проектирования, кривая стоимости инференса будет круче, чем предполагает текущее планирование. Бюджеты, построенные на фиксированной стоимости токена для 2027 и 2028 годов, вероятно, окажутся неверными — в пользу заказчика. Планируйте под ёмкость, а не под стоимость.

Ключевые выводы

Jalapeño — первый инференс-чип OpenAI, созданный в партнёрстве с Broadcom за девять месяцев. Компания заявляет его как самый быстрый цикл разработки ASIC в истории передовых полупроводников; первоначальное развёртывание запланировано на конец 2026 года.
Платформа использует сетевой кремний Broadcom Tomahawk и разворачивается совместно с Celestica. Microsoft названа первым партнёром по гигаваттному развёртыванию.
Инженерные образцы уже выполняют рабочие нагрузки GPT-5.3-Codex-Spark на целевой производственной частоте и мощности, однако технологический узел, конфигурация памяти и показатели утилизации не раскрываются.
Наибольший конкурентный ущерб грозит стартапам в сегменте специализированных ASIC для инференса и выручке Nvidia от инференса (не обучения) у одного конкретного заказчика.
Потребителям API стоит рассчитывать на снижение цен на инференс в 2027 году и уже сейчас изолировать свой стек от поведения, специфичного для конкретного провайдера.

Часто задаваемые вопросы

В: Что такое чип Jalapeño от OpenAI?

Jalapeño — это первый Intelligence Processor компании OpenAI, акселератор инференса, оптимизированный для LLM и разработанный совместно с Broadcom. Он спроектирован с нуля под задачи инференса, а не адаптирован из чипа ИИ общего назначения, и является первым продуктом в рамках запланированной многопоколенческой вычислительной платформы двух компаний.

В: Когда будет развёрнут Jalapeño?

OpenAI планирует первоначальное развёртывание к концу 2026 года с гигаваттными роллаутами в дата-центрах партнёров, включая Microsoft, на протяжении нескольких поколений чипов. Инженерные образцы уже выполняют ML-задачи в лаборатории на целевой производственной частоте и мощности.

В: Как Jalapeño соотносится с GPU Nvidia?

OpenAI утверждает, что ранние тесты демонстрируют существенно лучшую производительность на ватт по сравнению с текущими передовыми акселераторами, однако подробный технический отчёт ещё не опубликован. Jalapeño предназначен исключительно для инференса и ориентирован на собственный парк серверов OpenAI, поэтому в краткосрочной перспективе он не конкурирует с Nvidia напрямую ни в сегменте обучения, ни на более широком корпоративном рынке GPU.

Sarah Chen

RiverCore Analyst · Dublin, Ireland

// RELATED ARTICLES

Claude Tag в Slack от Anthropic: что нужно знать инженерам

Anthropic запустил Claude Tag в Slack, заменив старый чат-бот мультиплеерным агентом на базе Opus 4.8. Разбираем, что сломается и что улучшится.

Sakana Fugu: защита от привязки к единственному LLM-провайдеру

Sakana AI выпустила Fugu — модель оркестрации, маршрутизирующую задачи между пулом взаимозаменяемых frontier LLM. Реакция сообщества скептична. Разбираем, что реально работает.

Долговое размещение Nvidia на $25 млрд: грамотная оптимизация или сигнал пузыря?

Nvidia привлекает $25 млрд долга, имея $50 млрд кэша и $119 млрд годового свободного денежного потока. Главное здесь — не баланс, а масштаб инвестиций в ИИ-инфраструктуру.