NVIDIA revenue sharecloud GPUFirmus TechnologiesNVIDIA GPU revenue share cloud modelNVIDIA Sharon AI GB300 deal

NVIDIA становится «облачным арендодателем» благодаря сделке с разделением выручки от GPU

2 июл 20266 мин. чтенияAlex Drover

// В ЭТОЙ СТАТЬЕ

01Цифры 02Что действительно изменилось 03Что уже заложено в цену для AI-разработки 04Контрарианская точка зрения 05Ключевые выводы 06Часто задаваемые вопросы

Каждый, кто пытался подписать многолетний контракт на GPU за последние полтора года, знает эту шутку: квота на оборудование — это простая часть, а финансирование — вот где сделки рассыпаются. Ответ NVIDIA, объявленный 1 июля, состоит в том, чтобы перестать притворяться просто вендором железа и начать действовать как облачный арендодатель. Ключевая цифра — кампус Firmus в Батаме мощностью до 360 мегаватт и до 170 000 GPU, обеспеченный структурой разделения выручки и кредитной поддержки, а не прямым заказом на покупку.

Цифры

Начнём с физического масштаба. Как сообщает блог NVIDIA, компания Firmus Technologies строит кампус DSX AI factory в Батаме, Индонезия, с ожидаемым масштабированием до 360 мегаватт и поддержкой до 170 000 GPU NVIDIA. Для сравнения: потребление энергии этой единственной площадки примерно соответствует среднему алюминиевому заводу — только всё это посвящено генерации токенов.

Sharon AI — второй названный партнёр, развёртывающий до 40 000 GPU NVIDIA Grace Blackwell GB300. При публично обсуждаемых ценах на GB300 счёт за оборудование превышает то, что большинство суверенных фондов готовы одобрить в рамках одного транша. Тот факт, что это происходит в рамках соглашения о разделении выручки, а не при предоплате наличными, говорит о том, как движется капитал в этом цикле.

Коммерческая структура имеет четыре ключевых элемента. AI-облака получают инфраструктуру. Они продают сервисы на базе NVIDIA клиентам из числа AI-native компаний, предприятий и ISV. NVIDIA получает стандартную выручку от продукта с кремния. И, что критически важно, NVIDIA также получает долю облачной выручки с поддерживаемых мощностей. Собственная формулировка компании называет это регулярным потоком доходов, привязанным к использованию.

Переведём на операторский язык: NVIDIA только что тихо превратилась в держателя облачных роялти в дополнение к роли чип-вендора. Каждый задание по файн-тюнингу, каждый агентный инференс-вызов на поддерживаемых мощностях теперь одновременно питает два P&L. Явно указанные рабочие нагрузки — обучение моделей, пост-обучение, файн-тюнинг и высокообъёмный агентный инференс. Последнее имеет значение. Агентный инференс — это то место, где потребление токенов становится нелинейным, поскольку один пользовательский запрос может разворачиваться в сотни инструментальных вызовов за кулисами.

Названные примеры со стороны спроса — Baseten, Fireworks AI и Together AI. Ни у одного из них нет собственных фабрик. Все они сжигают мощности с такой скоростью, что традиционные циклы закупок в colo выглядят доисторически. Производственные инциденты, которые я наблюдал у быстрорастущих инференс-провайдеров, обычно восходят к одной и той же первопричине: обязательства по мощностям, взятые шесть месяцев назад, против кривой спроса, которая удвоилась за четыре. Эта модель разработана именно для такого несоответствия.

Что действительно изменилось

Уберём пресс-релизный лоск и спросим, что реально изменилось. Три вещи.

Первое: NVIDIA теперь является контрагентом в стеке финансирования, а не просто поставщиком на его вершине. Компонент кредитной поддержки означает, что компания ставит свой баланс за AI-облачными операторами, которые иначе с трудом привлекали бы долговое финансирование под залог GPU, обесценивающихся по восемнадцатимесячной кривой. Банки избегали кредитовать под запасы Hopper и Blackwell, потому что никто не доверяет модели остаточной стоимости. NVIDIA доверяет, потому что NVIDIA её и устанавливает.

Второе: разделение выручки переворачивает стимул к утилизации. При модели чистой продажи NVIDIA фиксирует выручку при отгрузке и, откровенно говоря, не заботится о том, работают ли GPU на 30% или 90% утилизации. При этой модели простаивающие мощности — это потерянная регулярная выручка для Санта-Клары. Ожидайте, что программный роудмап NVIDIA, включая планировщик и MIG-нарезку, станет значительно агрессивнее в отношении выжимания утилизации — теперь они едят собственную стряпню.

Третье: географический паттерн иной. Батам — это не Эшберн. Sharon AI позиционирует суверенные вычисления. Чипмейкер активно засевает не-гиперскейлерные регионы мощностями под своим брендом, оформленными как DSX AI factories. Это прямое хеджирование против трёх американских гиперскейлеров, которые сейчас диктуют концентрационный риск выручки NVIDIA.

Моя позиция: интересен не счётчик GPU, а то, что NVIDIA перестала доверять AWS, Azure и GCP как единственному каналу дистрибуции своего самого дорогого кремния. Компания наблюдала за тем, что Microsoft сделала с контрактами на вычисления OpenAI, и решила, что вертикальное выравнивание ценнее нейтральности канала.

Что не ново: базовая боль клиента. Строители моделей всегда хотели более быстрого доступа к мощностям без ожидания выбора площадки, закупки электроэнергии, строительства и запуска оборудования. Этой жалобе пятнадцать лет. Новое — вендор берёт на себя часть счёта, чтобы сократить цикл.

Что уже заложено в цену для AI-разработки

Для старших инженеров и руководителей платформ большинство поверхностных последствий уже встроено в планирование на 2026 год. Все исходят из того, что мощности GB300 продолжают поступать. Все предполагают, что затраты на агентный инференс к концу года будут доминировать в счетах. Все ожидают распространения региональных AI-облаков. Если вы запускаете инференс-платформу поверх провайдеров уровня Baseten, Fireworks или Together, это объявление не изменит вашу архитектуру на следующей неделе.

Что не заложено в цену: вторичный эффект на юнит-экономику. Если NVIDIA берёт долю облачной выручки, эта маржа должна откуда-то прийти. Либо оператор AI-облака поглощает её, либо она перекладывается на клиента в виде немного худшего курса доллар-за-токен по сравнению с неподдерживаемым развёртыванием. Командам, строящим модели затрат с допущением о товарных ценах на GPU в этих DSX-выровненных фабриках, следует стресс-тестировать это допущение. Агентные паттерны, которые будут доминировать в рабочих нагрузках 2026 года — когда один запрос может запускать длинные цепочки использования инструментов — это именно те нагрузки, в которых NVIDIA теперь участвует.

Также недооценено: компонент кредитной поддержки меняет то, кто может выйти на рынок. Региональный оператор с выгодным энергетическим соглашением, но слабым балансом ранее был закрыт. Теперь нет. Ожидайте волну AI-облаков второго эшелона в Юго-Восточной Азии, Персидском заливе и Латинской Америке в течение следующих четырёх кварталов — все они будут позиционировать суверенные вычисления с финансовым каркасом NVIDIA под ними.

Вердикт для платформенных команд: перестройте матрицу провайдеров. Старое различие между гиперскейлером и неоклаудом заменяется делением на NVIDIA-aligned и не-NVIDIA-aligned. Именно эта ось будет реально предсказывать доступность мощностей и поведение ценообразования в 2027 году.

Контрарианская точка зрения

Консенсусная интерпретация такова: это хорошо для AI-native строителей, потому что мощности становятся дешевле и доступнее. Я не убеждён.

Неудобная интерпретация: модели разделения выручки исторически консолидируют власть у стороны, владеющей дефицитным ресурсом, а не у арендующей его. NVIDIA владеет дефицитным ресурсом. Операторы AI-облаков, подписывающие эти сделки, обменивают сегодняшний балансовый риск на вечное сжатие маржи. Если преемники GB300 ещё больше расширят программный ров NVIDIA, а привязка к CUDA углубится через DSX-ориентированный инструментарий, выход у оператора с каждым годом будет становиться всё уже.

Есть и второй повод для беспокойства. Кампус мощностью 360 мегаватт в Батаме — это физически огромная ставка в одной юрисдикции. Команды, с которыми я работал в регулируемых отраслях, будут иметь мнение о маршрутизации инференса для европейских или американских клиентов через индонезийскую суверенную инфраструктуру. Резидентность данных, экспортный контроль над весами моделей и трансграничная задержка — всё это становится активными инженерными проблемами, а не примечаниями в закупочных документах.

И если кривая спроса на AI-инференс даже умеренно замедлится в 2027 году, NVIDIA по-прежнему будет собирать выручку от продукта с отгруженного кремния. Оператор, владеющий наполовину незагруженным кампусом и обязательством по разделению выручки, — нет. Нижний риск асимметричен.

Ключевые выводы

NVIDIA теперь является контрагентом с разделением выручки в облачных сервисах, а не просто чип-вендором. Регулярные доходы, привязанные к использованию, изменят то, как компания будет стимулировать утилизацию и программную привязку.
Sharon AI (до 40 000 GPU GB300) и Firmus (360 МВт, до 170 000 GPU в Батаме) — якорные арендаторы. Ожидайте, что больше региональных операторов подпишут аналогичные структуры в течение двух кварталов.
Агентный инференс явно входит в область применения. Модели затрат, построенные на фиксированном ценообразовании за токен, должны учитывать вендора, берущего долю на поддерживаемых мощностях.
Компонент кредитной поддержки — это реальный разблокиратор. Он позволяет операторам без гиперскейлерских балансов финансировать GPU-инвентарь, с которым банки не готовы работать в одиночку.
Руководителям платформ следует пересегментировать матрицу провайдеров по линии DSX-aligned против независимых. Это различие будет лучше предсказывать мощности и ценообразование в 2027 году, чем старое деление на гиперскейлер и неоклауд.

Часто задаваемые вопросы

В: Что представляет собой новая модель разделения выручки NVIDIA для AI-вычислений?

NVIDIA позволяет операторам AI-облаков получать её инфраструктуру в рамках структуры разделения выручки и кредитной поддержки. NVIDIA получает стандартную выручку от продукта с оборудования плюс долю облачной выручки, генерируемой на поддерживаемых мощностях, что обеспечивает ей регулярный поток доходов, привязанный к использованию.

В: Каков масштаб развёртываний Sharon AI и Firmus?

Sharon AI развёртывает до 40 000 GPU NVIDIA Grace Blackwell GB300. Firmus строит кампус DSX AI factory в Батаме, Индонезия, с ожидаемым масштабированием до 360 мегаватт и поддержкой до 170 000 GPU NVIDIA.

В: На какие рабочие нагрузки нацелена эта новая инфраструктурная модель?

Модель нацелена на обучение моделей, пост-обучение, файн-тюнинг и высокообъёмный агентный инференс. Названные примеры AI-native спроса, который она обслуживает, — Baseten, Fireworks AI и Together AI, всем которым необходим немедленный доступ к крупномасштабным ускоренным вычислениям по мере роста использования от пилота до продакшена.

Alex Drover

RiverCore Analyst · Dublin, Ireland

// RELATED ARTICLES

Workday запускает Agent Passport: единственный тестировщик — Cisco

Agent Passport от Workday выходит в ранний доступ в Q3 2026 с единственным партнёром по тестированию — Cisco — и без ответа на вопрос: кто платит, если проверенный агент выйдет из-под контроля.

Base44 обучает собственную модель на фоне борьбы за защитные барьеры в vibe coding

Base44 выпустила Base1 — собственную LLM, обученную на пользовательских данных, делая ставку на то, что вертикальная интеграция выгоднее аренды Claude Opus за токены.

Утечка мозгов DeepMind: Shazeer и Jumper ушли за 48 часов

Двое ключевых исследователей Google DeepMind ушли за 48 часов. Рынок стер 5% акций Google. Разбираем, что на самом деле означает этот исход.