NVIDIA revenue sharecloud GPUFirmus TechnologiesNVIDIA GPU revenue share cloud modelNVIDIA Sharon AI GB300 deal

NVIDIA стає «хмарним орендодавцем» завдяки угоді про розподіл доходів від GPU

2 лип 20266 хв. читанняAlex Drover

// У ЦІЙ СТАТТІ

01Цифри 02Що насправді нового 03Що вже враховано для AI-розробки 04Контраріанська думка 05Ключові висновки 06Часті запитання

Кожен, хто намагався підписати багаторічний контракт на GPU протягом останніх вісімнадцяти місяців, знає цей жарт: цінова пропозиція на обладнання — це просто, а от його фінансування — саме тут угоди й зупиняються. Відповідь NVIDIA, оголошена 1 липня, полягає в тому, щоб припинити вдавати себе лише постачальником заліза та почати діяти як хмарний орендодавець. Головна цифра — кампус Firmus у Батамі, що масштабується до 360 мегават і до 170 000 GPU, забезпечений структурою розподілу доходів та кредитної підтримки, а не звичайним замовленням на купівлю.

Цифри

Почнемо з фізичного масштабу. Як повідомляє NVIDIA Blog, Firmus Technologies будує кампус DSX AI factory в Батамі, Індонезія, який очікується масштабувати до 360 мегават та підтримувати до 170 000 GPU NVIDIA. Для контексту: один цей об'єкт споживає приблизно стільки електроенергії, скільки середній алюмінієвий завод, — і все це заради генерації токенів.

Sharon AI — інший названий партнер, який розгортає до 40 000 GPU NVIDIA Grace Blackwell GB300. За публічно обговорюваними цінами на GB300 рахунок за обладнання перевищує те, що більшість суверенних фондів погодиться підписати в одному траншеві. Той факт, що це відбувається в рамках угоди про розподіл доходів, а не за рахунок авансового платежу готівкою, говорить усе про те, як рухається капітал у цьому циклі.

Комерційна структура має чотири складові, які варто назвати. AI-хмари закуповують інфраструктуру. Вони продають сервіси на базі NVIDIA клієнтам із числа AI-нативних компаній, підприємств та ISV. NVIDIA отримує стандартний дохід від продукту з кремнію. І, що критично важливо, NVIDIA також отримує частку хмарного доходу від підтримуваних потужностей. Власне формулювання компанії називає це регулярним, прив'язаним до використання потоком прибутку.

Перекладемо це на мову операторів: NVIDIA щойно тихо перетворилася на хмарного роялті-холдера на додачу до статусу постачальника чипів. Кожне завдання з дообробки, кожен виклик агентного інференсу на цих підтримуваних потужностях тепер годує два P&L одночасно. Завдання, що явно охоплюються: навчання моделей, пост-навчання, дообробка та високообсяговий агентний інференс. Останній пункт важливий. Агентний інференс — це місце, де споживання токенів стає нелінійним, оскільки один запит користувача може розгалужуватися на сотні прихованих викликів інструментів.

Названі приклади з боку попиту — Baseten, Fireworks AI та Together AI. Жоден із них не має власних фабрик. Усі вони спалюють потужності з такою швидкістю, що традиційні цикли закупівлі colocation виглядають архаїчно. Виробничі інциденти, які я спостерігав у провайдерів інференсу, що швидко зростають, зазвичай простежуються до одного кореневого причини: зобов'язання щодо потужностей, прийняті шість місяців тому під криву попиту, яка подвоїлася за чотири. Ця модель спроєктована саме для такого невідповідності.

Що насправді нового

Відкиньте глянець прес-релізу та запитайте, що реально змінилося. Три речі.

По-перше, NVIDIA тепер є контрагентом у фінансовому стеку, а не лише постачальником на його вершині. Компонент кредитної підтримки означає, що компанія ставить свій баланс за AI-хмарних операторів, яким інакше було б важко залучити борговий капітал під заставу GPU, що знецінюються за вісімнадцятимісячною кривою. Банки уникають кредитування під запаси Hopper та Blackwell, оскільки ніхто не довіряє моделі залишкової вартості. NVIDIA — довіряє, бо NVIDIA її й встановлює.

По-друге, розподіл доходів змінює стимул щодо завантаженості. За чистою моделлю продажу NVIDIA фіксує дохід під час відвантаження і, відверто кажучи, їй байдуже, чи GPU працюють на 30% або на 90% завантаженості. За цією моделлю простій потужностей — це втрачений регулярний дохід для Санта-Клари. Очікуйте, що дорожня карта NVIDIA з програмного забезпечення, планування та нарізки MIG стане значно агресивнішою в питаннях підвищення завантаженості, адже тепер вони їдять те, що самі приготували.

По-третє, географічна картина відрізняється. Батам — це не Ашберн. Sharon AI позиціонує суверенні обчислення. Це виробник чипів, який активно засіває не-гіперскейлерні регіони потужностями під власним брендом, оформленими як DSX AI factories. Це прямий хедж проти трьох американських гіперскейлерів, які наразі диктують концентраційний ризик доходів NVIDIA.

Моя думка: цікаве тут — не кількість GPU, а те, що NVIDIA перестала довіряти AWS, Azure та GCP як єдиному каналу розповсюдження свого найдорожчого кремнію. Компанія спостерігала, що Microsoft зробила з контрактами на обчислення OpenAI, і вирішила, що вертикальне вирівнювання цінніше за нейтральність каналу.

Що не є новим: фундаментальний біль клієнта. Розробники моделей завжди хотіли швидшого доступу до потужностей без очікування у черзі вибору майданчика, закупівлі електроенергії, будівництва та введення обладнання в експлуатацію. Це п'ятнадцятирічна скарга. Новим є те, що постачальник бере на себе частину рахунку, щоб скоротити цей цикл.

Що вже враховано для AI-розробки

Для старших інженерів та керівників платформ більшість очевидних наслідків вже закладена в планування на 2026 рік. Усі припускають, що потужності GB300 продовжують надходити. Усі припускають, що витрати на агентний інференс домінуватимуть у рахунках до кінця року. Усі припускають, що регіональні AI-хмари множаться. Якщо ви керуєте платформою інференсу поверх таких провайдерів, як Baseten, Fireworks або Together, ця новина не змінить вашу архітектуру наступного тижня.

Що не враховано: ефект другого порядку на одиничну економіку. Якщо NVIDIA отримує частку хмарного доходу, ця маржа має звідкись надійти. Або AI-хмарний оператор поглинає її, або вона передається клієнту у вигляді дещо гіршого курсу долар-на-токен порівняно з нерозгорнутою deployment. Команди, що будують моделі витрат з припущенням про commodity-ціноутворення GPU на цих DSX-орієнтованих фабриках, мають стрес-тестувати це припущення. Агентні патерни, що домінуватимуть у завданнях 2026 року, де один запит може ініціювати довгі ланцюжки використання інструментів, — це саме ті завдання, у яких NVIDIA тепер бере частку.

Також недооцінено: компонент кредитної підтримки змінює те, хто може вийти на ринок. Регіональний оператор із сильною угодою про електроенергію та слабким балансом раніше був відрізаний від ринку. Тепер — ні. Очікуйте хвилі AI-хмар другого рівня в Південно-Східній Азії, Перській затоці та Латинській Америці протягом наступних чотирьох кварталів — усі позиціонуватимуть суверенні обчислення з фінансовим каркасом NVIDIA під ними.

Висновок для платформних команд: перебудуйте матрицю провайдерів. Старий поділ між гіперскейлером та неохмарою замінюється поділом на DSX-орієнтованих та незалежних. Саме ця вісь реально передбачатиме доступність потужностей та поведінку ціноутворення у 2027 році.

Контраріанська думка

Консенсусна оцінка полягає в тому, що це є позитивним для AI-нативних розробників, оскільки потужності стають дешевшими та доступнішими. Я не переконаний.

Незручна оцінка: моделі розподілу доходів історично консолідують владу в сторони, яка володіє дефіцитним ресурсом, а не тієї, що його орендує. NVIDIA володіє дефіцитним ресурсом. AI-хмарні оператори, які підписують ці угоди, обмінюють балансовий ризик сьогодні на компресію маржі назавжди. Якщо наступники GB300 ще більше розширять програмний рів NVIDIA, а CUDA lock-in поглибиться через DSX-орієнтований інструментарій, шлях до виходу для операторів щороку звужуватиметься.

Є й друга проблема. Кампус на 360 мегават у Батамі — це фізично величезна ставка в одній юрисдикції. Команди, з якими я працював у регульованих вертикалях, матимуть думки щодо маршрутизації інференсу для європейських або американських клієнтів через індонезійську суверенну інфраструктуру. Резидентність даних, експортний контроль на ваги моделей та міжкордонна затримка — все це стає активними інженерними проблемами, а не дрібницями в закупівлі.

І якщо крива попиту на AI-інференс навіть помірно вирівняється у 2027 році, NVIDIA все одно отримує дохід від продукту за відвантажений кремній. Оператор, який тримає напівпорожній кампус та зобов'язання з розподілу доходів, — ні. Ризики розподілені асиметрично.

Ключові висновки

NVIDIA тепер є контрагентом із розподілу доходів від хмарних сервісів, а не лише постачальником чипів. Регулярний, прив'язаний до використання прибуток змінює те, як компанія стимулюватиме завантаженість та програмне lock-in.
Sharon AI (до 40 000 GPU GB300) та Firmus (360 МВт, до 170 000 GPU в Батамі) — ключові орендарі. Очікуйте, що більше регіональних операторів підпишуть аналогічні структури протягом двох кварталів.
Агентний інференс явно входить до сфери охоплення. Моделі витрат, побудовані на фіксованому ціноутворенні за токен, мають враховувати частку постачальника на підтримуваних потужностях.
Компонент кредитної підтримки — це справжній відмикач. Він дозволяє операторам без балансу гіперскейлера фінансувати запаси GPU, яких банки наодинці не торкнуться.
Керівники платформ мають переосегментувати матрицю провайдерів за принципом DSX-орієнтованих та незалежних. Цей поділ краще прогнозуватиме потужності та ціноутворення у 2027 році, ніж старий поділ гіперскейлер-проти-неохмари.

Часті запитання

Що таке нова модель розподілу доходів NVIDIA для AI-обчислень?

NVIDIA дозволяє AI-хмарним операторам закуповувати її інфраструктуру за структурою розподілу доходів та кредитної підтримки. NVIDIA отримує стандартний дохід від продукту з обладнання плюс частку хмарного доходу, згенерованого на підтримуваних потужностях, що дає їй регулярний, прив'язаний до використання потік прибутку.

Яким є масштаб розгортань Sharon AI та Firmus?

Sharon AI розгортає до 40 000 GPU NVIDIA Grace Blackwell GB300. Firmus будує кампус DSX AI factory в Батамі, Індонезія, який очікується масштабувати до 360 мегават та підтримувати до 170 000 GPU NVIDIA.

На які завдання орієнтована ця нова модель інфраструктури?

Модель орієнтована на навчання моделей, пост-навчання, дообробку та високообсяговий агентний інференс. Названі приклади AI-нативного попиту, який вона обслуговує, включають Baseten, Fireworks AI та Together AI — усім їм потрібен негайний доступ до масштабованих прискорених обчислень у міру зростання використання від пілоту до продакшену.

Alex Drover

RiverCore Analyst · Dublin, Ireland

// RELATED ARTICLES

Workday запускає Agent Passport із Cisco як єдиним тестувальником

Agent Passport від Workday виходить у Q3 2026 у ранньому доступі з одним партнером — Cisco — і без відповіді на питання, хто платить, якщо перевірений агент поводиться неправильно.

Base44 тренує власну модель, поки ринок vibe coding шукає стійкість

Base44 випустила Base1 — власну LLM, навчену на даних користувачів, роблячи ставку на вертикальну інтеграцію замість оренди Claude Opus за токени.

Відтік мізків із DeepMind: Shazeer і Jumper пішли за 48 годин

Двоє ключових дослідників Google DeepMind пішли за 48 годин. Акції впали на 5%. Що насправді означає цей відтік для інженерних команд?