NVIDIA стає «хмарним орендодавцем» завдяки угоді про розподіл доходів від GPU
Кожен, хто намагався підписати багаторічний контракт на GPU протягом останніх вісімнадцяти місяців, знає цей жарт: цінова пропозиція на обладнання — це просто, а от його фінансування — саме тут угоди й зупиняються. Відповідь NVIDIA, оголошена 1 липня, полягає в тому, щоб припинити вдавати себе лише постачальником заліза та почати діяти як хмарний орендодавець. Головна цифра — кампус Firmus у Батамі, що масштабується до 360 мегават і до 170 000 GPU, забезпечений структурою розподілу доходів та кредитної підтримки, а не звичайним замовленням на купівлю.
Цифри
Почнемо з фізичного масштабу. Як повідомляє NVIDIA Blog, Firmus Technologies будує кампус DSX AI factory в Батамі, Індонезія, який очікується масштабувати до 360 мегават та підтримувати до 170 000 GPU NVIDIA. Для контексту: один цей об'єкт споживає приблизно стільки електроенергії, скільки середній алюмінієвий завод, — і все це заради генерації токенів.
Sharon AI — інший названий партнер, який розгортає до 40 000 GPU NVIDIA Grace Blackwell GB300. За публічно обговорюваними цінами на GB300 рахунок за обладнання перевищує те, що більшість суверенних фондів погодиться підписати в одному траншеві. Той факт, що це відбувається в рамках угоди про розподіл доходів, а не за рахунок авансового платежу готівкою, говорить усе про те, як рухається капітал у цьому циклі.
Комерційна структура має чотири складові, які варто назвати. AI-хмари закуповують інфраструктуру. Вони продають сервіси на базі NVIDIA клієнтам із числа AI-нативних компаній, підприємств та ISV. NVIDIA отримує стандартний дохід від продукту з кремнію. І, що критично важливо, NVIDIA також отримує частку хмарного доходу від підтримуваних потужностей. Власне формулювання компанії називає це регулярним, прив'язаним до використання потоком прибутку.
Перекладемо це на мову операторів: NVIDIA щойно тихо перетворилася на хмарного роялті-холдера на додачу до статусу постачальника чипів. Кожне завдання з дообробки, кожен виклик агентного інференсу на цих підтримуваних потужностях тепер годує два P&L одночасно. Завдання, що явно охоплюються: навчання моделей, пост-навчання, дообробка та високообсяговий агентний інференс. Останній пункт важливий. Агентний інференс — це місце, де споживання токенів стає нелінійним, оскільки один запит користувача може розгалужуватися на сотні прихованих викликів інструментів.
Названі приклади з боку попиту — Baseten, Fireworks AI та Together AI. Жоден із них не має власних фабрик. Усі вони спалюють потужності з такою швидкістю, що традиційні цикли закупівлі colocation виглядають архаїчно. Виробничі інциденти, які я спостерігав у провайдерів інференсу, що швидко зростають, зазвичай простежуються до одного кореневого причини: зобов'язання щодо потужностей, прийняті шість місяців тому під криву попиту, яка подвоїлася за чотири. Ця модель спроєктована саме для такого невідповідності.
Що насправді нового
Відкиньте глянець прес-релізу та запитайте, що реально змінилося. Три речі.
По-перше, NVIDIA тепер є контрагентом у фінансовому стеку, а не лише постачальником на його вершині. Компонент кредитної підтримки означає, що компанія ставить свій баланс за AI-хмарних операторів, яким інакше було б важко залучити борговий капітал під заставу GPU, що знецінюються за вісімнадцятимісячною кривою. Банки уникають кредитування під запаси Hopper та Blackwell, оскільки ніхто не довіряє моделі залишкової вартості. NVIDIA — довіряє, бо NVIDIA її й встановлює.
По-друге, розподіл доходів змінює стимул щодо завантаженості. За чистою моделлю продажу NVIDIA фіксує дохід під час відвантаження і, відверто кажучи, їй байдуже, чи GPU працюють на 30% або на 90% завантаженості. За цією моделлю простій потужностей — це втрачений регулярний дохід для Санта-Клари. Очікуйте, що дорожня карта NVIDIA з програмного забезпечення, планування та нарізки MIG стане значно агресивнішою в питаннях підвищення завантаженості, адже тепер вони їдять те, що самі приготували.
По-третє, географічна картина відрізняється. Батам — це не Ашберн. Sharon AI позиціонує суверенні обчислення. Це виробник чипів, який активно засіває не-гіперскейлерні регіони потужностями під власним брендом, оформленими як DSX AI factories. Це прямий хедж проти трьох американських гіперскейлерів, які наразі диктують концентраційний ризик доходів NVIDIA.
Моя думка: цікаве тут — не кількість GPU, а те, що NVIDIA перестала довіряти AWS, Azure та GCP як єдиному каналу розповсюдження свого найдорожчого кремнію. Компанія спостерігала, що Microsoft зробила з контрактами на обчислення OpenAI, і вирішила, що вертикальне вирівнювання цінніше за нейтральність каналу.
Що не є новим: фундаментальний біль клієнта. Розробники моделей завжди хотіли швидшого доступу до потужностей без очікування у черзі вибору майданчика, закупівлі електроенергії, будівництва та введення обладнання в експлуатацію. Це п'ятнадцятирічна скарга. Новим є те, що постачальник бере на себе частину рахунку, щоб скоротити цей цикл.
Що вже враховано для AI-розробки
Для старших інженерів та керівників платформ більшість очевидних наслідків вже закладена в планування на 2026 рік. Усі припускають, що потужності GB300 продовжують надходити. Усі припускають, що витрати на агентний інференс домінуватимуть у рахунках до кінця року. Усі припускають, що регіональні AI-хмари множаться. Якщо ви керуєте платформою інференсу поверх таких провайдерів, як Baseten, Fireworks або Together, ця новина не змінить вашу архітектуру наступного тижня.
Що не враховано: ефект другого порядку на одиничну економіку. Якщо NVIDIA отримує частку хмарного доходу, ця маржа має звідкись надійти. Або AI-хмарний оператор поглинає її, або вона передається клієнту у вигляді дещо гіршого курсу долар-на-токен порівняно з нерозгорнутою deployment. Команди, що будують моделі витрат з припущенням про commodity-ціноутворення GPU на цих DSX-орієнтованих фабриках, мають стрес-тестувати це припущення. Агентні патерни, що домінуватимуть у завданнях 2026 року, де один запит може ініціювати довгі ланцюжки використання інструментів, — це саме ті завдання, у яких NVIDIA тепер бере частку.
Також недооцінено: компонент кредитної підтримки змінює те, хто може вийти на ринок. Регіональний оператор із сильною угодою про електроенергію та слабким балансом раніше був відрізаний від ринку. Тепер — ні. Очікуйте хвилі AI-хмар другого рівня в Південно-Східній Азії, Перській затоці та Латинській Америці протягом наступних чотирьох кварталів — усі позиціонуватимуть суверенні обчислення з фінансовим каркасом NVIDIA під ними.
Висновок для платформних команд: перебудуйте матрицю провайдерів. Старий поділ між гіперскейлером та неохмарою замінюється поділом на DSX-орієнтованих та незалежних. Саме ця вісь реально передбачатиме доступність потужностей та поведінку ціноутворення у 2027 році.
Контраріанська думка
Консенсусна оцінка полягає в тому, що це є позитивним для AI-нативних розробників, оскільки потужності стають дешевшими та доступнішими. Я не переконаний.
Незручна оцінка: моделі розподілу доходів історично консолідують владу в сторони, яка володіє дефіцитним ресурсом, а не тієї, що його орендує. NVIDIA володіє дефіцитним ресурсом. AI-хмарні оператори, які підписують ці угоди, обмінюють балансовий ризик сьогодні на компресію маржі назавжди. Якщо наступники GB300 ще більше розширять програмний рів NVIDIA, а CUDA lock-in поглибиться через DSX-орієнтований інструментарій, шлях до виходу для операторів щороку звужуватиметься.
Є й друга проблема. Кампус на 360 мегават у Батамі — це фізично величезна ставка в одній юрисдикції. Команди, з якими я працював у регульованих вертикалях, матимуть думки щодо маршрутизації інференсу для європейських або американських клієнтів через індонезійську суверенну інфраструктуру. Резидентність даних, експортний контроль на ваги моделей та міжкордонна затримка — все це стає активними інженерними проблемами, а не дрібницями в закупівлі.
І якщо крива попиту на AI-інференс навіть помірно вирівняється у 2027 році, NVIDIA все одно отримує дохід від продукту за відвантажений кремній. Оператор, який тримає напівпорожній кампус та зобов'язання з розподілу доходів, — ні. Ризики розподілені асиметрично.
Ключові висновки
- NVIDIA тепер є контрагентом із розподілу доходів від хмарних сервісів, а не лише постачальником чипів. Регулярний, прив'язаний до використання прибуток змінює те, як компанія стимулюватиме завантаженість та програмне lock-in.
- Sharon AI (до 40 000 GPU GB300) та Firmus (360 МВт, до 170 000 GPU в Батамі) — ключові орендарі. Очікуйте, що більше регіональних операторів підпишуть аналогічні структури протягом двох кварталів.
- Агентний інференс явно входить до сфери охоплення. Моделі витрат, побудовані на фіксованому ціноутворенні за токен, мають враховувати частку постачальника на підтримуваних потужностях.
- Компонент кредитної підтримки — це справжній відмикач. Він дозволяє операторам без балансу гіперскейлера фінансувати запаси GPU, яких банки наодинці не торкнуться.
- Керівники платформ мають переосегментувати матрицю провайдерів за принципом DSX-орієнтованих та незалежних. Цей поділ краще прогнозуватиме потужності та ціноутворення у 2027 році, ніж старий поділ гіперскейлер-проти-неохмари.
Часті запитання
Що таке нова модель розподілу доходів NVIDIA для AI-обчислень?
NVIDIA дозволяє AI-хмарним операторам закуповувати її інфраструктуру за структурою розподілу доходів та кредитної підтримки. NVIDIA отримує стандартний дохід від продукту з обладнання плюс частку хмарного доходу, згенерованого на підтримуваних потужностях, що дає їй регулярний, прив'язаний до використання потік прибутку.
Яким є масштаб розгортань Sharon AI та Firmus?
Sharon AI розгортає до 40 000 GPU NVIDIA Grace Blackwell GB300. Firmus будує кампус DSX AI factory в Батамі, Індонезія, який очікується масштабувати до 360 мегават та підтримувати до 170 000 GPU NVIDIA.
На які завдання орієнтована ця нова модель інфраструктури?
Модель орієнтована на навчання моделей, пост-навчання, дообробку та високообсяговий агентний інференс. Названі приклади AI-нативного попиту, який вона обслуговує, включають Baseten, Fireworks AI та Together AI — усім їм потрібен негайний доступ до масштабованих прискорених обчислень у міру зростання використання від пілоту до продакшену.
Workday запускає Agent Passport із Cisco як єдиним тестувальником
Agent Passport від Workday виходить у Q3 2026 у ранньому доступі з одним партнером — Cisco — і без відповіді на питання, хто платить, якщо перевірений агент поводиться неправильно.
Base44 тренує власну модель, поки ринок vibe coding шукає стійкість
Base44 випустила Base1 — власну LLM, навчену на даних користувачів, роблячи ставку на вертикальну інтеграцію замість оренди Claude Opus за токени.
Відтік мізків із DeepMind: Shazeer і Jumper пішли за 48 годин
Двоє ключових дослідників Google DeepMind пішли за 48 годин. Акції впали на 5%. Що насправді означає цей відтік для інженерних команд?




