vibe coding modelBase44Base1 LLMBase44 Base1 in-house language modelvibe coding vertical integration strategy

Base44 тренує власну модель, поки ринок vibe coding шукає стійкість

30 чер 20267 хв. читанняJames O'Brien

// У ЦІЙ СТАТТІ

01Що сталося 02Технічна анатомія 03Хто постраждає 04Стратегія для AI-розробки 05Ключові висновки 06Часті запитання

Уявіть італійський ресторан, який роками купував макарони оптом, а одного ранку господар з'являється з борошномельним млином у фургоні. Приблизно те саме щойно зробила Base44 зі своїм ланцюжком постачання. Тель-авівська компанія у сфері vibe coding припинила орендувати передову AI-модель за токени й почала «молоти борошно» самостійно.

Модель називається Base1, і ставка за нею проста: коли ти власник млина, ти контролюєш маржу. Чи виправдає себе ця ставка — ось цікавіше запитання для всіх, хто зараз будує на основі OpenAI, Anthropic або Google.

Що сталося

Base44, яку Wix придбала приблизно рік тому за $80 мільйонів, коли компанії було ледь шість місяців і в ній працювало вісім осіб, почала розгортати власну велику мовну модель. За даними TechChrunch, модель названа Base1 і навчена на датасеті, сформованому з десятків мільйонів реальних взаємодій користувачів із платформою.

Засновник Маор Шломо позиціонує це як стратегію вертикальної інтеграції. Він розповів журналістам, що «навчання та володіння моделлю як частиною [нашого] цілісного стеку дає нам набагато більше можливостей для оптимізації затримки, витрат і ефективності». Компанія тепер описує себе як «єдиний вертикально інтегрований додаток для vibe coding».

Фінансовий контекст тут важливий. Кілька місяців тому Base44 подолала позначку $100 мільйонів ARR, а кількість співробітників зростає після придбання Wix. Це зростання різко контрастує з материнською компанією, яка нещодавно оголосила про скорочення 20% персоналу. Base44 — актив, що працює, і Wix потребує, щоб він працював іще ефективніше.

Головним конкурентом усі вважають Lovable — шведський стартап, який досяг статусу єдинорога під час серії A минулого літа та перетнув позначку $500 мільйонів ARR на початку цього місяця, продовжуючи використовувати зовнішні LLM. Lovable більший. Base44 іде глибше. Це справді дві різні стратегії, і наступні дванадцять місяців покажуть, яка з них краще витримає перевірку часом.

Шломо також очікує, що інші підуть тим самим шляхом — принаймні гравці з достатнім масштабом і швидкістю розвитку, щоб накопичити значимі тренувальні дані. Тож Base1 — це не стільки прапор, встромлений у землю, скільки перший хід у новій фазі цієї категорії.

Технічна анатомія

Суть проблеми: коли ви будуєте на Claude Opus або моделях класу GPT, кожен запит користувача — це тарифікований API-виклик. Маржу з'їдають витрати на інференс, якими ви не керуєте, затримка, яку ви не можете налаштувати, і дорожня карта, продиктована лабораторією, на яку ви зробили ставку. Кожен, хто спостерігав, як рахунок за інференс зростає швидше за MRR, знає це відчуття.

Власність на Base1 змінює юніт-економіку одразу в трьох місцях. По-перше, інференс переходить від змінних витрат на стороннього постачальника до керованих внутрішніх обчислень. Мова самого прес-релізу Base44 була показовою: «власність на модель дає Base44 прямий контроль над витратами на обчислення та інференс, що, як очікується, призведе до структурно міцнішого профілю маржі з часом». Зверніть увагу на «з часом». Це не миттєвий виграш.

По-друге, тренувальні дані — це рів. Десятки мільйонів реальних взаємодій користувачів на платформі vibe coding — це саме той вузький, високоінформативний датасет, який спеціалізована модель може використати, а загальна модель не може легко відтворити. Передові лабораторії, як-от Anthropic, чий інструментарій Claude сам став гравцем у vibe coding, мають широту охоплення, але не таку ж щільність зворотних зв'язків «користувач хотів X, отримав Y, відредагував до Z» саме для генерації застосунків.

По-третє, затримка та маршрутизація. Коли ви контролюєте модель, можна виконувати нудну, але цінну роботу: квантизувати для швидкості, дотренувати під власні формати виводу, направляти прості запити до Base1, а складні — до Opus. Джонатан Юзеровічі з Headline сказав про це влучно: корпоративні клієнти зараз будують «цілу інфраструктуру» для оркестрації та оптимізації, щоб «витрати не злітали до небес, зберігаючи такі ж або подібні показники продуктивності в більшості випадків використання».

Місце, де все може зруйнуватися, — це вартість тренування та наявність талантів. Сам Шломо назвав Base1 «величезними інженерними зусиллями», і це чесно. Команда, яка рік тому налічувала вісім людей, тепер займається прикладними ML-дослідженнями. Ось чого немає в прес-релізі.

Хто постраждає

Найбільш уразлива група — прикладні AI-стартапи, єдина відмінність яких полягає у хитрому шаблоні промпта, огорнутому навколо чужої моделі. Якщо Base44 права в тому, що масштаб плюс швидкість рівнозначні достатній кількості даних для навчання спеціалізованої моделі, то всі, хто нижче цього порогу, у небезпеці. Lovable з ARR у п'ять разів більшим має ці дані. Тисячі менших клонів vibe coding — ні.

Передові лабораторії також відчувають тиск, хоча й з іншого боку. Cursor і xAI тепер обидва знаходяться всередині SpaceX. Claude Code перейшов від API до продукту. Лабораторії рухаються вниз по стеку на територію додатків у той самий момент, коли компанії у сфері застосунків рухаються вгору по стеку на територію моделей. Вони зустрінуться посередині, і там буде тісно.

Юзеровічі навів застережливий приклад: юридичний стартап Harvey, за повідомленнями, відмовився від планів навчати власну модель. Тренування — жорстока справа. Не кожна прикладна компанія, яка оголошує «ми будуємо власну модель», випустить таку, що перевершить результати моделей класу GPT у своєму випадку використання. Деякі тихо згорнуть зусилля назад до оркестрації сторонніх моделей і сподіватимуться, що ніхто не помітить.

Wix — цікавий випадок. Компанія, яка скорочує 20% персоналу, потребує, щоб її придбаний двигун зростання забезпечив структурно кращу маржу, а не лише зростання виручки. Рада директорів майже напевно дивиться на Base1 як на важіль, що задній числом виправдовує чек на $80 мільйонів. Тиск на команду Шломо щодо перетворення Base1 на покращення валової маржі у встановлені строки буде величезним.

Корпоративні клієнти, нарешті, є тихими переможцями. Вони становлять меншість користувачів платформ vibe coding, але зростаючу частку виручки, і саме вони вимагають інфраструктури контролю витрат, яка зараз будується в їхніх інтересах. Вони отримують дешевший інференс і кращу маршрутизацію, не будуючи це самостійно.

Стратегія для AI-розробки

Для лідерів платформ і CTO, які спостерігають за розгортанням подій, — кілька практичних кроків на наступний квартал.

Почніть вимірювати витрати на інференс у розрізі когорт користувачів якнайшвидше. Ви не можете побудувати аргумент «будувати або купувати» щодо власної моделі, якщо не знаєте точно, де концентруються витрати на токени. Якщо 80% витрат на інференс припадає на 20% патернів промптів, саме цей 20% виправдовує невелику спеціалізовану модель.

Ставтеся до даних взаємодії користувачів як до активу балансу, а не як до артефакту логування. Причина, через яку Base44 взагалі могла задумати Base1, полягає в тому, що вони фіксували структуровані результати у масштабі. Приведіть у порядок контракти на дані, політики зберігання та процедури отримання згоди просто зараз. Моделі, навчені на дозволених, високоінформативних даних, перевершать моделі, навчені на зібраному мотлосі, у вузьких завданнях.

Не ототожнюйте «навчати власну модель» із «відмовитися від передових лабораторій». Точка зору Юзеровічі щодо оркестрації — правильне прочитання ситуації. Архітектура-переможець, мабуть, — це невелика спеціалізована модель, яка дешево обробляє 70% запитів, із зверненнями до передових моделей для складних 30%. Спочатку побудуйте маршрутизатор. Власна модель може прийти пізніше або не прийти взагалі — залежно від того, що скажуть дані.

Для експериментів із відкритими вагами екосистема Hugging Face залишається найдешевшим місцем для прототипування підходів до дотренування перед початком повного тренувального запуску. Більшість команд повинні тестувати LoRA-адаптери на відкритих моделях задовго до того, як розглядати зусилля масштабу Base1.

Ключові висновки

Base44 запустила Base1 — власну LLM, навчену на десятках мільйонів взаємодій із платформою, позиціонуючи себе як єдиний вертикально інтегрований додаток для vibe coding.
Економічне обґрунтування спирається на контроль витрат на інференс і розширення маржі з часом, а не на негайну економію; Wix потребує, щоб це спрацювало, з огляду на скорочення 20% персоналу.
ARR Lovable у $500 мільйонів на зовнішніх LLM доводить, що стратегія «орендувати модель» все ще масштабується, тож вертикальна ставка Base44 є нестандартною, а не загальновизнаною відповіддю.
Передові лабораторії, що рухаються вниз по стеку (Claude Code, xAI, Cursor), і прикладні компанії, що рухаються вгору, зіткнуться посередині шару застосунків упродовж дванадцяти місяців.
Більшість команд повинні будувати оркестрацію та маршрутизацію перед тим, як будувати моделі; провалена спроба тренування Harvey — застережлива версія цієї історії.

Повернімося до млина. Власник італійського ресторану з власним млином або робить найкращу пасту в місті, або тихо продає млин за два роки й повертається до оптовика. Base44 купила млин. Тепер їм потрібно довести, що паста справді краща, і що клієнти відчують різницю за ціною, яку готові платити. Категорія vibe coding щойно стала набагато цікавішою для спостереження.

Часті запитання

Q: Що таке Base1 і чому Base44 її створила?

Base1 — це власна велика мовна модель Base44, навчена на десятках мільйонів реальних взаємодій користувачів із платформою vibe coding. Засновник Маор Шломо стверджує, що володіння моделлю дає компанії більший контроль над затримкою, витратами та ефективністю, з метою з часом перевершити передові моделі саме у завданнях зі створення застосунків.

Q: Як Base44 порівнюється з Lovable?

Lovable досягла $500 мільйонів ARR на початку цього місяця, продовжуючи використовувати зовнішні LLM, тоді як Base44 кілька місяців тому перетнула позначку $100 мільйонів ARR і тепер навчає власну модель. Вони представляють дві різні ставки: Lovable — на масштаб через орендований інтелект, Base44 — на вертикальну інтеграцію та контроль маржі.

Q: Чи варто іншим AI-стартапам навчати власні моделі?

Мабуть, ще ні. Джонатан Юзеровічі з Headline навів Harvey як приклад стартапу, який відмовився від власних планів навчання, і більшість команд не мають ані потрібного масштабу даних, ані інженерної глибини, щоб це виправдати. Побудова оркестрації для маршрутизації між передовими моделями зазвичай є першим кроком із вищим ROI.

James O'Brien

RiverCore Analyst · Dublin, Ireland

// RELATED ARTICLES

Відтік мізків із DeepMind: Shazeer і Jumper пішли за 48 годин

Двоє ключових дослідників Google DeepMind пішли за 48 годин. Акції впали на 5%. Що насправді означає цей відтік для інженерних команд?

OpenAI та Broadcom створили інференс-чип Jalapeño за 9 місяців

OpenAI та Broadcom представили Jalapeño — LLM-інференс ASIC, розроблений за дев'ять місяців і призначений для гігаватного розгортання разом із Microsoft до кінця 2026 року.

FIS переводить Enterprise Risk Suite на AWS за моделлю CI/CD

FIS перевела Enterprise Risk Suite на AWS із CI/CD-оновленнями та burst-обчисленнями. Головне — як це змінює бюджети банківських платформ і роботу з вендорами.