Skip to content
RiverCore
Base44 обучает собственную модель на фоне борьбы за защитные барьеры в vibe coding
vibe coding modelBase44Base1 LLMBase44 Base1 in-house language modelvibe coding vertical integration strategy

Base44 обучает собственную модель на фоне борьбы за защитные барьеры в vibe coding

30 июн 20267 мин. чтенияJames O'Brien

Представьте итальянский ресторан, который годами закупал пасту оптом, а однажды утром хозяин приехал с мельницей в фургоне. Примерно то же самое Base44 только что сделала со своей цепочкой поставок. Тель-авивская платформа vibe coding перестала арендовать передовой интеллект за токены и начала «молоть муку» самостоятельно.

Модель называется Base1, и ставка за ней проста: когда владеешь мельницей — контролируешь маржу. Насколько эта ставка оправдается — вот что действительно интересно для всех, кто сегодня строит продукты на базе OpenAI, Anthropic или Google.

Что произошло

Base44, которую Wix приобрела примерно год назад за $80 млн, когда компании было едва полгода и в команде работало восемь человек, начала разворачивать собственную большую языковую модель. По данным TechCrunch, модель получила название Base1 и была обучена на датасете, сформированном из десятков миллионов реальных пользовательских взаимодействий на платформе.

Основатель Маор Шломо позиционирует это как ход в сторону вертикальной интеграции. В беседе с журналистами он заявил, что «обучение модели и владение ею как частью всего стека даёт нам значительно больше возможностей для оптимизации задержки, стоимости и эффективности». Компания теперь называет себя «единственным вертикально интегрированным vibe-coding приложением».

Финансовый контекст здесь важен. Несколько месяцев назад Base44 перешагнула отметку $100 млн ARR, а штат продолжает расти с момента поглощения Wix. Этот рост выглядит неловко на фоне материнской компании, которая недавно объявила о сокращении 20% сотрудников. Base44 — работающий актив, и Wix нужно, чтобы он работал ещё интенсивнее.

Главный конкурент, которого все упоминают, — Lovable, шведский стартап, достигший статуса единорога в рамках Series A прошлым летом и перешедший отметку $500 млн ARR в начале этого месяца, по-прежнему опираясь на внешние LLM. Lovable крупнее. Base44 идёт глубже. Это два принципиально разных подхода, и ближайшие двенадцать месяцев покажут, какой из них лучше выдержит проверку временем.

Шломо также ожидает, что другие последуют за ними — по крайней мере те игроки, у которых достаточно масштаба и динамики, чтобы накопить значимые обучающие данные. Так что Base1 — это не столько флаг, воткнутый в землю, сколько первый ход в новой фазе развития категории.

Техническая анатомия

Суть вопроса: когда вы строите на Claude Opus или моделях класса GPT, каждый пользовательский промпт — это платный API-вызов. Маржу съедают затраты на инференс, которые вы не контролируете, задержка, которую вы не можете настроить, и дорожная карта, продиктованная тем фронтирным лабом, на который вы поставили. Каждый, кто наблюдал, как счёт за инференс растёт быстрее MRR, знает это ощущение.

Владение Base1 меняет юнит-экономику в трёх местах. Во-первых, инференс переходит от переменных затрат на сторонние сервисы к управляемым внутренним вычислениям. Формулировка в собственном пресс-релизе Base44 показательна: «владение моделью даёт Base44 прямой контроль над затратами на вычисления и инференс, что со временем должно привести к структурно более высокому профилю маржи». Обратите внимание на «со временем». Это не победа первого дня.

Во-вторых, обучающие данные — это ров. Десятки миллионов реальных пользовательских взаимодействий на платформе vibe coding — это именно тот узкий, высокосигнальный датасет, который может эксплуатировать специализированная модель и который сложно воспроизвести общей модели. Фронтирные лабы, такие как Anthropic, чей инструментарий Claude сам стал игроком в vibe coding, обладают широтой охвата, но не той же плотностью циклов обратной связи «пользователь хотел X, получил Y, отредактировал до Z» применительно к генерации приложений.

В-третьих, задержка и маршрутизация. Контролируя модель, можно выполнять скучную, но ценную работу: квантизировать для скорости, дообучать под свои форматы вывода, направлять простые промпты в Base1, а сложные — в Opus. Джонатан Юзеровичи из Headline точно сформулировал: корпоративные клиенты сейчас строят «целую инфраструктуру» для оркестрации и оптимизации, чтобы «затраты не взлетали, сохраняя при этом одинаковую или схожую производительность в большинстве сценариев использования».

Слабое место — стоимость обучения и кадры. Сам Шломо назвал Base1 «огромным инженерным усилием», и это честно. Команда, которая год назад насчитывала восемь человек, теперь занимается прикладными ML-исследованиями. Именно это не отражается в пресс-релизе.

Кто пострадает

Наиболее уязвимая группа — прикладные AI-стартапы, единственная дифференциация которых сводится к хитрому шаблону промптов, обёрнутому вокруг чужой модели. Если Base44 права в том, что масштаб плюс динамика равны достаточному объёму данных для обучения специализированной модели, то все, кто ниже этого порога, в опасности. У Lovable с пятикратным ARR данные есть. У тысячи более мелких клонов vibe coding — нет.

Фронтирные лабы тоже ощущают давление, хотя с другой стороны. Cursor и xAI теперь оба находятся внутри SpaceX. Claude Code превратился из API в продукт. Лабы движутся вниз по стеку в область приложений в тот же момент, когда компании, создающие приложения, движутся вверх по стеку в область моделей. Они встретятся посередине, и середина будет переполнена.

Юзеровичи привёл поучительный пример: юридический стартап Harvey, по имеющимся данным, отказался от планов обучить собственную модель. Обучение — жестокий процесс. Не каждая прикладная компания, объявившая «мы строим свою модель», выпустит её, и эта модель не обязательно превзойдёт по своему сценарию использования результаты моделей класса GPT. Некоторые тихо свернут усилия обратно в оркестрацию сторонних моделей в надежде, что этого никто не заметит.

Wix — интересный случай. Компания, сокращающая 20% персонала, нуждается в том, чтобы приобретённый двигатель роста обеспечивал структурно лучшую маржу, а не только выручку. Совет директоров почти наверняка смотрит на Base1 как на рычаг, который ретроспективно оправдает чек на $80 млн. Давление на команду Шломо с требованием перевести Base1 в улучшение валовой маржи в срок будет колоссальным.

Корпоративные покупатели, наконец, — тихие победители. Они составляют меньшинство пользователей платформ vibe coding, но растущую долю выручки, и именно они требуют инфраструктуры контроля затрат, которая сейчас строится в их интересах. Они получают более дешёвый инференс и лучшую маршрутизацию, не строя это самостоятельно.

Руководство для AI-разработки

Для руководителей платформ и CTO, наблюдающих за этим развитием, — несколько практических шагов на ближайший квартал.

Начните инструментировать затраты на инференс по когортам пользователей прямо сейчас. Невозможно построить аргумент «строить или покупать» для кастомной модели, не зная точно, где концентрируются расходы на токены. Если 80% затрат на инференс приходится на 20% паттернов промптов, именно эти 20% — то место, где небольшая специализированная модель оправдывает себя.

Относитесь к данным о взаимодействии пользователей как к активу на балансе, а не к артефакту логирования. Причина, по которой Base44 вообще могла задуматься о Base1, — они фиксировали структурированные результаты в масштабе. Приведите в порядок контракты на данные, политики хранения и потоки согласия. Модели, обученные на разрешённых, высокосигнальных данных, превзойдут модели, обученные на скраппинге, в узких задачах.

Не путайте «обучить собственную модель» с «отказаться от фронтирных лабов». Замечание Юзеровичи об оркестрации — правильный вывод. Выигрышная архитектура — вероятно, небольшая специализированная модель, обрабатывающая 70% запросов дёшево, с обращением к фронтирным моделям для сложных 30%. Сначала постройте маршрутизатор. Кастомная модель может прийти позже — или не прийти вообще, в зависимости от того, что скажут данные.

Для экспериментов с открытыми весами экосистема Hugging Face остаётся самым дешёвым местом для прототипирования подходов к дообучению перед тем, как браться за полный цикл обучения. Большинству команд следует тестировать LoRA-адаптеры на открытых моделях задолго до того, как рассматривать усилие масштаба Base1.

Ключевые выводы

  • Base44 запустила Base1 — собственную LLM, обученную на десятках миллионов взаимодействий на платформе, позиционируя себя как единственное вертикально интегрированное vibe coding приложение.
  • Экономическое обоснование строится на контроле затрат на инференс и расширении маржи со временем, а не на немедленной экономии; Wix нуждается в том, чтобы это работало, учитывая сокращение 20% персонала.
  • $500 млн ARR Lovable на внешних LLM доказывают, что стратегия аренды моделей по-прежнему масштабируется, так что вертикальная ставка Base44 — контрарианская, а не очевидная.
  • Фронтирные лабы, движущиеся вниз по стеку (Claude Code, xAI, Cursor), и прикладные компании, движущиеся вверх, столкнутся на уровне прикладного слоя в течение двенадцати месяцев.
  • Большинству команд следует строить оркестрацию и маршрутизацию прежде, чем браться за обучение моделей; провальный опыт обучения Harvey — поучительный пример этой истории.

Возвращаясь к мельнице. Владелец итальянского ресторана с собственной мельницей либо делает лучшую пасту в городе, либо тихо продаёт мельницу на Gumtree через два года и возвращается к оптовику. Base44 купила мельницу. Теперь им нужно доказать, что паста действительно лучше, и что клиенты ощущают разницу по цене, которую готовы платить. Категория vibe coding только что стала значительно интереснее для наблюдения.

Часто задаваемые вопросы

В: Что такое Base1 и зачем Base44 её создала?

Base1 — собственная большая языковая модель Base44, обученная на десятках миллионов реальных пользовательских взаимодействий на её платформе vibe coding. Основатель Маор Шломо говорит, что владение моделью даёт компании больше контроля над задержкой, стоимостью и эффективностью с целью в конечном итоге превзойти фронтирные модели в задачах создания приложений.

В: Как Base44 соотносится с Lovable?

Lovable достигла $500 млн ARR в начале этого месяца, по-прежнему опираясь на внешние LLM, тогда как Base44 несколько месяцев назад перешагнула отметку $100 млн ARR и теперь обучает собственную модель. Они представляют два разных подхода: Lovable — на масштаб через арендованный интеллект, Base44 — на вертикальную интеграцию и контроль маржи.

В: Стоит ли другим AI-стартапам обучать собственные модели?

Вероятно, пока нет. Джонатан Юзеровичи из Headline привёл Harvey как пример стартапа, отказавшегося от собственных планов по обучению, и большинству команд не хватает масштаба данных или инженерной глубины для этого. Построение оркестрации для маршрутизации между фронтирными моделями, как правило, является более приоритетным первым шагом с точки зрения ROI.

JO
James O'Brien
RiverCore Analyst · Dublin, Ireland
ПОДЕЛИТЬСЯ
// RELATED ARTICLES
ГлавнаяРешенияПроектыО насКонтакт
Новости06
Дублин, Ирландия · ЕСGMT+1
LinkedIn
🇷🇺RU