Fivetran и dbt Labs завершили слияние ради данных для агентного ИИ
Любой, кто хоть раз проводил воскресный вечер, разбираясь со сломанным ELT-пайплайном, знает: у современного стека данных две несущие стены — инgest и трансформация. С 5 июня обе стены принадлежат одному владельцу. Fivetran и dbt Labs закрыли сделку по слиянию на основе обмена акциями — спустя восемь месяцев после объявления — и теперь претендуют на роль дефолтного субстрата для ИИ-агентов, которые реально работают с продакшн-данными.
Что произошло
Сделка была впервые озвучена в октябре 2025 года и, как сообщил Pulse 2.0, закрыта 5 июня 2026 года как сделка на основе обмена акциями. Объединённая компания будет работать под названием Fivetran + dbt Labs. Джордж Фрейзер остаётся CEO. Тристан Хэнди занимает должность президента. Оба сохраняют статус сооснователей в новой оргструктуре.
Суть предложения проста: Fivetran отвечает за перемещение и синхронизацию данных, dbt — за трансформацию, управление и семантическое моделирование, а вместе они заявляют о более чем 100 000 командах по работе с данными в качестве клиентов по всему миру. Это серьёзный барьер для входа. В первый же день компания также представила продуктовую линейку, которая показывает, куда направлена инженерная энергия.
Главные анонсы: альфа-релиз dbt Core v2.0, который открывает исходный код рантайма dbt Fusion под лицензией Apache 2.0. Новый слой кэширования dbt State, который пересобирает только изменённые ассеты, чтобы снизить расходы на инфраструктуру. dbt Wizard — ИИ-ассистент для создания, отладки и рефакторинга моделей. И Agents Schema — open-source стандарт, который хранит семантические модели, метрики, линедж и бизнес-документацию в SQL-таблицах, доступных для запросов ИИ-агентов, при этом оставаясь совместимым с существующими системами управления.
Среди упомянутых референс-клиентов — Zendesk, Inova Health, Tinuiti, Shutterstock и DocuSign. Роадшоу стартует на Snowflake Summit 2026, где совместная платформа получит свою первую большую сцену. Фрейзер сформулировал ставку прямо: «Следующее поколение корпоративного ИИ будет определяться качеством и надёжностью лежащих в основе данных». Хэнди был ещё конкретнее: доверие строится на уровне инфраструктуры, на открытых стандартах.
Техническая анатомия
Если отбросить пресс-релизный язык, остаются четыре инженерных шага, заслуживающих разбора.
Первый — лицензирование рантайма dbt Fusion под Apache 2.0 в dbt Core v2.0. Fusion — это переписанный на Rust движок, который dbt Labs представила на замену Python-парсеру, и выпуск рантайма под Apache 2.0 имеет значение. Это означает, что облачные провайдеры и конкуренты могут строить на его основе без лицензионных отчислений, но и сама dbt не сможет позже провернуть смену лицензии в стиле Redis или Elastic. Это сигнал доверия для платформенных инженеров, которых уже обжигала смена позиции «source-available»-вендоров. Все, кто оценивает долгосрочные обязательства, должны прочитать актуальную документацию dbt по Fusion, прежде чем считать, что open-source позиция распространяется на каждый компонент.
Второй — dbt State как слой кэширования. Сборка только изменённых ассетов — не новая идея: кто настраивал --defer и сравнение состояний, тот знаком с паттерном. Интересна именно продуктизация этого подхода как полноценного слоя кэширования. На крупных dbt-проектах полные пересборки могут доминировать в расходах на склад. Если State выполнит обещанное, экономия появится непосредственно в счетах Snowflake или BigQuery.
Третий — Agents Schema. Это стратегически наиболее нагруженный элемент. Стандартизируя хранение семантических моделей, метрик и линеджа в SQL-таблицах, dbt пытается занять контекстный слой, который ИИ-агенты читают перед тем, как действовать. Тот же инстинкт, что двигал исходным push'ем семантического слоя, только перенацеленный с BI-дашбордов на LLM-потребителей.
Четвёртый — позиционирование как cloud-agnostic платформы. Объединённая платформа маркетируется как построенная на открытых стандартах без vendor lock-in. Моя оценка: это прямой выпад в сторону Databricks и Snowflake, оба из которых в гонке за то, чтобы закрепить собственные семантические слои с закрытыми садами. Fivetran + dbt делают ставку на то, что платформенные инженеры предпочтут владеть абстракцией, а не арендовать её у вендора склада данных.
Кто пострадает
Начнём с очевидной мишени: каждый «AI-native data platform» стартап серии B, который за последние 18 месяцев продавал историю об объединённом ingest-плюс-трансформация. Их TAM только что сжался — давлением вендора со 100 000 существующих дата-команд. Циклы продаж, и без того жестокие, становятся ещё хуже, когда incumbент выпускает ту же фичу бесплатно под Apache 2.0.
Далее — вендоры оркестрации, сидящие между ingest и transform. Если dbt Wizard расширится от авторинга до рантайм-оркестрации, а Agents Schema станет де-факто стандартом контекста, пространство для самостоятельных вендоров метаданных и каталогов сужается. Производственные инциденты на пересекающихся инструментах, которые я видел, всегда восходят к одной первопричине: слишком много систем претендуют на владение линеджем, ни одна из них не является авторитетной. Объединённый Fivetran + dbt получает право претендовать на эту авторитетность по умолчанию.
Для платформенных команд в iGaming и финтехе риски иные. Эти вертикали гоняют тяжёлые регуляторные отчётные нагрузки поверх dbt-проектов, нередко с кастомным ingest. Слияние означает, что один вендорский контракт теперь охватывает две прежде независимые договорные поверхности. Закупочная активность снижается. Давление на цену при продлении растёт. Команды, с которыми я работал, всегда недооценивали, насколько быстро вендор консолидирует ценообразование после закрытия сделки.
Неудобная читка: клиенты dbt Cloud, платящие за hosted-трансформацию, теперь делят роадмап с коннекторным бизнесом Fivetran, а MAR-based pricing Fivetran исторически была самой нелюбимой строкой в счёте современного стека данных. Если эти две модели ценообразования сойдутся в любом направлении, чей-то бюджет сломается. Senior-инженерам стоит исходить из того, что следующий цикл продления будет включать бандловый SKU, и начать моделировать это уже сейчас.
Snowflake и Databricks наблюдают с осторожного расстояния. Они выигрывают от более дешёвых и качественных трансформаций, генерирующих больше вычислений. Они проигрывают, если Agents Schema станет переносимым контекстным слоем, позволяющим клиентам перемещать нагрузки между складами без переписывания семантики.
Playbook для дата-команд
Конкретные действия на эту неделю, а не на следующий квартал.
Если ваша команда использует dbt Core в продакшне — не прыгайте на v2.0 alpha на всём, что может разбудить кого-то в 2 ночи. Поднимите параллельную CI-среду, прогоните существующий проект против рантайма Fusion и сравните время компиляции и выполнения с текущей конфигурацией. Альфы — это альфы. Реальная новость здесь — лицензия Apache 2.0, а не готовность к продакшну.
Если вы на dbt Cloud — выгрузите счета за последние двенадцать месяцев и тренд Fivetran MAR в одну таблицу. Смоделируйте, как выглядит бандловый контракт при продлении. Этот показатель нужен вам до того, как аккаунт-менеджер принесёт его вам, а не после.
Если вы строите агентные воркфлоу поверх Snowflake или любого склада данных — оцените Agents Schema как контекстный стандарт до того, как зафиксируетесь на проприетарном семантическом слое. Стоимость переключения контекстных слоёв после того, как агенты запущены в продакшн, огромна. Выбирайте абстракцию, которая переживёт смену вендора.
Для платформенных лидов в регулируемых вертикалях: задокументируйте, какие governance-контроли сейчас живут в Fivetran, а какие — в dbt. После слияния эти контроли начнут консолидироваться. Знание состояния «до» — единственный способ аудировать состояние «после».
Наконец, воспринимайте анонсы на Snowflake Summit 2026 как реальный продуктовый релиз. Альфа-релизы показывают намерения. Демо на Summit показывают, что готово к отгрузке.
Ключевые выводы
- Fivetran и dbt Labs закрыли сделку по слиянию на основе обмена акциями 5 июня 2026 года, объединив ingest и трансформацию под одной компанией с более чем 100 000 дата-командами.
- Альфа-версия dbt Core v2.0 открывает исходный код рантайма Fusion под Apache 2.0 — значимое обязательство, ограничивающее возможность смены лицензии в будущем.
- Agents Schema — стратегически ключевой элемент: SQL-нативный контекстный слой для ИИ-агентов, который может стать переносимым стандартом вне контроля вендоров складов данных.
- Ожидайте давления на цены в виде бандлов при продлении. Моделируйте объединённый контракт сейчас, до того как это сделает ваша аккаунт-команда.
- Не запускайте dbt Core v2.0 alpha в продакшне. Проводите бенчмарки в CI, ждите анонсов на Summit 2026, затем планируйте окно миграции.
Часто задаваемые вопросы
В: Что именно закрыло слияние Fivetran и dbt Labs?
Сделка по слиянию на основе обмена акциями, впервые объявленная в октябре 2025 года и завершённая 5 июня 2026 года. Объединённая компания работает под названием Fivetran + dbt Labs: Джордж Фрейзер — CEO, Тристан Хэнди — президент; компания обслуживает более 100 000 дата-команд по всему миру.
В: Что такое Agents Schema и почему это важно?
Agents Schema — open-source стандарт, который хранит семантические модели, метрики, линедж и бизнес-документацию в SQL-таблицах, доступных для чтения ИИ-агентами. Это важно, потому что позиционирует dbt как контекстный слой для агентных воркфлоу вне зависимости от облачного склада данных клиента, оставаясь при этом совместимым с существующими governance-фреймворками.
В: Стоит ли командам немедленно обновляться до dbt Core v2.0?
Нет. Релиз v2.0 является альфа-версией, открывающей исходный код рантайма Fusion под Apache 2.0. Изменение лицензии значимо, однако продакшн-командам следует сначала провести бенчмарк Fusion в параллельной CI-среде и дождаться стабильных релизов перед миграцией критических пайплайнов.
Война агентных клиентов: кто владеет бэкендом ИИ
Snowflake переименовал Intelligence в CoWork, Databricks выпустил Genie, а разработчики моделей наступают. Настоящая борьба — за корпоративный бэкенд.
dltHub получает награду Snowflake «Партнёр года» 2026
dltHub получил награду Snowflake «Партнёр года» 2026. Ключевая цифра: 91% из 81 000 новых пайплайнов в месяц создаются AI-агентами — рост в 34 раза за год.
SoFi подтверждает утечку данных через стороннего поставщика в Гонконге
SoFi Гонконг обнаружила утечку данных через стороннего поставщика 30 апреля 2026 года. Поставщик не назван, масштаб неизвестен, клиенты ждут ответов.




