Skip to content
RiverCore
Dremio получает награду Data Breakthrough на фоне роста ставок на Iceberg
Dremio data analyticsApache Icebergwarehouse contractsDremio Iceberg analytics platform 2026data analytics solution of the year award

Dremio получает награду Data Breakthrough на фоне роста ставок на Iceberg

18 апр 20267 мин. чтенияMarina Koval

На этой неделе Dremio получил очередную награду — само по себе это повод для пресс-релиза. Но для руководителей платформенных команд важен контекст: это уже третья победа компании в номинации «Решение года в области аналитики данных» по версии Data Breakthrough, и она приходится именно на тот момент, когда финансовые директора рассматривают продление многолетних контрактов с хранилищами данных на рынке, где Apache Iceberg стал стандартом разговора о хранении. Если вы сейчас планируете крупный аналитический переход стоимостью в десятки миллионов рублей на ближайшие 90 дней, эта награда — сигнал о движении рынка, а не маркетинговая сноска.

Мой вывод: интересна не сама награда. Интересно то, что Dremio теперь публично позиционируется как «Agentic Lakehouse» — это конкретное техническое и коммерческое заявление, и вашему архитектурному комитету нужно занять позицию по этому вопросу до начала следующего цикла закупок.

Что произошло

17 апреля 2026 года, как сообщает FinancialContent, компания Dremio из Санта-Клары была названа лучшим решением для аналитики данных в рамках 7-й ежегодной премии Data Breakthrough Awards — независимой программы рыночной аналитики, в этом году получившей более 3 500 номинаций. Это третья победа Dremio в одной и той же категории — после 2020 и 2024 годов, что является редкой закономерностью. Большинство аналитических вендоров либо побеждают однажды и уступают место другим, либо выпадают из подобных программ по мере устаревания своей истории. Dremio продолжает появляться — и каждый раз под немного другим флагом.

В 2020 году ставка делалась на ускорение запросов к озёрам данных. В 2024-м — на открытый lakehouse. В 2026-м используется термин «Agentic Lakehouse», построенный нативно на Apache Iceberg, а Dremio позиционирует себя как сооснователь Apache Polaris и Apache Arrow. Продуктовые заявления теперь включают Text-to-SQL, метаданные, генерируемые ИИ, контроль доступа на уровне строк и столбцов, а также универсальный семантический слой, работающий с Tableau и Power BI без промежуточного инструмента моделирования.

Рахим Бходжани, директор по продукту Dremio, описал платформу как «единственную платформу данных, созданную для агентов и управляемую агентами», обещая «самый быстрый путь к доверенному ИИ через унифицированные данные, необходимый контекст и сквозное управление при минимальных затратах». Среди подтверждённых клиентских результатов — ускорение выполнения запросов в 10 раз и сокращение времени завершения проектов на 90% по данным Amazon, а также именной список корпоративных клиентов, включающий Maersk, Regeneron, NetApp и S&P Global. Такой список клиентов красноречиво говорит о том, кто уже делает ставку на эту архитектуру.

Техническая анатомия

Если отбросить маркетинг, стек, который продаёт Dremio, держится на трёх опорных элементах, каждый из которых соответствует конкретному вопросу «строить или покупать» в вашем плане развития.

Первое — хранение данных. Dremio твёрдо придерживается Apache Iceberg как нативного табличного формата, а не одного из нескольких поддерживаемых вариантов. Это важно, потому что Iceberg фактически выиграл войну открытых табличных форматов за последние 18 месяцев: Snowflake, Databricks и все крупные облачные хранилища либо поддерживают его, либо спешат это сделать. Если вы недавно читали документацию Snowflake или Databricks по внешним таблицам, вы видели одно и то же: совместимость с Iceberg стала обязательным минимумом. Ставка Dremio заключается в том, что благодаря нативной поддержке Iceberg (плюс совместное управление Apache Polaris как каталогом) компания находится ближе к открытому субстрату, чем вендоры-лидеры, чья экономика по-прежнему зависит от проприетарного хранилища.

Второе — запросы и семантический слой. Dremio предлагает запросы к данным по месту их хранения — в облачных озёрах и локальных системах — без ETL-пайплайнов и копий данных. Универсальный семантический слой становится единой поверхностью для Tableau, Power BI и, в новой версии позиционирования, ИИ-агентов. Именно здесь платформа напрямую конкурирует со слоем моделирования, который команды обычно строят в dbt. Коммерческий вопрос: вы хотите, чтобы семантические определения находились внутри инструмента трансформации, внутри хранилища или внутри платформы Dremio? Каждый выбор предполагает разную степень привязки к вендору и разные последствия для найма.

Третье — агентный слой. Text-to-SQL и метаданные, генерируемые ИИ, сами по себе не являются новыми функциями. Отличие — в их объединении с детализированным контролем доступа на уровне строк и столбцов, так что агент, действующий от имени пользователя, наследует права этого пользователя в момент выполнения запроса. Именно этот элемент стоит за формулировкой «управляемый агентами», и именно о нём корпоративным юристам стоит беспокоиться больше, чем кому-либо другому в компании.

Кто пострадает

Три группы воспримут это объявление по-разному, и ближайшие 90 дней для каждой из них будут выглядеть иначе.

Вендоры хранилищ-лидеров с проприетарной экономикой хранения — очевидная точка давления. Когда весомый конкурент говорит «никаких копий данных, никаких проприетарных плат за хранение, запросы там, где живут данные» и имеет ссылку на Amazon с результатами 10x по производительности и 90% ускорения сдачи проектов, разговоры о продлении контрактов становятся труднее. Ваш финансовый директор это заметит. Ожидайте агрессивных скидок на многолетние продления от крупных хранилищ до конца 2026 года, особенно там, где миграция на Iceberg уже входит в план.

Внутренние платформенные команды, стандартизировавшиеся на закрытом хранилище плюс нестандартный семантический слой, — вторая группа. Если ваше архитектурное решение 2024 года исходило из предположения, что война форматов хранения затянется, это предположение плохо состарилось. Теперь вам придётся объяснять совету директоров, читающему об «Agentic Lakehouse» в отраслевой прессе, почему ваш стек по-прежнему требует ETL-переходов и копий данных для BI и AI-нагрузок. Это не самый приятный ежеквартальный отчёт.

Третья группа более неочевидна: рынок найма в области инженерии данных. Если агентные платформы действительно обеспечат Text-to-SQL и метаданные от ИИ в корпоративном масштабе, роль младшего аналитика, чей рабочий день уходит на перевод бизнес-вопросов в SQL, начнёт сжиматься. Старшие роли — те, кто проектирует семантические модели, обеспечивает управление данными и владеет каталогом Iceberg, — станут ценнее и труднее для найма. Команды, сделавшие избыточную ставку на специалистов по пайплайнам в ущерб платформенным архитекторам, почувствуют это в течение двух кварталов.

Вопрос, который каждый руководитель платформы должен поставить перед своим юристом и вице-президентом по инжинирингу на этой неделе, прост: если ИИ-агент выполняет запрос через наш семантический слой от имени отозванного пользователя, где именно происходит проверка доступа и можем ли мы это доказать на аудите? Если честный ответ — «нам нужно проверить», это проблема ближайших 90 дней, а не 2027 года.

Инструкция для команд по работе с данными

Несколько конкретных шагов, которые стоит предпринять до закрытия следующего бюджетного цикла.

Зафиксируйте позицию по Iceberg письменно. Не в виде слайда — в виде позиции. Какой каталог (Polaris, Unity, Glue, Nessie), кто за него отвечает и как выглядит миграционный путь с вашего текущего табличного формата. Вендоры движутся быстрее, чем большинство внутренних архитектурных документов, а возможности для торга испаряются в момент подписания очередного трёхлетнего контракта с хранилищем без этой ясности.

Оцените заявление «без ETL» применительно к вашей реальной нагрузке. Цифры Amazon — 10x по производительности запросов и 90% ускорения завершения проектов — это реальные данные, но это нагрузка Amazon, а не ваша. Проведите ограниченное подтверждение концепции на двух ваших самых дорогих пайплайнах, измерьте сквозные затраты с учётом egress и вычислений и добейтесь от вендора письменных обязательств по юнит-экономике.

Проведите аудит владения семантическим слоем. Если ваши BI-инструменты и зарождающиеся ИИ-агенты будут использовать общий семантический слой, решите сейчас, где он будет жить — в инструменте трансформации, в хранилище или на выделенной платформе. Разделить его между тремя системами — худший вариант, и именно он возникает по умолчанию, если никто не принимает решения.

Наконец, рассматривайте запросы, инициируемые агентами, как отдельную категорию управления. Контроль доступа на уровне строк и столбцов необходим, но недостаточен. Вам также нужна атрибуция в момент запроса: какой агент, действующий от имени какого пользователя, по какой политике. Если ваш текущий стек не может на это ответить, это требование к платформе на 2026 год, а не опциональная функция.

Ключевые выводы

  • Третья победа Dremio в номинации «Решение года в области аналитики данных» (2020, 2024, 2026) свидетельствует об устойчивой актуальности, а не разовом успехе, и выводит Iceberg-нативную архитектуру в обязательный шортлист каждого серьёзного проекта 2026 года.
  • Концепция «Agentic Lakehouse» объединяет Text-to-SQL, метаданные от ИИ и контроль доступа на уровне строк/столбцов в единую поверхность управления, что меняет подход юристов и вице-президентов по инжинирингу к оценке рисков ИИ.
  • Клиентские результаты, такие как 10x ускорение запросов и 90% сокращение времени проектов у Amazon, — полезные ориентиры, но обосновать закупочное решение может только ограниченный внутренний POC.
  • Вендоры хранилищ с проприетарной экономикой хранения столкнутся с давлением при продлении контрактов в течение 2026 года; используйте это до подписания многолетних сделок.
  • Владение семантическим слоем — архитектурное решение года. Выберите одно место для него, задокументируйте это решение и наймите платформенных архитекторов, способных его отстоять.

Командам, оценивающим аналитические платформы в этом квартале, стоит перестать спрашивать, у какого вендора лучшие бенчмарки, и начать спрашивать, чья коммерческая модель по-прежнему имеет смысл, когда к 2027 году агенты, а не люди, будут составлять 40% запросов.

Часто задаваемые вопросы

В: Что такое «Agentic Lakehouse» и почему это важно для аналитических команд?

Это концепция Dremio для платформы типа lakehouse, спроектированной как для выполнения запросов от ИИ-агентов, так и для оперативного управления ими, объединяющей Iceberg-нативное хранение, универсальный семантический слой и детализированный контроль доступа. Для аналитических команд это важно, поскольку стирает границу управления между людьми-пользователями BI и ИИ-агентами, сводя её к единой политике — именно там будет сосредоточена большая часть аудиторских рисков в 2026 году.

В: Как Iceberg-нативный подход Dremio сравнивается со Snowflake или Databricks?

Snowflake и Databricks оба поддерживают Apache Iceberg как внешний формат, однако их коммерческие модели по-прежнему опираются на проприетарное хранение и вычислительные пакеты. Dremio позиционирует Iceberg как нативный табличный формат и является сооснователем Apache Polaris (каталога) и Apache Arrow, что означает меньшую архитектурную дистанцию между открытым субстратом и платформой. Компромисс — зрелость экосистемы и широта управляемых сервисов вокруг каждого варианта.

В: Стоит ли нам мигрировать с текущего хранилища на основании этой новости?

Нет, награды не движут миграциями. Что должна спровоцировать эта новость — это письменная позиция по Iceberg, ограниченный POC на двух самых дорогих нагрузках и внимательное изучение условий предстоящего продления контракта с хранилищем. Миграция оправдана только тогда, когда юнит-экономика и модель управления явно лучше на ваших реальных данных, а не на данных референсного клиента.

MK
Marina Koval
RiverCore Analyst · Dublin, Ireland
ПОДЕЛИТЬСЯ
// RELATED ARTICLES
ГлавнаяРешенияПроектыО насКонтакт
Новости06
Дублин, Ирландия · ЕСGMT+1
LinkedIn
🇷🇺RU