Dremio получает награду Data Breakthrough на фоне роста ставок на Iceberg
На этой неделе Dremio получил очередную награду — само по себе это повод для пресс-релиза. Но для руководителей платформенных команд важен контекст: это уже третья победа компании в номинации «Решение года в области аналитики данных» по версии Data Breakthrough, и она приходится именно на тот момент, когда финансовые директора рассматривают продление многолетних контрактов с хранилищами данных на рынке, где Apache Iceberg стал стандартом разговора о хранении. Если вы сейчас планируете крупный аналитический переход стоимостью в десятки миллионов рублей на ближайшие 90 дней, эта награда — сигнал о движении рынка, а не маркетинговая сноска.
Мой вывод: интересна не сама награда. Интересно то, что Dremio теперь публично позиционируется как «Agentic Lakehouse» — это конкретное техническое и коммерческое заявление, и вашему архитектурному комитету нужно занять позицию по этому вопросу до начала следующего цикла закупок.
Что произошло
17 апреля 2026 года, как сообщает FinancialContent, компания Dremio из Санта-Клары была названа лучшим решением для аналитики данных в рамках 7-й ежегодной премии Data Breakthrough Awards — независимой программы рыночной аналитики, в этом году получившей более 3 500 номинаций. Это третья победа Dremio в одной и той же категории — после 2020 и 2024 годов, что является редкой закономерностью. Большинство аналитических вендоров либо побеждают однажды и уступают место другим, либо выпадают из подобных программ по мере устаревания своей истории. Dremio продолжает появляться — и каждый раз под немного другим флагом.
В 2020 году ставка делалась на ускорение запросов к озёрам данных. В 2024-м — на открытый lakehouse. В 2026-м используется термин «Agentic Lakehouse», построенный нативно на Apache Iceberg, а Dremio позиционирует себя как сооснователь Apache Polaris и Apache Arrow. Продуктовые заявления теперь включают Text-to-SQL, метаданные, генерируемые ИИ, контроль доступа на уровне строк и столбцов, а также универсальный семантический слой, работающий с Tableau и Power BI без промежуточного инструмента моделирования.
Рахим Бходжани, директор по продукту Dremio, описал платформу как «единственную платформу данных, созданную для агентов и управляемую агентами», обещая «самый быстрый путь к доверенному ИИ через унифицированные данные, необходимый контекст и сквозное управление при минимальных затратах». Среди подтверждённых клиентских результатов — ускорение выполнения запросов в 10 раз и сокращение времени завершения проектов на 90% по данным Amazon, а также именной список корпоративных клиентов, включающий Maersk, Regeneron, NetApp и S&P Global. Такой список клиентов красноречиво говорит о том, кто уже делает ставку на эту архитектуру.
Техническая анатомия
Если отбросить маркетинг, стек, который продаёт Dremio, держится на трёх опорных элементах, каждый из которых соответствует конкретному вопросу «строить или покупать» в вашем плане развития.
Первое — хранение данных. Dremio твёрдо придерживается Apache Iceberg как нативного табличного формата, а не одного из нескольких поддерживаемых вариантов. Это важно, потому что Iceberg фактически выиграл войну открытых табличных форматов за последние 18 месяцев: Snowflake, Databricks и все крупные облачные хранилища либо поддерживают его, либо спешат это сделать. Если вы недавно читали документацию Snowflake или Databricks по внешним таблицам, вы видели одно и то же: совместимость с Iceberg стала обязательным минимумом. Ставка Dremio заключается в том, что благодаря нативной поддержке Iceberg (плюс совместное управление Apache Polaris как каталогом) компания находится ближе к открытому субстрату, чем вендоры-лидеры, чья экономика по-прежнему зависит от проприетарного хранилища.
Второе — запросы и семантический слой. Dremio предлагает запросы к данным по месту их хранения — в облачных озёрах и локальных системах — без ETL-пайплайнов и копий данных. Универсальный семантический слой становится единой поверхностью для Tableau, Power BI и, в новой версии позиционирования, ИИ-агентов. Именно здесь платформа напрямую конкурирует со слоем моделирования, который команды обычно строят в dbt. Коммерческий вопрос: вы хотите, чтобы семантические определения находились внутри инструмента трансформации, внутри хранилища или внутри платформы Dremio? Каждый выбор предполагает разную степень привязки к вендору и разные последствия для найма.
Третье — агентный слой. Text-to-SQL и метаданные, генерируемые ИИ, сами по себе не являются новыми функциями. Отличие — в их объединении с детализированным контролем доступа на уровне строк и столбцов, так что агент, действующий от имени пользователя, наследует права этого пользователя в момент выполнения запроса. Именно этот элемент стоит за формулировкой «управляемый агентами», и именно о нём корпоративным юристам стоит беспокоиться больше, чем кому-либо другому в компании.
Кто пострадает
Три группы воспримут это объявление по-разному, и ближайшие 90 дней для каждой из них будут выглядеть иначе.
Вендоры хранилищ-лидеров с проприетарной экономикой хранения — очевидная точка давления. Когда весомый конкурент говорит «никаких копий данных, никаких проприетарных плат за хранение, запросы там, где живут данные» и имеет ссылку на Amazon с результатами 10x по производительности и 90% ускорения сдачи проектов, разговоры о продлении контрактов становятся труднее. Ваш финансовый директор это заметит. Ожидайте агрессивных скидок на многолетние продления от крупных хранилищ до конца 2026 года, особенно там, где миграция на Iceberg уже входит в план.
Внутренние платформенные команды, стандартизировавшиеся на закрытом хранилище плюс нестандартный семантический слой, — вторая группа. Если ваше архитектурное решение 2024 года исходило из предположения, что война форматов хранения затянется, это предположение плохо состарилось. Теперь вам придётся объяснять совету директоров, читающему об «Agentic Lakehouse» в отраслевой прессе, почему ваш стек по-прежнему требует ETL-переходов и копий данных для BI и AI-нагрузок. Это не самый приятный ежеквартальный отчёт.
Третья группа более неочевидна: рынок найма в области инженерии данных. Если агентные платформы действительно обеспечат Text-to-SQL и метаданные от ИИ в корпоративном масштабе, роль младшего аналитика, чей рабочий день уходит на перевод бизнес-вопросов в SQL, начнёт сжиматься. Старшие роли — те, кто проектирует семантические модели, обеспечивает управление данными и владеет каталогом Iceberg, — станут ценнее и труднее для найма. Команды, сделавшие избыточную ставку на специалистов по пайплайнам в ущерб платформенным архитекторам, почувствуют это в течение двух кварталов.
Вопрос, который каждый руководитель платформы должен поставить перед своим юристом и вице-президентом по инжинирингу на этой неделе, прост: если ИИ-агент выполняет запрос через наш семантический слой от имени отозванного пользователя, где именно происходит проверка доступа и можем ли мы это доказать на аудите? Если честный ответ — «нам нужно проверить», это проблема ближайших 90 дней, а не 2027 года.
Инструкция для команд по работе с данными
Несколько конкретных шагов, которые стоит предпринять до закрытия следующего бюджетного цикла.
Зафиксируйте позицию по Iceberg письменно. Не в виде слайда — в виде позиции. Какой каталог (Polaris, Unity, Glue, Nessie), кто за него отвечает и как выглядит миграционный путь с вашего текущего табличного формата. Вендоры движутся быстрее, чем большинство внутренних архитектурных документов, а возможности для торга испаряются в момент подписания очередного трёхлетнего контракта с хранилищем без этой ясности.
Оцените заявление «без ETL» применительно к вашей реальной нагрузке. Цифры Amazon — 10x по производительности запросов и 90% ускорения завершения проектов — это реальные данные, но это нагрузка Amazon, а не ваша. Проведите ограниченное подтверждение концепции на двух ваших самых дорогих пайплайнах, измерьте сквозные затраты с учётом egress и вычислений и добейтесь от вендора письменных обязательств по юнит-экономике.
Проведите аудит владения семантическим слоем. Если ваши BI-инструменты и зарождающиеся ИИ-агенты будут использовать общий семантический слой, решите сейчас, где он будет жить — в инструменте трансформации, в хранилище или на выделенной платформе. Разделить его между тремя системами — худший вариант, и именно он возникает по умолчанию, если никто не принимает решения.
Наконец, рассматривайте запросы, инициируемые агентами, как отдельную категорию управления. Контроль доступа на уровне строк и столбцов необходим, но недостаточен. Вам также нужна атрибуция в момент запроса: какой агент, действующий от имени какого пользователя, по какой политике. Если ваш текущий стек не может на это ответить, это требование к платформе на 2026 год, а не опциональная функция.
Ключевые выводы
- Третья победа Dremio в номинации «Решение года в области аналитики данных» (2020, 2024, 2026) свидетельствует об устойчивой актуальности, а не разовом успехе, и выводит Iceberg-нативную архитектуру в обязательный шортлист каждого серьёзного проекта 2026 года.
- Концепция «Agentic Lakehouse» объединяет Text-to-SQL, метаданные от ИИ и контроль доступа на уровне строк/столбцов в единую поверхность управления, что меняет подход юристов и вице-президентов по инжинирингу к оценке рисков ИИ.
- Клиентские результаты, такие как 10x ускорение запросов и 90% сокращение времени проектов у Amazon, — полезные ориентиры, но обосновать закупочное решение может только ограниченный внутренний POC.
- Вендоры хранилищ с проприетарной экономикой хранения столкнутся с давлением при продлении контрактов в течение 2026 года; используйте это до подписания многолетних сделок.
- Владение семантическим слоем — архитектурное решение года. Выберите одно место для него, задокументируйте это решение и наймите платформенных архитекторов, способных его отстоять.
Командам, оценивающим аналитические платформы в этом квартале, стоит перестать спрашивать, у какого вендора лучшие бенчмарки, и начать спрашивать, чья коммерческая модель по-прежнему имеет смысл, когда к 2027 году агенты, а не люди, будут составлять 40% запросов.
Часто задаваемые вопросы
В: Что такое «Agentic Lakehouse» и почему это важно для аналитических команд?
Это концепция Dremio для платформы типа lakehouse, спроектированной как для выполнения запросов от ИИ-агентов, так и для оперативного управления ими, объединяющей Iceberg-нативное хранение, универсальный семантический слой и детализированный контроль доступа. Для аналитических команд это важно, поскольку стирает границу управления между людьми-пользователями BI и ИИ-агентами, сводя её к единой политике — именно там будет сосредоточена большая часть аудиторских рисков в 2026 году.
В: Как Iceberg-нативный подход Dremio сравнивается со Snowflake или Databricks?
Snowflake и Databricks оба поддерживают Apache Iceberg как внешний формат, однако их коммерческие модели по-прежнему опираются на проприетарное хранение и вычислительные пакеты. Dremio позиционирует Iceberg как нативный табличный формат и является сооснователем Apache Polaris (каталога) и Apache Arrow, что означает меньшую архитектурную дистанцию между открытым субстратом и платформой. Компромисс — зрелость экосистемы и широта управляемых сервисов вокруг каждого варианта.
В: Стоит ли нам мигрировать с текущего хранилища на основании этой новости?
Нет, награды не движут миграциями. Что должна спровоцировать эта новость — это письменная позиция по Iceberg, ограниченный POC на двух самых дорогих нагрузках и внимательное изучение условий предстоящего продления контракта с хранилищем. Миграция оправдана только тогда, когда юнит-экономика и модель управления явно лучше на ваших реальных данных, а не на данных референсного клиента.
Стратегия агентов Qlik встречается с реальностью инжиниринга данных
Qlik обещает создание пайплайнов на естественном языке на Connect 2026. Старшие инженеры, которые уже видели это раньше, знают, где это ломается в продакшене.
Множитель токенов GPU 6.5x от WEKA меняет игру в AI хранилищах
WEKA заявляет о 6.5-кратном увеличении токенов на GPU с платформой NeuralMesh, нацеливаясь на предприятия, застрявшие между AI proof-of-concept и производственным масштабом
Платформа KASS от Kubient против реальности: 80% программатик-рекламы
Kubient делает ставку на платформу KASS, чтобы занять долю рынка рекламы США объёмом $200 млрд, где 80% бюджетов уходит в программатик. Инженерная математика сложнее, чем питч.

