AWS представила FinOps Agent и пооtokenовую атрибуцию Bedrock на FinOps X
Любой, кто пытался объяснить CFO неожиданный счёт за Bedrock, знает эту проблему. В счёте написано «model inference». CFO хочет знать: какая кампания, какой агент, какой стажёр. На FinOps X 2026 в Сан-Диего AWS наконец попыталась закрыть этот пробел.
Главное объявление — AWS FinOps Agent, теперь доступный в публичном превью, вместе с детальной пессессионной атрибуцией внутри Amazon Bedrock. Вместе они призваны сделать расходы на ИИ прослеживаемыми вплоть до IAM-роли, инициировавшей вызов. Для команд performance-маркетинга, прогоняющих трафик через LLM-пайплайны генерации креативов, скоринга и торгов, — это первый раз, когда история затрат совпадает с историей архитектуры.
Что произошло
На кейноуте FinOps X 2026 18 июня Брэдфорд Лайман, директор по управлению продуктом в AWS, представил ряд обновлений инструментов управления затратами, которые, как сообщил TechTarget, объединяет одна тема: ИИ теперь одновременно является тем, за что вы платите, и тем, что следит за счётом.
FinOps Agent вышел в публичный превью как AI-инструмент, который анализирует облачные расходы, расследует аномалии, формирует пользовательские отчёты и предлагает рекомендации по оптимизации через запросы на естественном языке. Он интегрируется с Jira, чтобы результаты попадали в очередь инженера, реально владеющего рабочей нагрузкой. Команды могут запускать его по расписанию, по конкретным событиям или задавать вопросы в произвольный момент.
Принципиально важно: он не выполняет изменения инфраструктуры и не применяет оптимизации автоматически. Он читает, суммирует и маршрутизирует. Данные берутся из AWS Cost Explorer, Cost Anomaly Detection, Cost Optimization Hub и Compute Optimizer. Ключевая деталь: он сопоставляет эти сигналы с CloudTrail, чтобы отследить изменения затрат до конкретного пользователя или роли, которая их инициировала.
Вместе с агентом AWS выпустила детальную атрибуцию затрат внутри Amazon Bedrock, которая сопоставляет использование токенов с IAM-ролями, причём данные поступают в Cost Explorer и Cost and Usage Report на уровне отдельных строк, включая количество входящих и исходящих токенов. Лайман назвал это «фундаментом токеномики».
Остальные обновления в пакете: планирование целевых показателей Savings Plans прямо в консоли, автоматические объяснения первопричин изменений затрат и прогнозов, вдвое больше рекомендаций по простаивающим ресурсам, а также управление распределением кредитов и новое представление в консоли для заработанных кредитов, остатков и информации о том, какие рабочие нагрузки их расходуют.
Техническая анатомия
Архитектурное решение, заслуживающее особого внимания, — режим только для чтения у агента. AWS могла бы создать что-то, что автоматически масштабирует EC2 или останавливает простаивающие SageMaker-эндпойнты. Они этого не сделали. Исходя из виденных мной производственных инцидентов, это правильный выбор. Автономный агент с правом записи в инфраструктуру, влияющую на биллинг, несёт такой же риск, как дать дежурному джуниору root в проде в 3 часа ночи. Рекомендации в Jira скучны. Скучное — это то, что выживает.
Модель атрибуции Bedrock — технически более интересная часть. Пропуская пессессионные вызовы модели через IAM-идентификацию и фиксируя количество входящих/исходящих токенов на уровне строк Cost and Usage Report, AWS фактически превращает каждый вызов Bedrock в структурированное событие биллинга с ключом по роли. Если в вашей команде последовательно назначались отдельные IAM-роли для каждого приложения, агента или тенанта — вы уже получаете видимость затрат на ИИ на уровне кампаний. Если вы использовали одну большую общую сервисную роль на всю организацию — вас ждёт рефакторинг.
FinOps Agent сам по себе — мета-уровень поверх существующих сервисов. Он не изобретает новую телеметрию. Он связывает тренды Cost Explorer, сигналы Cost Anomaly Detection, данные по правильному масштабированию Compute Optimizer и рекомендации Cost Optimization Hub, используя CloudTrail как криминалистический след. Интерфейс на естественном языке — та часть, которая хорошо смотрится на демо. Корреляция с CloudTrail — та часть, которая важна в 2 часа ночи, когда прогноз удваивается за ночь и никто не помнит, кто задеплоил нового агента.
Моё мнение: интеграция с Jira — наиболее значимое архитектурное решение во всём анонсе. Маршрутизация аномалий затрат в ту же очередь, что и баги, разрушает организационное противостояние FinOps против инженерии. Команды, годами спорившие о том, кто отвечает за счёт, внезапно получают ответственность через привычный рабочий процесс с тикетами.
Кого это затронет
Платформы performance-маркетинга с тяжёлыми LLM-стеками попадают под удар первыми — с обеих сторон. Плюс: вы наконец можете показать медиабайеру реальную стоимость каждого сгенерированного креатива, каждой оценённой аудитории, каждого обогащения ставки в реальном времени. Минус: это же может увидеть ваш финансовый отдел, и многие из этих удельных экономик не переживут встречи с реальностью.
Ad-tech команды, создающие генерацию копирайта на базе Bedrock, персонализацию лендингов или атрибуционное моделирование, работали на ощущениях. Счёт за токены приходил ежемесячно одной цифрой. Теперь он приходит по IAM-роли, по сессии, с разбивкой входящих и исходящих токенов. Команды, с которыми я работал в аналогичных переходах по биллингу, обнаруживали, что 20% их рабочих нагрузок генерировали 80% затрат, и что эти дорогостоящие 20% обычно были экспериментальной функцией, которую никто не отключил.
Операторы iGaming, запускающие агентов персонализации для сессий игроков, находятся в особенно затруднительном положении. Если каждая сессия игрока инициирует вызовы Bedrock под общей ролью, у вас есть совокупные затраты, но нет сигнала по когортам. Регуляторы в ряде европейских рынков уже задают вопросы об алгоритмической персонализации для высокоценных игроков. «Мы не можем сказать, сколько стоила каждая сессия» — это не тот ответ, которого хочет комплаенс.
Финтех-команды, использующие Bedrock для скрининга транзакций или автоматизации поддержки, получают здесь реальную ценность для аудита. Атрибуция по ролям в Cost Explorer означает, что расходы на модели можно разнести по продуктовым линиям для внутреннего аллокирования затрат — то, что каждый мультипродуктовый финтех до сих пор имитировал с помощью таблиц.
Неудобный вывод: агентства и SaaS-вендоры, которые делали наценку на непрозрачные расходы на ИИ для клиентов, теперь столкнутся с клиентами, способными видеть строки токенов в деталях, если у них общая структура аккаунтов. Сжатие маржи неизбежно.
Руководство для performance-маркетинга
Список действий на ближайшие две недели в порядке приоритета.
Во-первых, проведите аудит структуры IAM-ролей для любой рабочей нагрузки, вызывающей Bedrock. Если одна роль обслуживает несколько кампаний, приложений или тенантов — разделите её, прежде чем включить атрибуцию. Иначе новые данные Cost and Usage Report — лишь агрегированный шум с лишними столбцами.
Во-вторых, включите FinOps Agent в непроизводственном аккаунте и направьте его на рабочие нагрузки по показу рекламы и торгам. Дайте ему поработать две недели по расписанию. Цель — не действовать по каждой рекомендации. Цель — увидеть, какие аномалии он обнаруживает, которые пропускают ваши существующие алерты, и как часто он выявляет забытые простаивающие ресурсы. AWS вдвое увеличила число рекомендаций по простаивающим ресурсам в этом релизе, так что зона простых побед только расширилась.
В-третьих, подключите интеграцию агента с Jira к той же доске, которую ваша платформенная команда использует для инцидентов. Не создавайте отдельную FinOps-доску. Проблемы с затратами, живущие в боковом треке, игнорируются. Проблемы с затратами, блокирующие спринт, исправляются.
В-четвёртых, задайте целевые показатели покрытия Savings Plans в консоли для базовых вычислительных ресурсов. Новая функция планирования целей убирает шаг с таблицами. Если вы эксплуатируете стабильную рекламную инфраструктуру и держите её на on-demand — это бюджет двух инженеров в команде из 10 человек ежегодно.
В-пятых, для команд, использующих инструменты атрибуции вроде Privacy Sandbox Attribution Reporting API совместно с моделированием на базе Bedrock — тегируйте рабочие нагрузки Bedrock теми же идентификаторами кампаний, что используете ниже по потоку. Сквозная стоимость за конверсию становится запросом, а не квартальным проектом.
Ключевые выводы
- AWS FinOps Agent намеренно работает только на чтение, направляя находки об аномалиях и рекомендации по оптимизации в Jira, а не выполняя изменения автоматически. Правильное архитектурное решение.
- Bedrock теперь атрибутирует использование токенов к IAM-ролям с разбивкой входящих и исходящих токенов на уровне строк в Cost and Usage Report. Дисциплина по ролям теперь — требование биллинга, а не вопрос гигиены.
- Планирование целей Savings Plans, вдвое увеличенное число рекомендаций по простаивающим ресурсам и автоматические объяснения первопричин переводят FinOps на уровне консоли с таблиц в интерфейс AWS.
- Управление распределением кредитов и новое представление прозрачности кредитов важны для любой организации с мультиаккаунтными структурами и согласованными кредитами AWS, особенно для агентств и платформ.
- Команды performance-маркетинга с LLM-стеками должны разделить общие IAM-роли Bedrock в этом спринте, до включения атрибуции. Агрегированные данные — не actionable данные.
Часто задаваемые вопросы
В: Что такое AWS FinOps Agent и что он реально умеет?
Это AI-инструмент в публичном превью, который анализирует облачные расходы, расследует аномалии, формирует пользовательские отчёты и предлагает рекомендации по оптимизации через запросы на естественном языке. Он интегрируется с Jira и использует CloudTrail для отслеживания изменений затрат до конкретных пользователей или ролей. Он не выполняет изменения инфраструктуры автоматически.
В: Как работает новая атрибуция затрат Bedrock?
Bedrock теперь сопоставляет использование с IAM-ролями или пользователями и показывает, какая модель была вызвана и сколько стоила каждая сессия. Эти данные поступают в AWS Cost Explorer и Cost and Usage Report, с количеством входящих и исходящих токенов на уровне строк. Назначение отдельных IAM-ролей для каждого приложения или агента — предварительное условие для получения полезной детализации.
В: Стоит ли командам performance-маркетинга принять это немедленно?
Да — для атрибуции Bedrock, с оговоркой, что сначала нужно перестроить общие IAM-роли. FinOps Agent стоит пилотировать в непроизводственном аккаунте две недели, чтобы увидеть, какие аномалии он обнаруживает, прежде чем подключать к основной доске Jira. Планирование целей Savings Plans — быстрая победа для любой команды со стабильной рекламной инфраструктурой.
PubMatic открывает программатик CTV для независимых авторов
PubMatic построила мост между независимыми CTV-авторами и агентными рекламными бюджетами. MeatEater — первый участник. Разбираемся, как устроена архитектура.
EA запускает платформу внутриигровой рекламы на аудиторию 120 млн игроков
EA открыла рекламный инвентарь стадионного масштаба на консолях, мобайле и PC. Что эта платформа значит для performance-маркетологов и ad-tech команд.
Криптовалютный рынок Бразилии на $318 млрд: отмывание денег в открытую
Бразилия провела $318 млрд в on-chain-объёме за год, и 80% грязных денег прошло всего через пять адресов. Центральный банк закрывает дверь.




