Skip to content
RiverCore
AWS представила FinOps Agent и пооtokenовую атрибуцию Bedrock на FinOps X
AWS FinOps AgentBedrock attributionAI cost trackingAWS Bedrock per-token cost attributionFinOps agent performance marketing

AWS представила FinOps Agent и пооtokenовую атрибуцию Bedrock на FinOps X

21 июн 20267 мин. чтенияAlex Drover

Любой, кто пытался объяснить CFO неожиданный счёт за Bedrock, знает эту проблему. В счёте написано «model inference». CFO хочет знать: какая кампания, какой агент, какой стажёр. На FinOps X 2026 в Сан-Диего AWS наконец попыталась закрыть этот пробел.

Главное объявление — AWS FinOps Agent, теперь доступный в публичном превью, вместе с детальной пессессионной атрибуцией внутри Amazon Bedrock. Вместе они призваны сделать расходы на ИИ прослеживаемыми вплоть до IAM-роли, инициировавшей вызов. Для команд performance-маркетинга, прогоняющих трафик через LLM-пайплайны генерации креативов, скоринга и торгов, — это первый раз, когда история затрат совпадает с историей архитектуры.

Что произошло

На кейноуте FinOps X 2026 18 июня Брэдфорд Лайман, директор по управлению продуктом в AWS, представил ряд обновлений инструментов управления затратами, которые, как сообщил TechTarget, объединяет одна тема: ИИ теперь одновременно является тем, за что вы платите, и тем, что следит за счётом.

FinOps Agent вышел в публичный превью как AI-инструмент, который анализирует облачные расходы, расследует аномалии, формирует пользовательские отчёты и предлагает рекомендации по оптимизации через запросы на естественном языке. Он интегрируется с Jira, чтобы результаты попадали в очередь инженера, реально владеющего рабочей нагрузкой. Команды могут запускать его по расписанию, по конкретным событиям или задавать вопросы в произвольный момент.

Принципиально важно: он не выполняет изменения инфраструктуры и не применяет оптимизации автоматически. Он читает, суммирует и маршрутизирует. Данные берутся из AWS Cost Explorer, Cost Anomaly Detection, Cost Optimization Hub и Compute Optimizer. Ключевая деталь: он сопоставляет эти сигналы с CloudTrail, чтобы отследить изменения затрат до конкретного пользователя или роли, которая их инициировала.

Вместе с агентом AWS выпустила детальную атрибуцию затрат внутри Amazon Bedrock, которая сопоставляет использование токенов с IAM-ролями, причём данные поступают в Cost Explorer и Cost and Usage Report на уровне отдельных строк, включая количество входящих и исходящих токенов. Лайман назвал это «фундаментом токеномики».

Остальные обновления в пакете: планирование целевых показателей Savings Plans прямо в консоли, автоматические объяснения первопричин изменений затрат и прогнозов, вдвое больше рекомендаций по простаивающим ресурсам, а также управление распределением кредитов и новое представление в консоли для заработанных кредитов, остатков и информации о том, какие рабочие нагрузки их расходуют.

Техническая анатомия

Архитектурное решение, заслуживающее особого внимания, — режим только для чтения у агента. AWS могла бы создать что-то, что автоматически масштабирует EC2 или останавливает простаивающие SageMaker-эндпойнты. Они этого не сделали. Исходя из виденных мной производственных инцидентов, это правильный выбор. Автономный агент с правом записи в инфраструктуру, влияющую на биллинг, несёт такой же риск, как дать дежурному джуниору root в проде в 3 часа ночи. Рекомендации в Jira скучны. Скучное — это то, что выживает.

Модель атрибуции Bedrock — технически более интересная часть. Пропуская пессессионные вызовы модели через IAM-идентификацию и фиксируя количество входящих/исходящих токенов на уровне строк Cost and Usage Report, AWS фактически превращает каждый вызов Bedrock в структурированное событие биллинга с ключом по роли. Если в вашей команде последовательно назначались отдельные IAM-роли для каждого приложения, агента или тенанта — вы уже получаете видимость затрат на ИИ на уровне кампаний. Если вы использовали одну большую общую сервисную роль на всю организацию — вас ждёт рефакторинг.

FinOps Agent сам по себе — мета-уровень поверх существующих сервисов. Он не изобретает новую телеметрию. Он связывает тренды Cost Explorer, сигналы Cost Anomaly Detection, данные по правильному масштабированию Compute Optimizer и рекомендации Cost Optimization Hub, используя CloudTrail как криминалистический след. Интерфейс на естественном языке — та часть, которая хорошо смотрится на демо. Корреляция с CloudTrail — та часть, которая важна в 2 часа ночи, когда прогноз удваивается за ночь и никто не помнит, кто задеплоил нового агента.

Моё мнение: интеграция с Jira — наиболее значимое архитектурное решение во всём анонсе. Маршрутизация аномалий затрат в ту же очередь, что и баги, разрушает организационное противостояние FinOps против инженерии. Команды, годами спорившие о том, кто отвечает за счёт, внезапно получают ответственность через привычный рабочий процесс с тикетами.

Кого это затронет

Платформы performance-маркетинга с тяжёлыми LLM-стеками попадают под удар первыми — с обеих сторон. Плюс: вы наконец можете показать медиабайеру реальную стоимость каждого сгенерированного креатива, каждой оценённой аудитории, каждого обогащения ставки в реальном времени. Минус: это же может увидеть ваш финансовый отдел, и многие из этих удельных экономик не переживут встречи с реальностью.

Ad-tech команды, создающие генерацию копирайта на базе Bedrock, персонализацию лендингов или атрибуционное моделирование, работали на ощущениях. Счёт за токены приходил ежемесячно одной цифрой. Теперь он приходит по IAM-роли, по сессии, с разбивкой входящих и исходящих токенов. Команды, с которыми я работал в аналогичных переходах по биллингу, обнаруживали, что 20% их рабочих нагрузок генерировали 80% затрат, и что эти дорогостоящие 20% обычно были экспериментальной функцией, которую никто не отключил.

Операторы iGaming, запускающие агентов персонализации для сессий игроков, находятся в особенно затруднительном положении. Если каждая сессия игрока инициирует вызовы Bedrock под общей ролью, у вас есть совокупные затраты, но нет сигнала по когортам. Регуляторы в ряде европейских рынков уже задают вопросы об алгоритмической персонализации для высокоценных игроков. «Мы не можем сказать, сколько стоила каждая сессия» — это не тот ответ, которого хочет комплаенс.

Финтех-команды, использующие Bedrock для скрининга транзакций или автоматизации поддержки, получают здесь реальную ценность для аудита. Атрибуция по ролям в Cost Explorer означает, что расходы на модели можно разнести по продуктовым линиям для внутреннего аллокирования затрат — то, что каждый мультипродуктовый финтех до сих пор имитировал с помощью таблиц.

Неудобный вывод: агентства и SaaS-вендоры, которые делали наценку на непрозрачные расходы на ИИ для клиентов, теперь столкнутся с клиентами, способными видеть строки токенов в деталях, если у них общая структура аккаунтов. Сжатие маржи неизбежно.

Руководство для performance-маркетинга

Список действий на ближайшие две недели в порядке приоритета.

Во-первых, проведите аудит структуры IAM-ролей для любой рабочей нагрузки, вызывающей Bedrock. Если одна роль обслуживает несколько кампаний, приложений или тенантов — разделите её, прежде чем включить атрибуцию. Иначе новые данные Cost and Usage Report — лишь агрегированный шум с лишними столбцами.

Во-вторых, включите FinOps Agent в непроизводственном аккаунте и направьте его на рабочие нагрузки по показу рекламы и торгам. Дайте ему поработать две недели по расписанию. Цель — не действовать по каждой рекомендации. Цель — увидеть, какие аномалии он обнаруживает, которые пропускают ваши существующие алерты, и как часто он выявляет забытые простаивающие ресурсы. AWS вдвое увеличила число рекомендаций по простаивающим ресурсам в этом релизе, так что зона простых побед только расширилась.

В-третьих, подключите интеграцию агента с Jira к той же доске, которую ваша платформенная команда использует для инцидентов. Не создавайте отдельную FinOps-доску. Проблемы с затратами, живущие в боковом треке, игнорируются. Проблемы с затратами, блокирующие спринт, исправляются.

В-четвёртых, задайте целевые показатели покрытия Savings Plans в консоли для базовых вычислительных ресурсов. Новая функция планирования целей убирает шаг с таблицами. Если вы эксплуатируете стабильную рекламную инфраструктуру и держите её на on-demand — это бюджет двух инженеров в команде из 10 человек ежегодно.

В-пятых, для команд, использующих инструменты атрибуции вроде Privacy Sandbox Attribution Reporting API совместно с моделированием на базе Bedrock — тегируйте рабочие нагрузки Bedrock теми же идентификаторами кампаний, что используете ниже по потоку. Сквозная стоимость за конверсию становится запросом, а не квартальным проектом.

Ключевые выводы

  • AWS FinOps Agent намеренно работает только на чтение, направляя находки об аномалиях и рекомендации по оптимизации в Jira, а не выполняя изменения автоматически. Правильное архитектурное решение.
  • Bedrock теперь атрибутирует использование токенов к IAM-ролям с разбивкой входящих и исходящих токенов на уровне строк в Cost and Usage Report. Дисциплина по ролям теперь — требование биллинга, а не вопрос гигиены.
  • Планирование целей Savings Plans, вдвое увеличенное число рекомендаций по простаивающим ресурсам и автоматические объяснения первопричин переводят FinOps на уровне консоли с таблиц в интерфейс AWS.
  • Управление распределением кредитов и новое представление прозрачности кредитов важны для любой организации с мультиаккаунтными структурами и согласованными кредитами AWS, особенно для агентств и платформ.
  • Команды performance-маркетинга с LLM-стеками должны разделить общие IAM-роли Bedrock в этом спринте, до включения атрибуции. Агрегированные данные — не actionable данные.

Часто задаваемые вопросы

В: Что такое AWS FinOps Agent и что он реально умеет?

Это AI-инструмент в публичном превью, который анализирует облачные расходы, расследует аномалии, формирует пользовательские отчёты и предлагает рекомендации по оптимизации через запросы на естественном языке. Он интегрируется с Jira и использует CloudTrail для отслеживания изменений затрат до конкретных пользователей или ролей. Он не выполняет изменения инфраструктуры автоматически.

В: Как работает новая атрибуция затрат Bedrock?

Bedrock теперь сопоставляет использование с IAM-ролями или пользователями и показывает, какая модель была вызвана и сколько стоила каждая сессия. Эти данные поступают в AWS Cost Explorer и Cost and Usage Report, с количеством входящих и исходящих токенов на уровне строк. Назначение отдельных IAM-ролей для каждого приложения или агента — предварительное условие для получения полезной детализации.

В: Стоит ли командам performance-маркетинга принять это немедленно?

Да — для атрибуции Bedrock, с оговоркой, что сначала нужно перестроить общие IAM-роли. FinOps Agent стоит пилотировать в непроизводственном аккаунте две недели, чтобы увидеть, какие аномалии он обнаруживает, прежде чем подключать к основной доске Jira. Планирование целей Savings Plans — быстрая победа для любой команды со стабильной рекламной инфраструктурой.

AD
Alex Drover
RiverCore Analyst · Dublin, Ireland
ПОДЕЛИТЬСЯ
// RELATED ARTICLES
ГлавнаяРешенияПроектыО насКонтакт
Новости06
Дублин, Ирландия · ЕСGMT+1
LinkedIn
🇷🇺RU