Skip to content
RiverCore
AWS представив FinOps Agent і покрокову атрибуцію Bedrock на FinOps X
AWS FinOps AgentBedrock attributionAI cost trackingAWS Bedrock per-token cost attributionFinOps agent performance marketing

AWS представив FinOps Agent і покрокову атрибуцію Bedrock на FinOps X

21 чер 20267 хв. читанняAlex Drover

Кожен, хто намагався пояснити фінансовому директору несподівану оплату за Bedrock, знає цю проблему. В рахунку написано «model inference». Фінансовий директор хоче знати — яка кампанія, який агент, який стажер. На FinOps X 2026 у Сан-Дієго AWS нарешті спробував закрити цю прогалину.

Головним анонсом став AWS FinOps Agent, який вийшов у публічний попередній перегляд, поряд із детальною поперсесійною атрибуцією всередині Amazon Bedrock. Разом вони мають зробити витрати на AI відстежуваними аж до рівня IAM-ролі, що ініціювала виклик. Для performance-маркетингових команд, які направляють трафік через LLM-конвеєри для креативів, скорингу та ставок, це перший раз, коли фінансова картина відповідає архітектурній.

Що відбулося

На кейноуті FinOps X 2026 18 червня Бредфорд Лайман, директор з управління продуктами AWS, представив низку оновлень інструментів для контролю витрат, які, як TechTarget повідомив, об'єднані однією темою: AI тепер є і тим, за що ви платите, і тим, що стежить за рахунком.

FinOps Agent вийшов у публічний попередній перегляд як AI-система, що аналізує хмарні витрати, розслідує аномалії, генерує звіти та надає рекомендації з оптимізації через запити природною мовою. Він інтегрується з Jira, завдяки чому знахідки потрапляють у чергу завдань інженера, який безпосередньо відповідає за навантаження. Команди можуть запускати його за розкладом, ініціювати на конкретні події або просто ставити запитання на вимогу.

Важливо, що він не виконує зміни інфраструктури та не застосовує оптимізації автоматично. Він зчитує, узагальнює та маршрутизує. Дані надходять із AWS Cost Explorer, Cost Anomaly Detection, Cost Optimization Hub і Compute Optimizer. Ключова особливість: він зіставляє ці сигнали з CloudTrail, щоб відстежити зміни витрат аж до конкретного користувача або ролі, яка їх ініціювала.

Поряд з агентом, AWS запровадив детальну атрибуцію витрат всередині Amazon Bedrock, яка зіставляє використання токенів з IAM-ролями. Дані надходять до Cost Explorer і звіту Cost and Usage Report на рівні рядків, включаючи кількість вхідних і вихідних токенів. Лайман назвав це «фундаментом токеноміки».

Решта оновлень: цільове планування Savings Plans у консолі, автоматичне визначення першопричини змін витрат і прогнозів, удвічі більше рекомендацій щодо простоюючих ресурсів, а також засоби керування спільним використанням кредитів і новий вид консолі для зароблених кредитів, залишків і навантажень, що їх витрачають.

Технічна анатомія

Архітектурне рішення, що заслуговує на вивчення, — це позиція агента «лише читання». AWS міг би побудувати щось, що автоматично змінює розміри EC2 або вимикає незайняті SageMaker-ендпоінти. Вони цього не зробили. З інцидентів у виробництві, які я бачив, — це правильне рішення. Автономний агент із доступом на запис до інфраструктури, що впливає на білінг, має такий самий профіль ризику, як і надання молодшому черговому інженеру root-прав у продакшн о 3-й ночі. Рекомендації в Jira — нудно. Нудне — це те, що виживає.

Модель атрибуції Bedrock технічно є більш цікавою. Пропускаючи поперсесійні виклики моделей через IAM-ідентичність і видаючи кількість вхідних і вихідних токенів на рівні рядків звіту Cost and Usage Report, AWS фактично перетворює кожен виклик Bedrock на структуровану подію білінгу, прив'язану до ролі. Якщо ваша команда дисципліновано призначала окремі IAM-ролі для кожного застосунку, агента або орендаря, у вас вже є видимість витрат на AI на рівні кампанії. Якщо ж ви використовували одну спільну сервісну роль для всієї організації — вас чекає рефакторинг.

FinOps Agent сам по собі є метарівнем поверх існуючих сервісів. Він не створює нову телеметрію. Він об'єднує тренди Cost Explorer, сигнали Cost Anomaly Detection, дані rightsizing з Compute Optimizer і рекомендації Cost Optimization Hub, використовуючи CloudTrail як криміналістичний слід. Інтерфейс природною мовою — це те, що добре виглядає на демо. Кореляція з CloudTrail — це те, що має значення о 2-й ночі, коли прогноз подвоюється і ніхто не пам'ятає, хто розгортав нового агента.

Моя думка: інтеграція з Jira — це найважливіше дизайнерське рішення в усьому анонсі. Направлення аномалій витрат у ту саму чергу, що й баги, руйнує організаційну структуру «FinOps проти інженерів». Команди, які роками сперечалися про те, хто відповідає за рахунок, раптом несуть відповідальність через звичайний потік завдань.

Хто постраждає

Performance-маркетингові платформи з LLM-навантаженими стеками опиняються під ударом першими — і в обох напрямках. Плюс: ви нарешті можете показати медіабаєру реальну вартість кожного згенерованого креативу, кожної оціненої аудиторії, кожного збагачення ставки в реальному часі. Мінус: ваш фінансовий відділ теж може це побачити, і більшість цих одиничних економічних показників не витримають контакту з реальністю.

Ad-tech команди, що будують генерацію текстів на основі Bedrock, персоналізацію лендингових сторінок або моделювання атрибуції, діяли навмання. Токен-рахунок надходив щомісяця одним числом. Тепер він надходить за IAM-роллю, за сесією, з розбивкою на вхідні та вихідні токени. Команди, з якими я працював у подібних переходах у білінгу, виявили, що 20 відсотків їхніх навантажень генерували 80 відсотків витрат, і що дороге 20 відсотків зазвичай було експериментальною функцією, яку ніхто не вимкнув.

Оператори iGaming, що запускають агентів персоналізації в рамках сесій гравців, опинилися в особливо скрутному становищі. Якщо кожна сесія гравця ініціює виклики Bedrock під спільною роллю, у вас є лише сукупні витрати, але немає сигналу на рівні когорти. Регулятори в кількох європейських ринках вже запитують про алгоритмічну персоналізацію для високоцінних гравців. «Ми не можемо сказати вам, скільки коштує кожна сесія» — це не та відповідь, яку хоче почути відділ комплаєнсу.

Fintech-команди, що використовують Bedrock для скринінгу транзакцій або автоматизації підтримки, отримують тут реальну аудиторську цінність. Поролева атрибуція в Cost Explorer означає, що витрати на модель можна прив'язати до продуктових ліній для внутрішнього розподілу витрат — а це те, що кожен багатопродуктовий fintech досі імітував за допомогою таблиць Excel.

Незручний висновок: агентства та SaaS-вендори, що накручували непрозорі витрати на AI клієнтам, тепер зіштовхнуться з клієнтами, які можуть побачити рядки з токенами, якщо вони мають спільну структуру акаунтів. Стиснення маржі невідворотне.

Плейбук для Performance-маркетингу

Пріоритетний список дій на наступні два тижні.

Перше: проведіть аудит структури IAM-ролей для будь-яких навантажень із викликами Bedrock. Якщо одна роль обслуговує кілька кампаній, застосунків або орендарів — розбийте її ще до ввімкнення атрибуції. Інакше нові дані Cost and Usage Report — це просто сукупний шум із додатковими стовпцями.

Друге: увімкніть FinOps Agent у непродакшн-акаунті та направте його на навантаження з обслуговування реклами та ставок. Нехай він попрацює два тижні за розкладом. Мета — не діяти за кожною рекомендацією. Мета — побачити, які аномалії він виявляє, що пропускає ваша поточна система сповіщень, і як часто він виявляє забуті простоюючі ресурси. AWS подвоїв кількість рекомендацій щодо простоюючих ресурсів у цьому релізі, тому можливостей для легких перемог стало більше.

Третє: підключіть інтеграцію агента з Jira до тієї самої дошки, яку ваша платформна команда використовує для інцидентів. Не створюйте окрему дошку для FinOps. Проблеми з витратами, що живуть на узбіччі, ігноруються. Проблеми з витратами, що блокують спринт, вирішуються.

Четверте: встановіть цільові показники покриття Savings Plans у консолі для базових обчислень. Нова функція цільового планування усуває крок із таблицями. Якщо ви підтримуєте стабільну рекламну інфраструктуру і залишаєте її на on-demand — це бюджет двох інженерів у команді з 10 осіб щороку.

П'яте: для команд, що використовують інструменти атрибуції на зразок Privacy Sandbox Attribution Reporting API разом із моделюванням на основі Bedrock, — тегуйте навантаження Bedrock тими самими ідентифікаторами кампаній, що й нижче за стеком. Наскрізна вартість на конверсію стає запитом, а не щоквартальним проектом.

Ключові висновки

  • AWS FinOps Agent за задумом є лише для читання: він направляє виявлені аномалії та рекомендації з оптимізації до Jira, а не виконує зміни. Правильне архітектурне рішення.
  • Bedrock тепер атрибутує використання токенів до IAM-ролей із розбивкою на вхідні та вихідні токени на рівні рядків у Cost and Usage Report. Дисципліна з ролями — тепер вимога білінгу, а не перевага гігієни.
  • Цільове планування Savings Plans, подвоєна кількість рекомендацій щодо простоюючих ресурсів і автоматичне пояснення першопричини переводять FinOps на рівні консолі з таблиць до AWS UI.
  • Засоби керування спільним використанням кредитів і новий вид прозорості кредитів важливі для будь-якої організації з багатоакаунтними структурами та домовленими кредитами AWS — особливо для агентств і платформ.
  • Performance-маркетингові команди, що використовують LLM-стеки, мають розбити спільні IAM-ролі Bedrock у цьому спринті — ще до ввімкнення атрибуції. Сукупні дані — не дієві дані.

Часті запитання

Q: Що таке AWS FinOps Agent і що він насправді вміє?

Це AI-інструмент у публічному попередньому перегляді, що аналізує хмарні витрати, розслідує аномалії, генерує звіти та надає рекомендації з оптимізації через запити природною мовою. Він інтегрується з Jira і використовує CloudTrail для відстеження змін витрат до конкретних користувачів або ролей. Він не виконує зміни інфраструктури автоматично.

Q: Як працює нова атрибуція витрат Bedrock?

Bedrock тепер зіставляє використання з IAM-ролями або користувачами та показує, яка модель була викликана і скільки коштує кожна сесія. Ці дані надходять до AWS Cost Explorer і Cost and Usage Report, де кількість вхідних і вихідних токенів доступна на рівні рядків. Призначення окремих IAM-ролей для кожного застосунку або агента є обов'язковою умовою для отримання корисної деталізації.

Q: Чи варто performance-маркетинговим командам впроваджувати це негайно?

Так — для атрибуції Bedrock, але спершу необхідно реструктурувати спільні IAM-ролі. FinOps Agent варто пілотувати в непродакшн-акаунті два тижні, щоб побачити, які аномалії він виявляє, перш ніж підключати його до основної Jira-дошки. Цільове планування Savings Plans — швидка перемога для будь-якої команди, що підтримує стабільну рекламну інфраструктуру.

AD
Alex Drover
RiverCore Analyst · Dublin, Ireland
ПОДІЛИТИСЯ
// RELATED ARTICLES
ГоловнаРішенняПроєктиПро насКонтакт
Новини06
Дублін, Ірландія · ЄСGMT+1
LinkedIn
🇺🇦UK