AWS FinOps AgentBedrock attributionAI cost trackingAWS Bedrock per-token cost attributionFinOps agent performance marketing

AWS präsentiert FinOps Agent und Bedrock Token-Zuordnung auf der FinOps X

21 Jun 20267 Min. LesezeitAlex Drover

// IN DIESEM ARTIKEL

01Was geschehen ist 02Technische Architektur 03Wer zuerst betroffen ist 04Playbook für Performance Marketing 05Wichtigste Erkenntnisse 06Häufig gestellte Fragen

Wer schon einmal versucht hat, einer CFO eine überraschende Bedrock-Rechnung zu erklären, kennt das Problem. Die Abrechnung lautet „Model Inference". Die CFO will wissen: Welche Kampagne, welcher Agent, welcher Praktikant? Auf der FinOps X 2026 in San Diego hat AWS diesen Graben endlich zu schließen versucht.

Die wichtigste Ankündigung war der AWS FinOps Agent, nun in der Public Preview, zusammen mit granularer sitzungsbasierter Zuordnung innerhalb von Amazon Bedrock. Gemeinsam sollen sie KI-Ausgaben bis hin zur IAM-Rolle nachverfolgbar machen, die den Aufruf ausgelöst hat. Für Performance-Marketing-Teams, die Traffic durch LLM-gestützte Creative-, Scoring- und Bidding-Pipelines schleusen, stimmt die Kostenperspektive damit erstmals mit der Architekturperspektive überein.

Was geschehen ist

Beim Keynote der FinOps X 2026 am 18. Juni stellte Bradford Lyman, Director of Product Management bei AWS, eine Reihe von Cost-Tooling-Updates vor, die, wie TechTarget berichtete, alle einem Thema folgen: KI ist nun sowohl das, wofür man bezahlt, als auch das, was die Rechnung überwacht.

Der FinOps Agent ging als KI-gestütztes System in die Public Preview, das Cloud-Ausgaben analysiert, Anomalien untersucht, benutzerdefinierte Berichte erstellt und Optimierungsempfehlungen per Natural-Language-Abfragen ausgibt. Er ist mit Jira verknüpft, sodass Ergebnisse direkt in der Queue des Engineers landen, dem die Workload tatsächlich gehört. Teams können ihn nach Zeitplan ausführen, bei bestimmten Ereignissen auslösen oder einfach auf Abruf befragen.

Entscheidend: Er führt keine Infrastrukturänderungen aus und wendet Optimierungen nicht automatisch an. Er liest, fasst zusammen und leitet weiter. Die Daten stammen aus AWS Cost Explorer, Cost Anomaly Detection, Cost Optimization Hub und Compute Optimizer. Das Clevere daran: Er korreliert diese Signale mit CloudTrail, um Kostenänderungen auf den spezifischen Benutzer oder die Rolle zurückzuführen, die sie ausgelöst haben.

Parallel zum Agent lieferte AWS eine granulare Kostenzuordnung innerhalb von Amazon Bedrock, die Token-Nutzung auf IAM-Rollen abbildet. Die Daten fließen auf Einzelpostenebene in Cost Explorer und den Cost and Usage Report, einschließlich der Anzahl von Eingabe- und Ausgabe-Tokens. Lyman nannte es „das Fundament der Tokenomics".

Das übrige Paket: Savings Plans Target Planning in der Console, automatische Ursachenerklärungen für Kosten- und Prognoseänderungen, doppelt so viele Empfehlungen für inaktive Ressourcen, Credit-Level-Sharing-Kontrollen sowie eine neue Console-Ansicht für verdiente Credits, verbleibende Guthaben und welche Workloads diese verbrauchen.

Technische Architektur

Die wichtigste Architekturentscheidung, die es zu beachten gilt, ist die rein lesende Position des Agents. AWS hätte etwas bauen können, das EC2 automatisch skaliert oder inaktive SageMaker-Endpoints beendet. Das haben sie nicht getan. Aus Produktionsvorfällen, die ich erlebt habe, ist das die richtige Entscheidung. Ein autonomer Agent mit Schreibzugriff auf abrechnungsrelevante Infrastruktur hat dasselbe Risikoprofil wie ein Junior-On-Call-Engineer mit Root-Zugang in Produktion um 3 Uhr morgens. Empfehlungen in Jira sind langweilig. Langweilig ist das, was überlebt.

Das Bedrock-Attributionsmodell ist technisch der interessantere Teil. Indem sitzungsbasierte Modellaufrufe über die IAM-Identität geleitet und Eingabe-/Ausgabe-Token-Zählungen auf Einzelpostenebene des Cost and Usage Reports ausgegeben werden, macht AWS jeden Bedrock-Aufruf effektiv zu einem strukturierten Billing-Event, das auf eine Rolle gekettet ist. Wer in seinem Team diszipliniert eigene IAM-Rollen pro Anwendung, Agent oder Mandant vergeben hat, verfügt bereits über kampagnenniveaubasierte KI-Kostentransparenz. Wer eine einzige fette Service-Rolle für die gesamte Organisation geteilt hat, hat ein Refactoring vor sich.

Der FinOps Agent selbst ist eine Metaschicht über bestehenden Services. Er erfindet keine neue Telemetrie. Er verknüpft Cost Explorer-Trends, Cost Anomaly Detection-Signale, Compute Optimizer-Rightsizing-Daten und Cost Optimization Hub-Empfehlungen und nutzt CloudTrail als forensischen Pfad. Die Natural-Language-Schnittstelle ist der Teil, der in Demos gut wirkt. Die CloudTrail-Korrelation ist der Teil, der um 2 Uhr morgens zählt, wenn sich eine Prognose über Nacht verdoppelt und niemand mehr weiß, wer den neuen Agent deployed hat.

Meine Einschätzung: Die Jira-Integration ist die folgenreichste Designentscheidung der gesamten Ankündigung. Wenn Kostenanomalien in dieselbe Queue wie Bugs geleitet werden, kollabiert das FinOps-versus-Engineering-Organigramm. Teams, die jahrelang darüber gestritten haben, wem die Rechnung gehört, besitzen sie plötzlich über ihren normalen Ticket-Workflow.

Wer zuerst betroffen ist

Performance-Marketing-Plattformen mit LLM-lastigen Stacks sind zuerst betroffen – in beide Richtungen. Der Vorteil: Man kann einem Media Buyer endlich die tatsächlichen Kosten pro generiertem Creative, pro bewerteter Zielgruppe und pro Echtzeit-Bid-Enrichment zeigen. Der Nachteil: Das kann auch das Finance-Team – und viele dieser Unit Economics werden das Tageslicht nicht überleben.

Ad-Tech-Teams, die Bedrock-gestützte Texterstellung, Landing-Page-Personalisierung oder Attributionsmodellierung betreiben, haben bisher nach Gefühl gearbeitet. Die Token-Rechnung kam monatlich als eine einzige Zahl. Jetzt kommt sie pro IAM-Rolle, pro Sitzung, mit aufgeschlüsselten Eingabe- und Ausgabe-Tokens. Teams, mit denen ich bei ähnlichen Abrechnungsübergängen gearbeitet habe, stellten fest, dass 20 Prozent ihrer Workloads 80 Prozent der Kosten verursachten und dass die teuren 20 Prozent meist ein experimentelles Feature waren, das niemand abgeschaltet hatte.

iGaming-Betreiber, die Personalisierungs-Agents für Spielersitzungen einsetzen, befinden sich in einer besonders heiklen Lage. Wenn jede Spielersitzung Bedrock-Aufrufe unter einer gemeinsamen Rolle auslöst, hat man Gesamtkosten, aber kein Signal pro Kohorte. Regulierungsbehörden in mehreren europäischen Märkten fragen bereits nach algorithmischer Personalisierung gegenüber High-Value-Spielern. „Wir können nicht sagen, was welche Sitzungen kosten" ist nicht die Antwort, die Compliance hören möchte.

Fintech-Teams, die Bedrock für Transaktionsprüfung oder Support-Automatisierung nutzen, gewinnen hier echten Audit-Mehrwert. Die rollenbasierte Zuordnung in Cost Explorer ermöglicht es, Modellausgaben Produktlinien für die interne Kostenzuordnung zuzuordnen – etwas, das jedes Multi-Produkt-Fintech bisher mit Tabellenkalkulationen simuliert hat.

Die unbequeme Lesart: Agenturen und SaaS-Anbieter, die intransparente KI-Kosten an Kunden weitergegeben haben, sehen sich nun Kunden gegenüber, die die zugrunde liegenden Token-Einzelposten einsehen können, wenn sie eine gemeinsame Account-Struktur nutzen. Margenkompression kommt.

Playbook für Performance Marketing

Maßnahmen für die nächsten zwei Wochen, nach Priorität geordnet.

Erstens: Prüfe die IAM-Rollenstruktur für jede Bedrock-aufrufende Workload. Wenn eine einzige Rolle mehrere Kampagnen, Anwendungen oder Mandanten bedient, trenne sie, bevor die Attribution aktiviert wird. Andernfalls sind die neuen Daten im Cost and Usage Report nur aggregiertes Rauschen mit zusätzlichen Spalten.

Zweitens: Den FinOps Agent in einem Nicht-Produktions-Account aktivieren und auf Ad-Serving- und Bidding-Workloads richten. Zwei Wochen nach Zeitplan laufen lassen. Das Ziel ist nicht, jede Empfehlung umzusetzen. Das Ziel ist zu sehen, welche Anomalien er erkennt, die das bestehende Alerting verpasst, und wie oft er inaktive Ressourcen aufdeckt, die vergessen wurden. AWS hat die Empfehlungen für inaktive Ressourcen in diesem Release verdoppelt, sodass die Fläche für einfache Gewinne gewachsen ist.

Drittens: Die Jira-Integration des Agents mit demselben Board verknüpfen, das das Plattform-Team für Incidents nutzt. Kein separates FinOps-Board erstellen. Kostenprobleme in einer Seitenleiste werden ignoriert. Kostenprobleme, die den Sprint blockieren, werden behoben.

Viertens: Savings Plans-Abdeckungsziele in der Console für die Basiskompute festlegen. Das neue Target Planning-Feature entfernt den Tabellenkalkulationsschritt. Wer stabiles Ad-Serving-Infrastruktur betreibt und es on-demand lässt, zahlt auf einem 10-köpfigen Team jährlich das Budget von zwei Engineers drauf.

Fünftens: Für Teams, die attributionsseitige Tools wie die Privacy Sandbox Attribution Reporting API zusammen mit Bedrock-gestützter Modellierung einsetzen: Die Bedrock-Workloads mit denselben Kampagnen-Identifikatoren taggen, die downstream verwendet werden. End-to-End-Cost-per-Conversion wird damit zu einer Abfrage, nicht zu einem Quartalsprojekt.

Wichtigste Erkenntnisse

Der AWS FinOps Agent ist by Design rein lesend und leitet Anomaliebefunde und Optimierungsempfehlungen in Jira weiter, anstatt Änderungen auszuführen. Die richtige Architekturentscheidung.
Bedrock weist Token-Nutzung nun IAM-Rollen zu, mit Eingabe- und Ausgabe-Tokens auf Einzelpostenebene im Cost and Usage Report. Rollendisziplin ist jetzt eine Abrechnungsanforderung, keine Hygienepräferenz.
Savings Plans Target Planning, verdoppelte Empfehlungen für inaktive Ressourcen und automatische Ursachenerklärungen verlagern Console-seitiges FinOps von Tabellenkalkulationen in die AWS-Oberfläche.
Credit-Level-Sharing-Kontrollen und die neue Credit-Transparenzansicht sind wichtig für jede Organisation mit Multi-Account-Strukturen und verhandelten AWS-Credits, insbesondere für Agenturen und Plattformen.
Performance-Marketing-Teams mit LLM-Stacks sollten gemeinsam genutzte Bedrock-IAM-Rollen in diesem Sprint aufteilen, bevor sie die Attribution aktivieren. Aggregierte Daten sind keine handlungsrelevanten Daten.

Häufig gestellte Fragen

F: Was ist der AWS FinOps Agent und was kann er tatsächlich?

Es ist ein KI-gestütztes Tool in der Public Preview, das Cloud-Ausgaben analysiert, Anomalien untersucht, benutzerdefinierte Berichte erstellt und Optimierungsempfehlungen per Natural-Language-Abfragen ausgibt. Es integriert sich mit Jira und nutzt CloudTrail, um Kostenänderungen auf bestimmte Benutzer oder Rollen zurückzuführen. Es führt keine Infrastrukturänderungen automatisch aus.

F: Wie funktioniert die neue Bedrock-Kostenzuordnung?

Bedrock ordnet die Nutzung nun IAM-Rollen oder Benutzern zu und zeigt, welches Modell aufgerufen wurde und welche Kosten pro Sitzung entstanden sind. Diese Daten fließen in AWS Cost Explorer und den Cost and Usage Report, mit Eingabe- und Ausgabe-Token-Zählungen auf Einzelpostenebene. Die Voraussetzung für nützliche Granularität ist die Zuweisung eigener IAM-Rollen pro Anwendung oder Agent.

F: Sollten Performance-Marketing-Teams dies sofort einführen?

Ja, für die Bedrock-Attribution – mit dem Vorbehalt, dass zuerst gemeinsam genutzte IAM-Rollen umstrukturiert werden sollten. Den FinOps Agent lohnt es sich, zwei Wochen lang in einem Nicht-Produktions-Account zu pilotieren, um zu sehen, welche Anomalien er erkennt, bevor er in das Haupt-Jira-Board integriert wird. Savings Plans Target Planning ist ein schneller Gewinn für jedes Team mit stabiler Ad-Infrastruktur.

Alex Drover

RiverCore Analyst · Dublin, Ireland

// RELATED ARTICLES

PubMatic öffnet programmatische CTV-Pipeline für unabhängige Creator

PubMatic hat eine direkte Verbindung zwischen unabhängigen CTV-Creatorn und agentischen Werbebudgets geschaffen. MeatEater ist der erste Partner. So sieht die Infrastruktur dahinter aus.

EA startet In-Game-Werbeplattform für 120 Millionen Spieler

EA hat ein stadiongroßes Werbeinventar auf Konsole, Mobile und PC eröffnet. Was die Plattform für Performance-Marketer und Ad-Tech-Teams wirklich bedeutet.

Brasiliens 318-Milliarden-Dollar-Kryptomarkt als Geldwäsche-Tatort

Brasilien verarbeitete 318 Milliarden Dollar On-Chain-Volumen in einem Jahr – 80 % des Schwarzgelds floss durch nur fünf Adressen. Die Zentralbank schließt jetzt die Schleusen.