AI cloud cost optimizationcloud spendAI infrastructurereduce enterprise AI cloud billsLLM cost management tools

PointFive sammelt 60 Mio. Dollar ein, um unkontrollierte KI-Cloud-Kosten zu stoppen

10 Jun 20267 Min. LesezeitAlex Drover

// IN DIESEM ARTIKEL

01Was passiert ist 02Technische Analyse 03Wer betroffen ist 04Handlungsempfehlungen für die KI-Entwicklung 05Wichtigste Erkenntnisse 06Häufig gestellte Fragen

Jeder Platform Lead, der im letzten Jahr ein LLM-Feature ausgeliefert hat, kennt denselben Horrorfilm: ein Grafana-Panel, das zeigt, wie die Token-Ausgaben steil ansteigen, während der Produktnutzen flach bleibt. PointFive Inc. hat gerade 60 Millionen Dollar auf die Wette gesammelt, dass Tausende von Finance-Teams dieses Diagramm bald kritisch hinterfragen werden. Die Runde, angeführt von Accel, bewertet das New Yorker Startup mit 500 Millionen Dollar.

Was passiert ist

PointFive schloss eine 60-Millionen-Dollar-Runde unter der Führung von Accel ab, an der auch Index Ventures, Entre Capital, Perpetual Growth, Vesey Ventures, Sheva Ventures und Salesforce Ventures beteiligt sind. Wie SiliconANGLE berichtete, bringt der Deal das Gesamtfunding auf 96 Millionen Dollar und bewertet das Unternehmen mit 500 Millionen Dollar – genau auf halbem Weg zum Unicorn. Der Name PointFive ist eine Anspielung auf den Anspruch des Unternehmens, die Cloud-Rechnungen seiner Kunden zu halbieren.

Das 2023 von Aron Arvatz, Gal Ben David und Amir Hozez gegründete Team ist im Enterprise-Software-Bereich kein Neuling. Die drei haben zuvor IntSights Cyber Intelligence aufgebaut, das Rapid7 im Jahr 2021 für rund 335 Millionen Dollar übernommen hat. PointFive gründeten sie, nachdem sie während der Integration von IntSights in Rapid7 verschwenderische Cloud-Ausgaben beobachtet hatten.

Die von ihnen geteilten Wachstumszahlen sind die Art, die VCs schnell zum Unterschreiben bringt. Der jährlich wiederkehrende Umsatz (ARR) hat sich im letzten Jahr versechsfacht. Bestandskunden haben ihre Ausgaben im Durchschnitt verdoppelt. Arvatz sagt, das Unternehmen sei auf dem Weg, den Umsatz in diesem Jahr zu verfünffachen. Zu den Kunden zählen der deutsche Energieversorger E.ON, die brasilianische Neobank Nubank und Fanatics, der US-amerikanische Sportartikel- und Glücksspielanbieter. Nubank soll seine PointFive-Ausgaben innerhalb von zehn Tagen wieder hereingeholt haben.

Parallel zur Finanzierung hat PointFive am 8. Juni TokenShift gestartet, einen Service zur Verfolgung und Steuerung des internen KI-Tool-Einsatzes. Das neue Kapital finanziert die Expansion nach Europa und Israel sowie rund 40 neue Einstellungen in Marketing und F&E. Bemerkenswert: Der ursprüngliche Plan sah 80 Einstellungen vor. Sie haben diese Zahl halbiert, weil sie intern ihre eigenen KI-Tools einsetzen.

Technische Analyse

Die FinOps-Kategorie ist überfüllt, daher ist die interessante Frage, was PointFive tatsächlich anders macht. Basierend auf der Beschreibung des Unternehmens integriert sich die Plattform direkt in die Cloud-Umgebungen der Kunden und läuft kontinuierlich, um Infrastruktur auf Verschwendung zu scannen. Die üblichen Verdächtigen: inaktive Server, ungenutzter Speicher, überdimensionierte Instanzen. Die KI-spezifische Komponente ist der Punkt, an dem die Argumentation schärfer wird.

Zwei Muster sind entscheidend. Das erste ist Memory- und Context-Bloat. Teams stopfen immer größere Kontextfenster in jede Anfrage, weil mehr Kontext sicherer erscheint. Das stimmt nicht. Überdimensionierter Kontext verschlechtert die Latenz und verbrennt Token linear mit der Eingabegröße. Der Mehrwert von PointFive liegt hier im Wesentlichen darin, Prompt- und Retrieval-Pipelines auf Verschwendung zu prüfen – ähnlich wie ein APM-Tool N+1-Datenbankabfragen markiert. Wer produktiven RAG-Betrieb kennt, weiß, wie verlockend es ist, die gesamte Wissensbasis in den Kontext zu laden, anstatt das Retrieval zu optimieren. Diese Gewohnheit schlägt sich auf der Rechnung nieder.

Das zweite Muster sind Always-on-Agents. Hintergrund-Agents, die pollen, überwachen oder vorberechnen, sind die neuen Cron-Jobs – nur dass jeder Tick durch API-Aufrufe bei Anbietern wie OpenAI oder Anthropic echtes Geld kosten kann. Produktionsvorfälle, die ich mit geplanten Jobs erlebt habe, lassen sich fast immer darauf zurückführen, dass jemand vergessen hat, dass sie existieren. Bei Agents ist dieses Vergessen mit einem Token-Zähler verbunden.

Die Empfehlungs-Engine von PointFive schlägt Berichten zufolge auch günstigere Modelle für bestimmte Aufgaben vor. Das ist das Routing-Problem in verkleideter Form. Nicht jede Klassifizierung braucht ein Frontier-Modell. Ein gut abgestimmtes kleineres Modell oder sogar ein fein angepasstes Open-Weight-Modell von Hugging Face kann die Kosten pro Aufruf um eine Größenordnung senken. Das Schwierige ist zu wissen, welche Aufrufe sicher herabgestuft werden können, ohne die Genauigkeit zu beeinträchtigen. Genau dort verdient die Positionierung als „Effizienz-Coach" ihren Wert – sofern die Empfehlungen akkurat sind.

Das neue Produkt TokenShift greift die interne Tool-Seite an: Es verfolgt, welche Mitarbeiter und welche Workflows Token verbrauchen. Accels Philippe Botteri bezeichnet das zugrunde liegende Problem als „Tokenmaxxing" – Unternehmen treiben Kosten in die Höhe, indem sie KI-Token ohne klaren ROI verbrauchen. Meta-CTO Andrew Bosworth sprach das Offensichtliche in einem April-Memo an seine Mitarbeiter aus: „Niemand sollte KI-Tools nur um des Einsatzes willen verwenden. Nicht jede Aktivität ist Fortschritt, und Token-Nutzung allein ist kein Maßstab für Wirkung irgendwelcher Art."

Wer betroffen ist

Die am stärksten gefährdeten Unternehmen sind derzeit mittelgroße Scale-ups, die in den letzten 18 Monaten KI überall eingesetzt haben, ohne ein Chargeback-Modell zu haben. Engineering hat Copilot aktiviert, Support hat einen LLM-Autoresponder eingeführt, Marketing hat Content-Pipelines angeschlossen – und niemand ist für die Rechnung verantwortlich. Wenn Finance fragt, wer eine sechsstellige monatliche Anthropic-Rechnung genehmigt hat, lautet die Antwort: „irgendwie alle."

iGaming-Betreiber sind besonders exponiert. Personalisierungs-Engines, Fraud-Scoring, KYC-Zusammenfassungen und Kundensupport-Bots greifen alle auf dieselben Anbieter-Accounts zu, oft ohne teamspezifische Zuordnung. Teams, mit denen ich bei europäischen Betreibern zusammengearbeitet habe, hatten eine saubere Kostenzuordnung für ihre Datenbank- und Kubernetes-Ausgaben, fassten aber alle Modellaufrufe in einem gemeinsamen API-Key zusammen. Das ist ein Budget-Blindspot in der Größe eines kleinen Produktteams.

Fintech ist das nächste Segment, das es zu spüren bekommt. Nubanks Geschichte der Amortisation in zehn Tagen wird sich schnell in CFO-Netzwerken verbreiten. Wenn eine Neobank mit starker Engineering-Disziplin noch so viel Verschwendung zu beseitigen hatte, sitzt jede Retail-Bank, die Piloten betreibt, auf noch größeren Lücken. Arvatz merkte an, dass größere Unternehmen jährlich Millionen für unnötige Ressourcen ausgeben. Das entspricht dem Budget von zwei Senior-Engineers pro Monat – für Infrastruktur, die niemand tatsächlich nutzt.

Die unbequeme Einschätzung: Die FinOps-Kategorie selbst wird sich schnell füllen. PointFive ist gut finanziert und hat echte Referenzkunden, aber jeder Hyperscaler wird innerhalb von zwölf Monaten native KI-Kostenanalysen in seine Konsolen integrieren. Das Startup-Fenster sind die nächsten zwei Jahre. Danach wird dies ein Feature sein, kein Produkt – es sei denn, TokenShift und ähnliche Tools finden eine verteidigbare Nische bei anbieter- und cloudübergreifender Zuordnung.

Meine Einschätzung: PointFives Einstellungsentscheidung verrät mehr über den Markt als die Finanzierungsrunde. Die geplanten Einstellungen von 80 auf 40 zu halbieren, weil die eigene KI-Tooling die Arbeit übernommen hat, ist entweder eine echte Produktivitätsgeschichte oder eine Absicherung gegen dieselbe Nachfrageschwäche, die sie selbst verkaufen. Wahrscheinlich beides.

Handlungsempfehlungen für die KI-Entwicklung

Wenn Sie ein KI-gestütztes Produkt betreiben, nehmen Sie diese drei Schritte diese Woche vor, bevor Sie einen Anbieter evaluieren.

Erstens: Markieren Sie jeden Anbieter-API-Key nach Team und Feature. Ein einziger gemeinsamer Key für die gesamte Organisation ist das FinOps-Äquivalent zum Betrieb als Root in der Produktion. Sie können nicht optimieren, was Sie nicht zuordnen können. Wenn Ihr Anbieter projektbezogene Keys unterstützt, nutzen Sie diese noch heute.

Zweitens: Prüfen Sie Ihre Kontextfenster. Ziehen Sie eine Woche Produktions-Prompts und messen Sie die durchschnittliche Eingabe-Token-Anzahl im Vergleich zum minimal erforderlichen Kontext. Die meisten Teams stellen fest, dass sie zwei- bis fünfmal mehr Kontext senden als die Aufgabe erfordert. Das zu reduzieren ist kostenloses Geld ohne Modelländerung.

Drittens: Inventarisieren Sie Ihre Agents und geplanten KI-Jobs. Jeder Always-on-Agent braucht einen Verantwortlichen, einen Kill-Switch und eine monatliche Überprüfung. Wenn niemand erklären kann, was ein Agent in diesem Quartal tut, schalten Sie ihn ab und sehen Sie, wer sich beschwert. Produktionsvorfälle mit verwaisten Hintergrund-Jobs folgen demselben Muster: günstig zu ignorieren, bis sie es nicht mehr sind.

Für Platform Leads, die PointFive oder Wettbewerber evaluieren: Fordern Sie einen Pilot, der sich in 90 Tagen schriftlich amortisiert. Nubanks Zehn-Tage-Behauptung setzt die Messlatte. Alles Langsamere bedeutet, dass der Anbieter Dashboards verkauft, keine Einsparungen. Und fragen Sie vor der Unterzeichnung, ob das Tool anbieterübergreifendes Routing oder nur einen einzigen Hyperscaler abdeckt. Single-Cloud-FinOps in einer Multi-Modell-Welt ist eine halbe Lösung.

Wichtigste Erkenntnisse

PointFive sammelte 60 Millionen Dollar bei einer Bewertung von 500 Millionen Dollar ein und brachte das Gesamtfunding auf 96 Millionen Dollar – auf Basis eines 6-fachen ARR-Wachstums.
Das „Tokenmaxxing"-Problem ist real: Unternehmen verbrennen jährlich Millionen für inaktiven Kontext, überdimensionierte Modelle und Always-on-Agents, die niemandem gehören.
Nubanks berichtete Amortisation in zehn Tagen setzt einen neuen Maßstab für FinOps-ROI-Versprechen. Fordern Sie ähnliche Konditionen von jedem Anbieter.
Die geplanten Einstellungen von 80 auf 40 durch internen KI-Einsatz zu halbieren ist die glaubwürdigste Produktdemo, die PointFive liefern konnte.
Hyperscaler werden grundlegende KI-Kostenanalysen innerhalb eines Jahres absorbieren. Das verteidigbare Spiel ist die anbieter- und cloudübergreifende Zuordnung und das Routing – dort muss TokenShift punkten.

Häufig gestellte Fragen

F: Was macht PointFive eigentlich?

PointFive integriert sich in Cloud-Umgebungen und scannt kontinuierlich nach verschwendeten Ausgaben, einschließlich inaktiver Server, ungenutzten Speichers, überdimensionierter KI-Kontextfenster und ineffizienter Modellauswahl. Das System empfiehlt dann Optimierungen und positioniert sich als „Effizienz-Coach" für Engineering-Teams. Das neu gestartete Produkt TokenShift verfolgt und steuert den internen KI-Tool-Einsatz.

F: Warum sind KI-Infrastrukturkosten plötzlich ein 60-Millionen-Dollar-Problem?

Unternehmen haben KI-Adoption in den letzten zwei Jahren stark vorangetrieben, ohne teamspezifische Kostenzuordnung – was zu dem führt, was Accel-Partner Philippe Botteri „Tokenmaxxing" nennt. Meta-CTO Andrew Bosworth thematisierte dasselbe Problem intern im April und warnte Mitarbeiter, KI-Tools nicht nur um des Einsatzes willen zu nutzen. Das Kostenwachstum hat die Governance in den meisten großen Organisationen überholt.

F: Kann sich PointFive gegen hyperscaler-native FinOps-Tools behaupten?

Kurzfristig ja, weil AWS-, Azure- und Google Cloud-Kosten-Dashboards bei KI-spezifischer Verschwendung schwach bleiben und keine anbieterübergreifende Sicht bieten. Langfristig liegt der verteidigbare Vorteil in der cloud- und modellübergreifenden Zuordnung und Routing-Empfehlungen. Wenn TokenShift und ähnliche Tools das liefern, bleibt PointFive relevant. Wenn nicht, wird es zur Akquisitions-Beute.

Alex Drover

RiverCore Analyst · Dublin, Ireland

// ÄHNLICHE ARTIKEL