Pinterest AWS dealvisual searchAI infrastructurePinterest $4 billion AWS silicon investmentAWS custom silicon AI models

Pinterest setzt $4 Mrd. auf AWS-Silicon für seine KI-Zukunft

6 Jun 20267 Min. LesezeitJames O'Brien

// IN DIESEM ARTIKEL

01Was passiert ist 02Technische Anatomie 03Wer verliert 04Handlungsempfehlungen für die KI-Entwicklung 05Wichtigste Erkenntnisse 06Häufig gestellte Fragen

Stellen Sie sich einen Güterbahnhof vor. Seit fünfzehn Jahren lädt Pinterest Container auf AWS-Schienen – zunächst langsam, dann auf einmal alles. Diese Woche unterzeichnete das Unternehmen den größten Frachtvertrag seiner Geschichte, und die Fracht sind keine hübschen Pins mehr. Es sind Vision-Language-Modelle, Konversationsagenten und die Rechenkapazität, um sie für 600 Millionen Menschen monatlich zu betreiben.

Der Deal ist bis 2031 vier Milliarden Dollar wert. Das Interessante ist nicht die Zahl. Es ist das, was Pinterest auf diese Schienen legt.

Was passiert ist

Pinterest verpflichtete sich zu einem geplanten Investitionsvolumen von 4 Milliarden Dollar in AWS bis 2031 – die größte Infrastrukturinvestition in der Unternehmensgeschichte, wie About Amazon berichtete. Die beiden Unternehmen arbeiten seit 2010 zusammen, daher ist dies weniger eine neue Partnerschaft als vielmehr eine sehr teure Erneuerung der Gelübde.

Die Art der Verpflichtung ist wichtiger als die Dollarsumme. Pinterest verankert seinen KI-Stack auf Amazons Custom Silicon: AWS Trainium für das Training und den Betrieb der großen Sprach- und Vision-Language-Modelle hinter der personalisierten visuellen Suche sowie Graviton für allgemeine Rechenaufgaben. Graviton treibt bereits etwa ein Drittel der Compute-Flotte von Pinterest an, und das Unternehmen plant, es auf weitere Discovery-Systeme auszuweiten, die bestimmen, was 600 Millionen monatliche Nutzer zu sehen bekommen.

Auf der Produktseite ist die Wette bereits aufgeladen. Pinterest Assistant, die neue Multi-Turn-Konversationserfahrung des Unternehmens für die Entdeckung von Inhalten, läuft auf Open-Source-Vision-Language-Modellen, die für Skalierung optimiert sind. Dahinter steht der proprietäre Taste Graph – die Engine, die ein vages „Ich möchte meine Küche renovieren" in eine klickbare, kaufbare Kaskade von Pins verwandelt. Pinterest hat den Übergang von traditionellen Retrievalmethoden zu transformerbasierten generativen Modellen vollzogen, und dieser Vertrag finanziert den nächsten Abschnitt dieser Reise.

Im Kleingedruckten der Pressemitteilung steckt noch eine leisere Modernisierung. Pinterest migriert von einem klassischen EC2-Footprint zu einer Kubernetes-basierten Architektur auf Amazon EKS. Die Argumentation ist das übliche Dreigespann: Entwicklergeschwindigkeit, Betriebszuverlässigkeit und Infrastruktureffizienz. Wer schon einmal eine riesige EC2-Flotte auf EKS migriert hat, weiß: Der langweilige Teil ist der, wo das echte Geld steckt.

Pinterest-CTO Matt Madrigal formulierte es als „Compute-Flexibilität, Hardware-Optionalität und Infrastruktureffizienz" – was in Unternehmenssprache bedeutet: Wir wollen Wahlmöglichkeiten, und wir wollen sie günstig. AWS-Manager Dave Brown konterte mit der Aussage, AWS sei „der beste Ort für KI in diesem Maßstab." Natürlich.

Technische Anatomie

Wenn man die Ankündigung auf das Wesentliche reduziert, sieht man, was Pinterest wirklich kauft. Drei Dinge, aufeinander gestapelt.

Die unterste Schicht ist die Silicon-Strategie. Trainium für die schweren KI-Workloads, Graviton für den langen Schwanz CPU-gebundener Serving-Aufgaben. Damit steigt Pinterest für einen erheblichen Teil seiner Inferenz und seines Trainings aus dem Nvidia-Bieterkampf aus. Trainium ist kein Allheilmittel – wer schon einmal versucht hat, einen heiklen PyTorch-Graphen auf das Neuron SDK zu portieren, kennt die scharfen Kanten des Toolchains – aber bei diesem Verpflichtungsumfang beginnen die Stückkosten den Migrationsschmerz zu überwiegen. Graviton treibt heute bereits etwa ein Drittel der Rechenkapazität an und wird weiter ausgebaut. Das zeigt, dass Pinterests Plattformteam die harte ARM-Portierungsarbeit auf der CPU-Seite bereits erledigt hat. Man vertraut dem Chip.

Die mittlere Schicht ist die Modelltopologie. Pinterest betreibt Open-Source-Vision-Language-Modelle für Pinterest Assistant, während es weiterhin proprietäre Modelle gegen den Taste Graph trainiert. Das ist die richtige Struktur für diese Kategorie. Die Konversationsschicht kann auf einem feinabgestimmten Open-Weights-Modell laufen – der Art, die Teams von Hugging Face beziehen und auf ihre Domäne zuschneiden. Die Retrieval- und Ranking-Mechanik, in der Pinterests eigentlicher Burggraben liegt, bleibt proprietär. Den Taste Graph lagert man nicht aus.

Die oberste Schicht ist die Orchestrierungsgeschichte: EKS. Die Migration von Legacy-EC2-Mustern auf Kubernetes ist der Teil, an dem alles scheitert, wenn man nicht die nötige Plattformdisziplin hat. Pinterest baut das vermutlich so, dass ML-Serving, Batch-Trainingsjobs und herkömmlicher Webtraffic dieselben Scheduling-Primitive teilen. So bewegen sich Entwicklergeschwindigkeitskennzahlen tatsächlich. Die Alternative – drei separate Plattformen mit drei On-Call-Rotationen – ist der Weg, auf dem mittelgroße Startups mit 800 Ingenieuren und einem Deployment-Prozess enden, der eine Woche dauert.

Der Deal deckt ausdrücklich Training, Inferenz und Plattforminfrastruktur ab. Übersetzt: Das ist kein bloßer GPU-Mietvertrag. Er umfasst den Data Lake (bereits einer der größten auf AWS), die Modell-Serving-Flotte und das zugrunde liegende Kubernetes-Substrat. Ein Ansprechpartner, sechs Jahre lang.

Wer verliert

Der offensichtliche Verlierer ist Nvidia – aber nur teilweise. Pinterest wird GPUs noch irgendwo im Stack einsetzen; kein ernsthafter KI-Anbieter betreibt heute reines Trainium. Das Signal ist jedoch: Ein weiterer Hyperscaler-Kunde mit echtem Workload-Gewicht verpflichtet Kapital für Amazon-Silicon über sechs Jahre. Wenn Trainium-Erfolgsgeschichten aufhören, Demo-Charakter zu haben, und zu Multimilliarden-Dollar-Verträgen werden, verschiebt sich die Verhandlungsposition in jedem CFO-Büro.

Der interessantere Verlierer sind Pinterests direkte Konkurrenten in der visuellen Entdeckung und Shopping-Inspiration. Wer schon einmal beobachtet hat, wie ein kleineres Retail-Discovery-Startup versucht, ein transformerbasiertes Ranking-System auf Handelmargen zu finanzieren, kennt die brutale Mathematik dahinter. Pinterest hat sich Kostensicherheit und Hardware-Optionalität bis 2031 gesichert. Kleinere Anbieter, die multimodales Retrieval auf wackeligen GPU-Verträgen betreiben, können mit dieser Reichweite nicht mithalten.

Die dritte betroffene Gruppe: Legacy-Ad-Tech-Anbieter, die in Pinterest integriert sind. Die Pressemitteilung erwähnt ausdrücklich die „Verbesserung der Advertiser-Performance" durch den Ausbau proprietärer und Open-Source-Modelle. Wenn die Plattform selbst besser darin wird, Intent und Inventar zusammenzuführen, schrumpft der Wert von Drittanbieter-Targeting-Middleware. Wer Lookalike-Modellierung oder Creative-Optimization an Pinterest verkauft, sollte in den nächsten 90 Tagen genau prüfen, wo man im Stack steht, wenn Pinterest Assistant die Entdeckung direkt vermittelt.

Und dann ist da noch Google. Visuelle Suche war historisch das Terrain von Google Lens, unterstützt durch Geminis multimodale Fähigkeiten, die in den Gemini API-Dokumentationen beschrieben sind. Pinterest, das ein konversationelles, vision-sprachliches Entdeckungsprodukt aufbaut und dabei ernsthaftes Infrastrukturkapital einsetzt, greift den Teil von Googles Geschäft an, der Shopping-Intent monetarisiert. Pinterest muss die Suche nicht gewinnen. Es muss nur „Ich plane meine Küche" und „Zeig mir ähnliche Outfits" für ein paar hundert Millionen Menschen gewinnen. Das ist allein schon ein milliardenschwerer Werbemarkt.

Handlungsempfehlungen für die KI-Entwicklung

Drei konkrete Schritte, wenn Sie Platform Lead oder CTO sind und das hier lesen.

Erstens: Rechnen Sie die Trainium-Kalkulation ordentlich durch. Die meisten Teams haben AWS Custom Silicon vor zwei Jahren abgeschrieben, weil das Tooling noch rau und die Benchmarks dünn waren. Das ist keine verantwortungsvolle Antwort mehr. Wenn Pinterest bereit ist, 4 Milliarden Dollar an Training und Inferenz darüber laufen zu lassen, sollte Ihr Inferenz-Kostenmodell zumindest ein Trainium-Szenario enthalten. Selbst wenn Sie nicht migrieren, wird das Angebot, das Sie zurückbekommen, in Ihrer Nvidia-Verhandlung nützlich sein.

Zweitens: Ziehen Sie die Grenze zwischen proprietären und Open-Weights-Modellen klar – so wie Pinterest es getan hat. Konversationsschicht: Open Source, fein abgestimmt, austauschbar. Ranking und Retrieval, das Ihre einzigartigen Daten kodiert: proprietär, im eigenen Besitz. Teams, die alles besitzen wollen, verbrennen Kapital. Teams, die alles auslagern, werden zu austauschbaren Wrappern. Die Aufteilung, zu der sich Pinterest öffentlich bekennt, ist die richtige Grundeinstellung.

Drittens: Wenn Sie noch eine maßgeschneiderte EC2- oder VM-basierte Serving-Flotte für ML betreiben, ist die EKS-Migrationsgeschichte der Teil, den Sie sich abschauen sollten. Vereinen Sie Training, Batch und Serving auf einem einzigen Scheduling-Substrat, bevor Ihre Modellanzahl explodiert. Das nachträglich mit vierzig Produktionsmodellen zu tun ist ungefähr zehnmal schwerer als es jetzt zu tun.

Eine Nicht-Handlung: Lesen Sie diesen Deal nicht als generelle Empfehlung für „KI at scale". Pinterest hat ein spezifisches Produkt (visuelle Entdeckung), ein spezifisches Daten-Asset (Taste Graph) und eine spezifische Kundenbasis, die primär mit Bildern interagiert. Die Infrastrukturentscheidungen folgen daraus. Den Vertrag zu kopieren, ohne die Produktklarheit zu kopieren, ist der Weg, ein Budget zu verschwenden.

Wichtigste Erkenntnisse

Pinterests $4-Milliarden-Verpflichtung gegenüber AWS bis 2031 ist der größte Infrastruktur-Deal in seiner Geschichte und verlängert eine Partnerschaft, die bis 2010 zurückreicht.
Die Wette basiert auf AWS Custom Silicon: Trainium für LLM- und Vision-Language-Model-Workloads, Graviton wird über das bereits betriebene Drittel der Rechenkapazität hinaus ausgebaut.
Pinterest Assistant, ein Multi-Turn-Konversationsprodukt zur Inhaltsentdeckung, läuft auf Open-Source-Vision-Language-Modellen, während der proprietäre Taste Graph im Haus bleibt.
Eine parallele Migration von EC2 zu Amazon EKS ist die unscheinbare Hälfte des Deals und ist für die Engineering-Velocity wahrscheinlich wichtiger als die Silicon-Schlagzeilen.
Das Signal an den Markt: Ein weiterer Hyperscaler-Kunde mit realen Workloads verpflichtet mehrjähriges Kapital für Amazon-Silicon – das verändert die Ausgangslage in jeder KI-Infrastrukturverhandlung, die folgt.

Zurück zum Güterbahnhof. Pinterest hat gerade sechs weitere Jahre Gleise, maßgeschneiderte Lokomotiven und ein neues Weichensystem unterzeichnet. Die Fracht hat sich verändert, das Ziel hat sich verändert, aber die Schienen sind dieselben, die 2010 verlegt wurden. Manchmal ist der mutigste Schritt in der KI, sich zu dem Partner zu bekennen, der bereits weiß, wo alle Ihre Daten liegen.

Häufig gestellte Fragen

F: Warum setzt Pinterest auf AWS Trainium statt auf Nvidia-GPUs?

Pinterest verfolgt, was sein CTO als „Compute-Flexibilität und Hardware-Optionalität" bezeichnet. Trainium bietet bei mehrjährigen Verpflichtungen kalkulierbarere Preise und reduziert die Abhängigkeit von der angespannten Nvidia-Lieferkette. Pinterest wird GPUs wahrscheinlich weiterhin für Teile seines Stacks verwenden, aber Trainium übernimmt die LLM- und Vision-Language-Model-Workloads hinter der personalisierten visuellen Suche.

F: Was ist Pinterest Assistant und wie funktioniert er?

Pinterest Assistant ist ein Multi-Turn-Konversationsprodukt zur Inhaltsentdeckung, das auf Pinterests visueller Sucherfahrung aufbaut. Er wird von Open-Source-Vision-Language-Modellen angetrieben, die für Skalierung optimiert sind, und liegt über Pinterests proprietärem Taste Graph, um konversationellen Intent in personalisierte, visuelle Ergebnisse zu übersetzen.

F: Was ändert die EKS-Migration konkret für Pinterest?

Pinterest wechselt von traditionellen EC2-basierten Umgebungen zu einer Kubernetes-basierten Architektur auf Amazon EKS. Die erwarteten Vorteile sind schnellere Entwicklergeschwindigkeit, bessere Betriebszuverlässigkeit und verbesserte Infrastruktureffizienz – zusammen ermöglichen sie Pinterest, Training-Jobs, Modell-Serving und herkömmliche Web-Workloads auf einer einzigen Plattform zu vereinen.

James O'Brien

RiverCore Analyst · Dublin, Ireland

// ÄHNLICHE ARTIKEL