OpenAIs Custom-Chip-Leiter wechselt vor IPO zu Anthropic
Die Frage, die sich jeder Plattform-Verantwortliche mit einer mehrjährigen KI-Infrastruktur-Verpflichtung diese Woche stellen sollte, ist, ob OpenAIs Custom-Silicon-Roadmap einen Pre-IPO-Talentabgang übersteht. Clive Chan, der sich selbst als zweite Hardware-Einstellung in OpenAIs Chip-Programm bezeichnet, hat gerade bekannt gegeben, dass er zu Anthropic wechselt. Er behielt seinen Titel (Member of Technical Staff) und wechselte seinen Arbeitgeber – ein sehr spezifisches Signal dafür, wohin sich der Schwerpunkt in der KI-Hardware verschiebt.
Dies ist kein Abgang auf Junior-Ebene. Es handelt sich um die Person, die da war, bevor es überhaupt ein Team gab – die das Team, das sie mitaufgebaut hat, verlässt, um bei dem Unternehmen ein ähnliches Team aufzubauen, das direkt um dieselben TSMC-Kapazitäten, dieselben Packaging-Slots und dieselben Compiler-Ingenieure konkurriert.
Was geschehen ist
Chan veröffentlichte auf X ein sogenanntes „Personal update" und bestätigte, dass er OpenAI nach rund 2,4 Jahren verlassen hat und diese Woche zu Anthropic gewechselt ist. Wie The Times of India berichtete, kam er im Januar 2024 zu OpenAI, nachdem er zweieinhalb Jahre bei Tesla als Senior Software Engineer im Autopilot-Deep-Learning-Infrastruktur-Team tätig war und dort an Dojo mitgearbeitet hatte.
In seinem Post schrieb Chan: „Ich habe mich entschieden, OpenAI zu verlassen. Ich bin stolz darauf, Teil des Custom-Chip-Programms gewesen zu sein, und dankbar für alle, mit denen ich bauen und von denen ich lernen durfte." Er lobte außerdem ausdrücklich das Team, das er verlässt: „Die Dichte an Hardware-Talenten in diesem Team ist außergewöhnlich, und ich glaube nicht, dass es irgendwo ein besseres Chip-Design-Team gibt." Über Anthropic sagte er, er sei „tief beeindruckt von den Talenten, Werten und dem Ehrgeiz des Teams."
Seine Arbeit bei Tesla umfasste nach eigener Beschreibung: „Machine-Learning-Training-ASIC: Software-Framework-Bring-up, Rechenzentrum-Codesign, energieeffiziente Zahlenformate, wöchentliche Meetings mit dem CEO." Das ist keine einzelne Disziplin. Das ist der vollständige Stack zwischen Transistor und Training-Loop. Tesla stellte Dojo 2021 vor, installierte das erste System 2022 mit rund 3.000 von TSMC gefertigten D1-Chips, und hat seitdem leitende Mitarbeiter verloren: Ganesh Venkataramanan, Senior Director of Autopilot und Dojo-Projektleiter, schied Anfang Dezember aus, und Teslas Head of AI Infrastructure Tim Zaman gab etwa eine Woche später seinen Wechsel zu Google DeepMind bekannt.
OpenAI wiederum steuert auf einen IPO zu. Eine grundlegende Hardware-Einstellung an den engsten Modell-Konkurrenten zu verlieren – wenige Quartale vor einem S-1-Filing – ist genau die Art von Detail, die Banker bemerken.
Technische Analyse
Um zu verstehen, warum dieser eine Abgang mehr bedeutet als ein typischer Wechsel auf Member-of-Technical-Staff-Ebene, muss man sich ansehen, wie Custom-KI-Silicon-Programme tatsächlich aufgebaut werden. Googles TPU, Amazons Trainium und Microsofts Maia haben jeweils fast ein Jahrzehnt in Anspruch genommen und mehrere Generationen von Personalwechseln überstanden, weil das institutionelle Wissen verteilt war. OpenAIs Chip-Programm ist jünger. Wenn Chan sich selbst als die zweite Hardware-Einstellung bezeichnet, verrät er, dass der Bus-Faktor gering ist.
Custom-ASIC-Design für Training-Workloads ist nicht nur RTL. Es ist ein eng gekoppeltes Co-Design-Problem über mindestens vier Ebenen: das Silicon selbst (Zahlenformate, Memory-Hierarchie, Interconnect), die Compiler- und Kernel-Bibliothek, die PyTorch- oder JAX-Graphen auf dieses Silicon abbildet, das Rechenzentrum-Power-und-Cooling-Envelope sowie die Training-Framework-Integration, die entscheidet, welche Operationen überhaupt zum Accelerator gelangen. Chans Tesla-Bereich umfasste nach eigener Beschreibung Framework-Bring-up, Rechenzentrum-Codesign und energieeffiziente Zahlenformate. Das ist das Bindegewebe zwischen Chip-Team und Modell-Team. Menschen, die in beiden Räumen sitzen können, sind der limitierende Faktor dieser Programme.
Brancheninsider schätzen das Wachstum bei Custom Chips auf 44,6 % im Jahr 2026 – etwa das Dreifache des Tempos bei Merchant-GPUs. Wenn diese Entwicklung anhält, ist das knappe Gut nicht die Waferstarts, sondern die Ingenieure, die tatsächlich einen Training-ASIC in einem Produktions-Rechenzentrum in Betrieb genommen haben. Anthropic, das seine Silicon-Strategie ausbaut und dessen API-Stack unter docs.anthropic.com dokumentiert ist, hat gerade eine Person eingestellt, die das zweimal getan hat.
Die Kosten für den Ersatz dieses institutionellen Wissens innerhalb von OpenAI sind nicht das Gehalt. Es sind die 12 bis 18 Monate Kontext, den ein Nachfolger nicht mitbringt. Tape-out-Zyklen warten nicht auf das Onboarding.
Wer die Konsequenzen trägt
Zunächst OpenAI selbst. Pre-IPO-Unternehmen verkaufen ebenso sehr eine Narrative wie Umsatz, und die Narrative hier lautete: Wir sind nicht für immer GPU-abhängig, wir bauen unsere eigene Engine. Jeder Abgang aus dem Chip-Team schwächt diese Geschichte für den Prospekt. Der CFO bei OpenAI sollte diese Woche fragen, wie die Custom-Silicon-Roadmap unter dem Risikoabschnitt eines S-1-Filings dargestellt wird, falls weitere Chip-Mitarbeiter Chan folgen – und ob das Unternehmen Retention-Grants für die verbleibenden leitenden Hardware-Mitarbeiter sichern muss, bevor das Filing-Fenster sich öffnet. Das ist eine Treasury-Frage, keine HR-Frage.
Als nächstes: nachgelagerte Enterprise-Kunden. Wenn man eine Fintech- oder iGaming-Plattform ist, die eine mehrjährige Kapazitätsverpflichtung mit OpenAI in der Erwartung eingegangen ist, dass Custom Silicon die Inferenz-Stückkosten bis 2027 senkt, braucht das Beschaffungsteam eine Absicherung. Anthropic ist auf relativer Basis nun die glaubwürdigere langfristige Silicon-Story – das hat Auswirkungen darauf, wie man die Dual-Vendor-Strategie gewichtet und ob man die Evaluierung von Claude-basierten Agenten anhand der in OpenAIs eigener Plattform-Dokumentation beschriebenen Muster beschleunigt.
Dann ist da noch Tesla, das innerhalb von etwa zweieinhalb Jahren Venkataramanan, Zaman und zuvor Chan aus seinem Silicon- und KI-Infrastruktur-Stack verloren hat. Dojo als wettbewerbsfähige Trainingsplattform war immer eine Wette darauf, dass Tesla Personen gewinnen und halten kann, die sonst bei Nvidia, Google oder einem Hyperscaler wären. Diese Wette schwächt sich sichtbar ab.
Schließlich die Merchant-GPU-Incumbents. Jeder leitende Ingenieur, der das Custom-Chip-Team eines Frontier-Labs für ein anderes verlässt, ist ein Datenpunkt dafür, dass die Branche Custom Silicon als strategische Frontier betrachtet – nicht als Nebenprojekt. Diese Überzeugung, mehr als jeder einzelne Tape-out, ist das, was die Preissetzungsmacht bei GPUs unter Druck setzt.
Handlungsempfehlungen für KI-Entwicklung
Für Plattform-Verantwortliche und CTOs, die entscheiden, wohin die nächsten achtstelligen KI-Infrastruktur-Ausgaben fließen sollen, sind in den nächsten 90 Tagen drei konkrete Maßnahmen sinnvoll.
Erstens: Die Wahl zwischen OpenAI und Anthropic als Frage der Lieferantenkonzentration behandeln, nicht als Benchmark-Frage. Modellqualität konvergiert. Supply-Chain-Kontrolle divergiert. Bitten Sie beide Labs um explizite Roadmap-Zusagen zu den Inferenzkosten pro Million Tokens für 2027 und 2028, und gewichten Sie deren Antworten danach, wie stark jedes Lab Merchant-GPU-Preisen ausgesetzt ist – im Vergleich zu eigenem Silicon.
Zweitens: Die Hardware-Kompetenz des eigenen Teams prüfen. Die Labs bieten aggressiv für Compiler-Ingenieure, ML-Systems-Experten und alle, die gegen ein ASIC geliefert haben. Wer solche Mitarbeiter im Plattform-Team hat, muss das Retention-Budget an den neuen Marktpreis anpassen – der von Anthropic und OpenAI gesetzt wird, nicht von der lokalen Gehaltsstruktur.
Drittens: Wer Agent-Architekturen entwirft, sollte sie von Anfang an portabel über verschiedene Modellanbieter hinweg gestalten. Die Model Context Protocol-Spezifikation unter modelcontextprotocol.io existiert genau dafür, damit der Austausch des zugrunde liegenden Modells eine Konfigurationsänderung ist und kein Rewrite. Die Labs sind instabil. Die eigene Abstraktionsschicht sollte es nicht sein.
Wichtigste Erkenntnisse
- Der Weggang von OpenAIs zweiter Hardware-Einstellung zu Anthropic wenige Wochen vor einem IPO ist ein Roadmap-Risiko, nicht nur ein Personalereignis.
- Custom-KI-Silicon-Programme sind durch leitende Ingenieure begrenzt, die Chip, Compiler und Rechenzentrum überbrücken – und dieser Talentpool wandert sichtbar ab.
- Tesla hat nun Chan, Venkataramanan und Zaman aus seinem Silicon- und KI-Infrastruktur-Stack verloren, was Dojos Wettbewerbsposition schwächt.
- Enterprise-Käufer sollten OpenAI versus Anthropic als Entscheidung zur Supply-Chain-Konzentration betrachten, mit der Custom-Silicon-Entwicklung als zentralem Faktor.
- Teams, die mehrjährige KI-Infrastruktur-Ausgaben evaluieren, sollten fragen, ob ihre Agent-Architektur einen erzwungenen Anbieterwechsel innerhalb eines Quartals übersteht.
Häufig gestellte Fragen
F: Warum ist der Abgang eines einzelnen Ingenieurs bei OpenAI so bedeutsam?
Chan war die zweite Hardware-Einstellung in OpenAIs Custom-Chip-Programm, was bedeutet, dass sein institutionelles Wissen die gesamte Geschichte des Projekts umspannt. Custom-ASIC-Programme werden durch leitende Ingenieure begrenzt, die silicon-, compiler- und rechenzentrumsübergreifend arbeiten können – und die Wiederherstellung dieses Kontexts dauert in der Regel 12 bis 18 Monate.
F: Verändert das OpenAIs IPO-Story?
Es erschwert sie. Ein Teil von OpenAIs langfristiger Margen-Narrative hängt davon ab, die Abhängigkeit von Merchant-GPUs durch Custom Silicon zu reduzieren. Eine grundlegende Chip-Einstellung, die wenige Wochen vor einem S-1-Filing-Fenster zum engsten Modell-Konkurrenten wechselt, ist genau die Art von Detail, die in Risikofaktoren und Fragen von Bankern auftaucht.
F: Sollten Enterprise-Teams aufgrund dieses Vorfalls von OpenAI zu Anthropic wechseln?
Nicht aufgrund dieses einen Signals. Die richtige Reaktion ist, die Modell-Anbieter-Wahl als Supply-Chain-Frage zu behandeln, Agent-Architekturen zu entwickeln, die mithilfe von Standards wie MCP über Anbieter hinweg portabel sind, und beide Labs um explizite Inferenzkostzusagen für 2027 und danach zu bitten, bevor mehrjährige Kapazitätsverträge abgeschlossen werden.
Gemma 4 QAT reduziert E2B auf 1GB: Die Mathematik der On-Device-KI hat sich verändert
Google DeepMind hat QAT-Checkpoints für Gemma 4 veröffentlicht und den Speicherbedarf des E2B-Modells auf 1GB gesenkt. Die Kalkulation für On-Device-KI hat sich grundlegend verschoben.
Pinterest setzt $4 Mrd. auf AWS-Silicon für seine KI-Zukunft
Pinterest hat gerade eine $4-Milliarden-Wette über sechs Jahre auf AWS Custom Silicon abgeschlossen, um visuelle Suche und einen neuen Konversationsassistenten zu betreiben. Was der Deal wirklich bringt.
Anthropics Project Deal: 186 Transaktionen, 4.000 Dollar und ein Fairness-Score von 4/7
Anthropics Project Deal erzielte 186 Transaktionen im Wert von über 4.000 $ unter 69 Mitarbeitern – mit einem Fairness-Score von 4/7. Der strategische Abstand zu OpenAI und Google wird sichtbar.



