Fünf Modelle, verteilt zwischen iPhone, Apple-Servern und fremder Cloud-Hardware: Auf der WWDC 2026 hat Apple die dritte Generation seiner Foundation Models vorgestellt. Eines der Modelle läuft erstmals nicht auf Apple Silicon, sondern auf Nvidia-Chips in Googles Rechenzentren – ein Bruch mit einem bislang eisernen Prinzip.
Mit der dritten Generation der Apple Foundation Models, intern als AFM abgekürzt, ordnet Apple das Fundament seiner gesamten KI-Strategie neu. Statt eines einzelnen Modells besteht das System nun aus fünf spezialisierten Modellen, die je nach Aufgabe auf dem Gerät, auf Apples eigenen Servern oder auf fremder Infrastruktur rechnen. Dieser Schritt ist der vorläufige Höhepunkt der Neuausrichtung von Apples KI-Zukunft rund um Siri und Googles Gemini-Technik, die Apple in den vergangenen Monaten vorbereitet hat. Erst jetzt wird konkret greifbar, wie diese Architektur im Detail aufgebaut ist – und an welcher Stelle Apple sein striktes „alles auf eigener Hardware“-Prinzip aufgibt.
Vom Start 2024 bis zur Google-Partnerschaft
Als Apple seine Foundation Models 2024 erstmals vorstellte, bestand das Lineup aus zwei Bausteinen: einem Sprachmodell mit rund drei Milliarden Parametern, das direkt auf dem Gerät lief, sowie einem größeren, serverbasierten Sprachmodell. Letzteres war an Private Cloud Compute gebunden und lief auf Servern mit Apple-Silicon-Chips.
Private Cloud Compute, kurz PCC, war von Anfang an ein ambitioniertes Vorhaben. Es sollte cloudbasierte KI-Fähigkeiten bereitstellen und dabei dieselben Datenschutzgarantien wahren, die Nutzer von der Verarbeitung direkt auf dem Gerät gewohnt sind. Damit das gelang, war die Kontrolle über die gesamte Hardware essenziell: PCC lief in Apples eigenen Rechenzentren auf Apple-Silicon-Servern, und die Datenschutzgarantien konnten von unabhängigen Sicherheitsforschern überprüft werden.
Doch Apple kam mit den eigenen KI-Ambitionen nicht schnell genug voran. In der Folge ging das Unternehmen eine Partnerschaft mit Google ein und nutzt dessen Gemini-Technik als Rückgrat seiner neuen KI-Bemühungen. Dabei betont Apple, dass es sich nicht um schlichtes Gemini auf dem iPhone handelt, sondern um auf Gemini-Basis eigens für Apple umgebaute Modelle. Die Ergebnisse dieser Zusammenarbeit stellte Apple auf der WWDC 2026 vor.
Fünf Modelle, zwei davon auf dem Gerät
Die dritte AFM-Generation umfasst fünf Modelle, die sich auf drei Ebenen verteilen. Zwei laufen direkt auf dem Gerät, zwei auf Apples Servern und eines auf fremder Hardware:
| Modell | Wo es läuft | Aufgabe |
|---|---|---|
| AFM 3 Core | Auf dem Gerät | Basismodell mit drei Milliarden Parametern, deutlich verbesserte Qualität |
| AFM 3 Core Advanced | Auf dem Gerät | Leistungsstärkstes On-Device-Modell, nativ multimodal, 20 Milliarden Parameter |
| AFM 3 Cloud | Apple-Silicon-Server | Server-Arbeitspferd, optimiert auf Tempo, Effizienz und Leistung |
| ADM 3 Cloud (Image) | Apple-Silicon-Server | Bildgenerierung und -bearbeitung, treibt unter anderem Image Playground an |
| AFM 3 Cloud Pro | Nvidia-GPUs in der Google Cloud | Anspruchsvollste Aufgaben wie agentische Tool-Nutzung und komplexes Reasoning |
Das „D“ in der Bezeichnung ADM 3 Cloud (Image) steht für Diffusion, die Technik hinter der Bildgenerierung. Mit Ausnahme von AFM 3 Cloud Pro wurden alle Modelle für den Betrieb auf Apple Silicon entwickelt – sei es auf dem Gerät oder auf Apples Servern. AFM 3 Cloud Pro bildet die Ausnahme und läuft auf Nvidia-GPUs, die in der Google Cloud gehostet werden. Möglich wurde das, weil Apple seine Private-Cloud-Compute-Architektur erstmals auf fremde Infrastruktur ausgeweitet hat, nach eigener Darstellung ohne Abstriche bei den Sicherheits- und Datenschutzschutzmechanismen. Die beiden interessantesten Modelle sind AFM 3 Core Advanced und AFM 3 Cloud Pro.
AFM 3 Core Advanced: 20 Milliarden Parameter auf dem Gerät
AFM 3 Core Advanced bringt 20 Milliarden Parameter in ein Modell, das direkt auf dem Gerät läuft – das ist bemerkenswert, denn die meisten für die breite Öffentlichkeit gedachten On-Device-Modelle bleiben im niedrigen einstelligen Milliardenbereich. Das Modell ist zudem nativ multimodal und ermöglicht damit Funktionen wie ausdrucksstärkere Stimmen und eine präzisere Diktierfunktion, die du im Alltag direkt bemerkst. Freigeschaltet und optimiert ist es für Apples leistungsfähigste Apple-Silicon-Systeme.
Damit ein 20-Milliarden-Parameter-Modell auf einem Gerät überhaupt sinnvoll arbeiten kann, setzt Apple auf eine sogenannte Sparse-Architektur. Statt wie bei einer Dense-Architektur sämtliche 20 Milliarden Parameter für jede Anfrage aktiv zu halten, aktiviert das Modell je nach Eingabe nur bis zu vier Milliarden Parameter gleichzeitig. Konzeptionell ähnelt das dem Mixture-of-Experts-Ansatz, beruht aber auf einer von Apple selbst entwickelten Technik, die das Unternehmen vor einem Jahr in der Studie „Instruction-Following Pruning for Large Language Models“ beschrieben hat.
AFM 3 Cloud Pro und die Öffnung von Private Cloud Compute
AFM 3 Cloud Pro ist jenes Modell, das auf externer Infrastruktur läuft, und damit der eigentliche Bruch mit Apples bisheriger Linie. Um Gemini-basierte Spitzenleistung zu liefern, ohne das eigene Datenschutzversprechen aufzugeben, hat Apple seine PCC-Architektur erstmals auf Hardware außerhalb der eigenen Rechenzentren erweitert. Wie tief dieser Schritt reicht, zeigt sich an den Schutzmaßnahmen, die Apple gemeinsam mit Google umgesetzt hat und die genau dieselbe Grundlage bilden wie die Ausweitung von Private Cloud Compute auf die Google Cloud.
Apple verlässt sich dabei ausdrücklich nicht allein auf Confidential-Computing-Technik, um Angriffe über privilegierte Zugriffe oder Seitenkanäle abzuwehren. Stattdessen zählt das Unternehmen jede Komponente – von der Firmware über die Host- und Gast-Betriebssysteme bis zum Anwendungscode – zur vertrauenswürdigen Basis, die den Garantien zu überprüfbarer Transparenz und fehlendem privilegierten Zugriff unterliegt. Gegen Angriffe über die Lieferkette führt Apple ein kryptografisch überprüfbares, nur erweiterbares Verzeichnis sämtlicher Google-Cloud-Hardware im PCC-Verbund. Für besonders sensible Komponenten stützt sich die Software-Attestierung auf mindestens zwei getrennte Vertrauensanker unabhängiger Anbieter. Auch der Verarbeitungs-Stack selbst folgt denselben Mustern wie auf Apple Silicon: Eingehende Daten werden zunächst in einem eigenen, abgeschotteten Prozess verarbeitet, gemeinsam genutzte Software wird nach kurzer Zeit recycelt, und kryptografische Schlüssel liegen in einer separaten, isolierten Umgebung.
Wie Apple die Modelle trainiert hat
Laut Apples Forschungsblog teilten sich alle fünf Modelle zunächst ein gemeinsames Fundament, bevor sie für ihre jeweilige Architektur und ihren Einsatzzweck spezialisiert wurden. Dabei kamen multimodale Fähigkeiten hinzu – etwa das Verständnis von Audio und Bildern, das Verarbeiten langer Kontexte sowie hochwertige visuelle Generierung.
Für das Training nutzte Apple eine Mischung aus öffentlich verfügbaren Informationen, von Dritten lizenzierten oder gekauften Daten, quelloffenen Daten, eigens für Studien erhobenen Daten und synthetischen Daten. Das Unternehmen betont, dass weder Nutzerdaten noch Interaktionen in das Training eingeflossen sind. Zudem können Web-Publisher dem Training der Foundation Models widersprechen.
Was die Tests zeigen

Zur Bewertung der dritten Generation setzte Apple auf umfangreiche menschliche Evaluierungen. Interne Prüfer bewerteten die Antworten der Modelle in Kategorien wie Befolgen von Anweisungen, Wahrheitsgehalt, Darstellung und Bildverständnis. Wo es möglich war, traten die neuen Modelle gegen ihre Vorgänger an.
Die Vergleiche umfassten neben dem globalen Englisch auch weitere Sprachgruppen, um eine konsistente Leistung über internationale Varianten hinweg zu belegen. Bei der Diktierfunktion verglich Apple AFM 3 Core Advanced direkt mit dem bestehenden Diktiersystem und sah über sieben Qualitätsdimensionen hinweg durchgängig eine Verbesserung. Wer tiefer einsteigen möchte, findet die ausführlichen Auswertungen in Apples Machine-Learning-Forschungsblog, wo du die kompletten Vergleichsdaten einsehen kannst.
Apples KI-Architektur zwischen Gerät und fremder Cloud
Die dritte AFM-Generation macht zwei Dinge deutlich: Apple traut sich mit AFM 3 Core Advanced überraschend viel direkt auf das Gerät, während es bei den anspruchsvollsten Aufgaben pragmatisch auf Googles Gemini-Technik und fremde Hardware setzt. Der eigentliche Kraftakt liegt weniger in den Modellen selbst als in dem Versuch, das Datenschutzversprechen von Private Cloud Compute auch dann aufrechtzuerhalten, wenn die Berechnung in einem fremden Rechenzentrum stattfindet. Ob dieser Spagat in der Praxis hält, was Apple verspricht, wird sich zeigen, sobald die neue Siri und die übrigen Funktionen breit ausgerollt sind.
Die besten Produkte für dich: Unsere Amazon Storefront bietet eine breite Auswahl an Zubehörteilen, auch für HomeKit. (Bild: Apple)
- Die Fotos-App in iOS 27: Alle Neuerungen im Überblick
- Siri AI basiert auf Gemini – ist aber nicht Gemini
- WWDC 2026: Apples Keynote bricht mit einer alten Tradition
- Warum der DMA Siri AI auf iPhone und iPad stoppt
- Apfelpatient Weekly #9
- iPhone 18 Pro: Alle Gerüchte im Überblick
- iPhone Ultra (iPhone Fold): Alle Gerüchte und Fakten im Überblick
- WWDC 2026: Alle Erwartungen, Gerüchte und Hardware-Hoffnungen im Überblick
- Apple TV im Juni 2026: Alle Highlights im Überblick
- Apfelpatient Weekly #8
- Neues Apple TV 4K: Alle Gerüchte zum Update
- HomePod 3 & HomePod mini 2: Alle Gerüchte im Überblick
- Apple Glasses: Alle Gerüchte im Überblick
- Apfelpatient Weekly #7
- iPhone 2027: Alle Gerüchte zum Jubiläumsmodell
- MacBook Ultra: Alle Gerüchte im Überblick
- Apple Watch Ultra 4: Alle Gerüchte im Überblick
- Apfelpatient Weekly #6
- Apple Watch Series 12: Alle Gerüchte im Überblick
- Apfelpatient Weekly #5
- AirPods Ultra: Alle Gerüchte im Überblick
- Apple TV im Sommer 2026: Das stärkste Lineup bisher
Häufige Fragen: Apples Foundation Models der dritten Generation
Die Apple Foundation Models (AFM) sind Apples eigene KI-Modelle, die hinter den Apple-Intelligence-Funktionen stehen. Die dritte Generation wurde auf der WWDC 2026 vorgestellt und besteht aus fünf spezialisierten Modellen.
Fünf: AFM 3 Core und AFM 3 Core Advanced laufen direkt auf dem Gerät, AFM 3 Cloud und ADM 3 Cloud (Image) auf Apples Servern, und AFM 3 Cloud Pro auf fremder Hardware.
AFM 3 Cloud Pro. Es ist das einzige Modell der Generation, das auf Nvidia-GPUs in der Google Cloud läuft, statt auf Apple-Silicon-Chips. Alle anderen Modelle laufen auf Apple Silicon.
Es bringt 20 Milliarden Parameter direkt auf das Gerät – ungewöhnlich viel für ein On-Device-Modell. Eine Sparse-Architektur aktiviert dabei nur bis zu vier Milliarden Parameter gleichzeitig, je nach Anfrage.
Apple hat seine Private-Cloud-Compute-Architektur erstmals auf fremde Infrastruktur ausgeweitet und nach eigener Darstellung dieselben Schutzmechanismen übertragen – inklusive eines überprüfbaren Hardware-Verzeichnisses und mehrerer unabhängiger Vertrauensanker.
Nein. Apple betont, dass weder Nutzerdaten noch Interaktionen in das Training eingeflossen sind. Verwendet wurde eine Mischung aus öffentlichen, lizenzierten, quelloffenen, eigens erhobenen und synthetischen Daten; Web-Publisher können widersprechen.
Für Diffusion – die Technik hinter der Bildgenerierung. Das Modell treibt unter anderem die Bildbearbeitungs-Werkzeuge und Image Playground an.



