Apples Foundation Models der 3. Generation Apfelpatient

Fünf Modelle, verteilt zwischen iPhone, Apple-Servern und fremder Cloud-Hardware: Auf der WWDC 2026 hat Apple die dritte Generation seiner Foundation Models vorgestellt. Eines der Modelle läuft erstmals nicht auf Apple Silicon, sondern auf Nvidia-Chips in Googles Rechenzentren – ein Bruch mit einem bislang eisernen Prinzip.

Mit der dritten Generation der Apple Foundation Models, intern als AFM abgekürzt, ordnet Apple das Fundament seiner gesamten KI-Strategie neu. Statt eines einzelnen Modells besteht das System nun aus fünf spezialisierten Modellen, die je nach Aufgabe auf dem Gerät, auf Apples eigenen Servern oder auf fremder Infrastruktur rechnen. Dieser Schritt ist der vorläufige Höhepunkt der Neuausrichtung von Apples KI-Zukunft rund um Siri und Googles Gemini-Technik, die Apple in den vergangenen Monaten vorbereitet hat. Erst jetzt wird konkret greifbar, wie diese Architektur im Detail aufgebaut ist – und an welcher Stelle Apple sein striktes „alles auf eigener Hardware“-Prinzip aufgibt.

Vom Start 2024 bis zur Google-Partnerschaft

Als Apple seine Foundation Models 2024 erstmals vorstellte, bestand das Lineup aus zwei Bausteinen: einem Sprachmodell mit rund drei Milliarden Parametern, das direkt auf dem Gerät lief, sowie einem größeren, serverbasierten Sprachmodell. Letzteres war an Private Cloud Compute gebunden und lief auf Servern mit Apple-Silicon-Chips.

Private Cloud Compute, kurz PCC, war von Anfang an ein ambitioniertes Vorhaben. Es sollte cloudbasierte KI-Fähigkeiten bereitstellen und dabei dieselben Datenschutzgarantien wahren, die Nutzer von der Verarbeitung direkt auf dem Gerät gewohnt sind. Damit das gelang, war die Kontrolle über die gesamte Hardware essenziell: PCC lief in Apples eigenen Rechenzentren auf Apple-Silicon-Servern, und die Datenschutzgarantien konnten von unabhängigen Sicherheitsforschern überprüft werden.

Doch Apple kam mit den eigenen KI-Ambitionen nicht schnell genug voran. In der Folge ging das Unternehmen eine Partnerschaft mit Google ein und nutzt dessen Gemini-Technik als Rückgrat seiner neuen KI-Bemühungen. Dabei betont Apple, dass es sich nicht um schlichtes Gemini auf dem iPhone handelt, sondern um auf Gemini-Basis eigens für Apple umgebaute Modelle. Die Ergebnisse dieser Zusammenarbeit stellte Apple auf der WWDC 2026 vor.

Fünf Modelle, zwei davon auf dem Gerät

Die dritte AFM-Generation umfasst fünf Modelle, die sich auf drei Ebenen verteilen. Zwei laufen direkt auf dem Gerät, zwei auf Apples Servern und eines auf fremder Hardware:

Modell	Wo es läuft	Aufgabe
AFM 3 Core	Auf dem Gerät	Basismodell mit drei Milliarden Parametern, deutlich verbesserte Qualität
AFM 3 Core Advanced	Auf dem Gerät	Leistungsstärkstes On-Device-Modell, nativ multimodal, 20 Milliarden Parameter
AFM 3 Cloud	Apple-Silicon-Server	Server-Arbeitspferd, optimiert auf Tempo, Effizienz und Leistung
ADM 3 Cloud (Image)	Apple-Silicon-Server	Bildgenerierung und -bearbeitung, treibt unter anderem Image Playground an
AFM 3 Cloud Pro	Nvidia-GPUs in der Google Cloud	Anspruchsvollste Aufgaben wie agentische Tool-Nutzung und komplexes Reasoning

Das „D“ in der Bezeichnung ADM 3 Cloud (Image) steht für Diffusion, die Technik hinter der Bildgenerierung. Mit Ausnahme von AFM 3 Cloud Pro wurden alle Modelle für den Betrieb auf Apple Silicon entwickelt – sei es auf dem Gerät oder auf Apples Servern. AFM 3 Cloud Pro bildet die Ausnahme und läuft auf Nvidia-GPUs, die in der Google Cloud gehostet werden. Möglich wurde das, weil Apple seine Private-Cloud-Compute-Architektur erstmals auf fremde Infrastruktur ausgeweitet hat, nach eigener Darstellung ohne Abstriche bei den Sicherheits- und Datenschutzschutzmechanismen. Die beiden interessantesten Modelle sind AFM 3 Core Advanced und AFM 3 Cloud Pro.

AFM 3 Core Advanced: 20 Milliarden Parameter auf dem Gerät

AFM 3 Core Advanced bringt 20 Milliarden Parameter in ein Modell, das direkt auf dem Gerät läuft – das ist bemerkenswert, denn die meisten für die breite Öffentlichkeit gedachten On-Device-Modelle bleiben im niedrigen einstelligen Milliardenbereich. Das Modell ist zudem nativ multimodal und ermöglicht damit Funktionen wie ausdrucksstärkere Stimmen und eine präzisere Diktierfunktion, die du im Alltag direkt bemerkst. Freigeschaltet und optimiert ist es für Apples leistungsfähigste Apple-Silicon-Systeme.

Damit ein 20-Milliarden-Parameter-Modell auf einem Gerät überhaupt sinnvoll arbeiten kann, setzt Apple auf eine sogenannte Sparse-Architektur. Statt wie bei einer Dense-Architektur sämtliche 20 Milliarden Parameter für jede Anfrage aktiv zu halten, aktiviert das Modell je nach Eingabe nur bis zu vier Milliarden Parameter gleichzeitig. Konzeptionell ähnelt das dem Mixture-of-Experts-Ansatz, beruht aber auf einer von Apple selbst entwickelten Technik, die das Unternehmen vor einem Jahr in der Studie „Instruction-Following Pruning for Large Language Models“ beschrieben hat.

AFM 3 Cloud Pro und die Öffnung von Private Cloud Compute

AFM 3 Cloud Pro ist jenes Modell, das auf externer Infrastruktur läuft, und damit der eigentliche Bruch mit Apples bisheriger Linie. Um Gemini-basierte Spitzenleistung zu liefern, ohne das eigene Datenschutzversprechen aufzugeben, hat Apple seine PCC-Architektur erstmals auf Hardware außerhalb der eigenen Rechenzentren erweitert. Wie tief dieser Schritt reicht, zeigt sich an den Schutzmaßnahmen, die Apple gemeinsam mit Google umgesetzt hat und die genau dieselbe Grundlage bilden wie die Ausweitung von Private Cloud Compute auf die Google Cloud.

Apple verlässt sich dabei ausdrücklich nicht allein auf Confidential-Computing-Technik, um Angriffe über privilegierte Zugriffe oder Seitenkanäle abzuwehren. Stattdessen zählt das Unternehmen jede Komponente – von der Firmware über die Host- und Gast-Betriebssysteme bis zum Anwendungscode – zur vertrauenswürdigen Basis, die den Garantien zu überprüfbarer Transparenz und fehlendem privilegierten Zugriff unterliegt. Gegen Angriffe über die Lieferkette führt Apple ein kryptografisch überprüfbares, nur erweiterbares Verzeichnis sämtlicher Google-Cloud-Hardware im PCC-Verbund. Für besonders sensible Komponenten stützt sich die Software-Attestierung auf mindestens zwei getrennte Vertrauensanker unabhängiger Anbieter. Auch der Verarbeitungs-Stack selbst folgt denselben Mustern wie auf Apple Silicon: Eingehende Daten werden zunächst in einem eigenen, abgeschotteten Prozess verarbeitet, gemeinsam genutzte Software wird nach kurzer Zeit recycelt, und kryptografische Schlüssel liegen in einer separaten, isolierten Umgebung.

Wie Apple die Modelle trainiert hat

Laut Apples Forschungsblog teilten sich alle fünf Modelle zunächst ein gemeinsames Fundament, bevor sie für ihre jeweilige Architektur und ihren Einsatzzweck spezialisiert wurden. Dabei kamen multimodale Fähigkeiten hinzu – etwa das Verständnis von Audio und Bildern, das Verarbeiten langer Kontexte sowie hochwertige visuelle Generierung.

Für das Training nutzte Apple eine Mischung aus öffentlich verfügbaren Informationen, von Dritten lizenzierten oder gekauften Daten, quelloffenen Daten, eigens für Studien erhobenen Daten und synthetischen Daten. Das Unternehmen betont, dass weder Nutzerdaten noch Interaktionen in das Training eingeflossen sind. Zudem können Web-Publisher dem Training der Foundation Models widersprechen.

Was die Tests zeigen

Zur Bewertung der dritten Generation setzte Apple auf umfangreiche menschliche Evaluierungen. Interne Prüfer bewerteten die Antworten der Modelle in Kategorien wie Befolgen von Anweisungen, Wahrheitsgehalt, Darstellung und Bildverständnis. Wo es möglich war, traten die neuen Modelle gegen ihre Vorgänger an.

Die Vergleiche umfassten neben dem globalen Englisch auch weitere Sprachgruppen, um eine konsistente Leistung über internationale Varianten hinweg zu belegen. Bei der Diktierfunktion verglich Apple AFM 3 Core Advanced direkt mit dem bestehenden Diktiersystem und sah über sieben Qualitätsdimensionen hinweg durchgängig eine Verbesserung. Wer tiefer einsteigen möchte, findet die ausführlichen Auswertungen in Apples Machine-Learning-Forschungsblog, wo du die kompletten Vergleichsdaten einsehen kannst.

Apples KI-Architektur zwischen Gerät und fremder Cloud

Die dritte AFM-Generation macht zwei Dinge deutlich: Apple traut sich mit AFM 3 Core Advanced überraschend viel direkt auf das Gerät, während es bei den anspruchsvollsten Aufgaben pragmatisch auf Googles Gemini-Technik und fremde Hardware setzt. Der eigentliche Kraftakt liegt weniger in den Modellen selbst als in dem Versuch, das Datenschutzversprechen von Private Cloud Compute auch dann aufrechtzuerhalten, wenn die Berechnung in einem fremden Rechenzentrum stattfindet. Ob dieser Spagat in der Praxis hält, was Apple verspricht, wird sich zeigen, sobald die neue Siri und die übrigen Funktionen breit ausgerollt sind.

Die besten Produkte für dich: Unsere Amazon Storefront bietet eine breite Auswahl an Zubehörteilen, auch für HomeKit. (Bild: Apple)

Häufige Fragen: Apples Foundation Models der dritten Generation

Was sind die Apple Foundation Models?

Die Apple Foundation Models (AFM) sind Apples eigene KI-Modelle, die hinter den Apple-Intelligence-Funktionen stehen. Die dritte Generation wurde auf der WWDC 2026 vorgestellt und besteht aus fünf spezialisierten Modellen.

Wie viele Modelle umfasst die dritte Generation?

Fünf: AFM 3 Core und AFM 3 Core Advanced laufen direkt auf dem Gerät, AFM 3 Cloud und ADM 3 Cloud (Image) auf Apples Servern, und AFM 3 Cloud Pro auf fremder Hardware.

Welches Modell läuft nicht auf Apple Silicon?

AFM 3 Cloud Pro. Es ist das einzige Modell der Generation, das auf Nvidia-GPUs in der Google Cloud läuft, statt auf Apple-Silicon-Chips. Alle anderen Modelle laufen auf Apple Silicon.

Was macht AFM 3 Core Advanced besonders?

Es bringt 20 Milliarden Parameter direkt auf das Gerät – ungewöhnlich viel für ein On-Device-Modell. Eine Sparse-Architektur aktiviert dabei nur bis zu vier Milliarden Parameter gleichzeitig, je nach Anfrage.

Bleibt der Datenschutz trotz Google-Cloud gewahrt?

Apple hat seine Private-Cloud-Compute-Architektur erstmals auf fremde Infrastruktur ausgeweitet und nach eigener Darstellung dieselben Schutzmechanismen übertragen – inklusive eines überprüfbaren Hardware-Verzeichnisses und mehrerer unabhängiger Vertrauensanker.

Wurden für das Training Nutzerdaten verwendet?

Nein. Apple betont, dass weder Nutzerdaten noch Interaktionen in das Training eingeflossen sind. Verwendet wurde eine Mischung aus öffentlichen, lizenzierten, quelloffenen, eigens erhobenen und synthetischen Daten; Web-Publisher können widersprechen.

Wofür steht das „D“ in ADM 3 Cloud (Image)?

Für Diffusion – die Technik hinter der Bildgenerierung. Das Modell treibt unter anderem die Bildbearbeitungs-Werkzeuge und Image Playground an.

Apfelpatient bei Google bevorzugen 1 Klick – so siehst du uns häufiger bei Google

War dieser Artikel hilfreich?

JaNein

Tags: Apple Intelligence iOS iOS 27 iPadOS iPadOS 27 macOS macOS 27 visionOS visionOS 27 watchOS watchOS 27

Apples Foundation Models der dritten Generation: So funktioniert die neue KI-Architektur

Widow’s Bay: Apple TV verlängert den Überraschungshit um eine zweite Staffel

watchOS 27 bringt mehr Tempo und eine dynamische App-Übersicht

watchOS 27 bringt mehr Tempo und eine dynamische App-Übersicht

macOS 27: Verstecktes Siri-Interface mit 13 Stimmen entdeckt

iPhone Ultra: 25 Prozent Marktanteil bei Foldables erwartet

Apple TV: The Morning Show endet mit Staffel 5

Über APFELPATIENT

Unternehmen

Gemeinschaft

Rechtliches

Ressourcen