ChatGPT Health ist mit dem Anspruch gestartet, persönliche Gesundheitsdaten verständlich auszuwerten und daraus sinnvolle Einschätzungen abzuleiten. Gerade für Menschen, die seit Jahren eine Apple Watch tragen, klingt das nach einem logischen nächsten Schritt. Millionen gesammelter Messwerte sollen endlich erklären, wie es um die eigene Gesundheit wirklich steht. Ein aktueller Erfahrungsbericht zeigt jedoch, dass diese Auswertung schnell problematisch werden kann.
Anfang dieses Monats wurde ChatGPT Health offiziell mit einer Integration für Apple Health sowie weiteren Datenanbietern eingeführt. Kurz darauf machte ein Test des Technologiekolumnisten Geoffrey A. Fowler von der Washington Post deutlich, wie unausgereift das System aktuell noch ist. Die Analyse seiner Apple-Watch-Daten führte zu einer Bewertung, die weder medizinisch korrekt noch konsistent war.
Übergabe von zehn Jahren Gesundheitsdaten
Wie viele Menschen, die täglich eine Apple Watch tragen, fragte sich Fowler, was ein Jahrzehnt an Gesundheitsdaten tatsächlich über ihn aussagt. Nach einer kurzen Warteliste gewährte er ChatGPT Health Zugriff auf seine Apple-Health-Daten. Dazu gehörten rund 29 Millionen aufgezeichnete Schritte und etwa sechs Millionen Herzschlagmessungen. Anschließend bat er das System um eine Bewertung seiner Herzgesundheit.
Das Ergebnis war eine numerische Einstufung mit der Note 6. Diese Einschätzung löste bei ihm deutliche Besorgnis aus. Er reagierte impulsiv, ging joggen und leitete den von ChatGPT Health erstellten Bericht an seinen Hausarzt weiter.
Abgleich mit der ärztlichen Realität
Die Reaktion des Arztes fiel eindeutig aus. Die Bewertung sei nicht korrekt. Tatsächlich sei das Risiko für einen Herzinfarkt so gering, dass selbst die Krankenversicherung vermutlich keinen zusätzlichen Herz-Fitness-Test übernehmen würde, nur um die Einschätzung der künstlichen Intelligenz zu widerlegen. Damit stand fest, dass ChatGPT Health die vorhandenen Daten falsch interpretiert hatte.
Fehlinterpretation zentraler Messwerte
Laut Fowler basierte die negative Bewertung von ChatGPT Health zu großen Teilen auf dem VO₂max-Wert. Apple selbst weist jedoch darauf hin, dass diese Werte lediglich Schätzungen sind. Sie eignen sich dazu, langfristige Trends zu beobachten, liefern aber keine präzisen medizinischen Aussagen. Für wirklich exakte Messungen sind separate, spezialisierte Geräte notwendig.
Trotz dieser bekannten Einschränkungen behandelte ChatGPT Health den VO₂max-Wert offenbar wie eine verlässliche Diagnosegrundlage. Eine Einordnung oder Relativierung der Messgenauigkeit fand nicht statt.
Technische Änderungen wurden nicht erkannt
Ein weiteres Problem betraf die Ruheherzfrequenz. In den Daten zeigten sich Veränderungen genau zu dem Zeitpunkt, als Fowler eine neue Apple Watch erhielt. Diese Abweichungen waren jedoch keine echten körperlichen Veränderungen, sondern die Folge verbesserter Sensoren und aktualisierter Messverfahren. ChatGPT Health berücksichtigte diesen technischen Kontext nicht und wertete die Daten offenbar als gesundheitliche Verschlechterung.
Stark schwankende Bewertungen
Besonders kritisch war die Inkonsistenz der Antworten. Als Fowler dieselbe Frage zur Herz-Langlebigkeit erneut stellte, änderte sich die Bewertung plötzlich. Aus der ursprünglichen 6 wurde ein „C“. Bei weiteren Nachfragen schwankte das Ergebnis zwischen F und B. Eine nachvollziehbare Erklärung für diese Unterschiede lieferte ChatGPT Health nicht.
Zusätzlich vergaß das System im Verlauf der Gespräche wiederholt grundlegende Informationen. Dazu gehörten Geschlecht, Alter und einzelne aktuelle Vitalwerte. Obwohl ChatGPT Health Zugriff auf aktuelle Blutuntersuchungen hatte, flossen diese Daten nicht immer in die Analyse ein.
Warum das besonders problematisch ist
Solche Fehler sind bei KI-Chatbots grundsätzlich nichts Neues. Inkonsistenzen, vergessene Kontextinformationen und wechselnde Antworten sind bekannte Schwächen. Für ein Produkt, das als Quelle für Gesundheitswissen gedacht ist, wiegen diese Probleme jedoch deutlich schwerer. Gesundheitsbewertungen erzeugen Vertrauen oder Angst – und beides sollte nicht auf fehlerhaften Analysen beruhen.
ChatGPT Health: Technologische Ambitionen treffen auf medizinische Realität
Der Bericht über ChatGPT Health zeigt klar, wie groß die Lücke zwischen technischer Vision und medizinischer Realität derzeit noch ist. Gleichzeitig kursieren Gerüchte, dass Apple an einem eigenen KI-gestützten Dienst namens „Health+“ arbeitet, der noch in diesem Jahr starten soll.
Der aktuelle Test macht zwei Dinge deutlich: Zum einen dürfte es äußerst schwierig sein, das Qualitätsniveau zu erreichen, das Apple vermutlich anstrebt. Zum anderen könnte ein gut umgesetzter Dienst in diesem Bereich schnell eine führende Rolle im KI-Gesundheitsmarkt einnehmen.
Bis dahin zeigt ChatGPT Health vor allem eines: Die Auswertung von Gesundheitsdaten durch künstliche Intelligenz ist noch lange nicht zuverlässig genug, um medizinische Einschätzungen zu ersetzen oder auch nur belastbar zu ergänzen. (Bild: Shutterstock / ImageFlow)
- Apple setzt Testphase fort: iOS 26.3 Beta 3 ist da
- iOS 26.2.1 bringt AirTag-2-Support und wichtige Fixes
- Grok erzeugte CSAM-Bilder: Ermittlungen in der EU laufen
- Apple Aktie im Aufwind: JP Morgan erhöht Ziel auf 315 US-Dollar
- Apple stellt neues Black Unity Apple Watch Armband vor
- AirTag 2 vorgestellt: Mehr Reichweite, Ortung und Schutz
- Apple und neue Macs: Kommen höhere Speicherpreise?
- Apple und Indien: Kartellverfahren mit globaler Sprengkraft
- Datenleck ohne Hack: So kamen 149 Millionen Passwörter ins Netz
- WhatsApp testet neue Gruppenfunktion für Chat-Verläufe
- Apple bleibt Branchenmaßstab im Fortune-Ranking 2026
- Apple Event für Kreative: Kommt das neue MacBook Pro?
- Apple-KI-Klage: Richter weist Musks Quellcode-Antrag ab
- Apple wirft der EU politische Verzögerungstaktiken vor
- App Store: Ab März 2026 kommt deutlich mehr Werbung
- Apple Watch verbessert Früherkennung von Vorhofflimmern
- Apple steigerte 2025 seine Lobbyausgaben in den USA deutlich
- Apple unter Druck: Investoren fordern China-Transparenz
- Apple TV und die Oscars 2026: F1 wird zum Hoffnungsträger
- Apple lockt Käufer in China mit Rabatten zum Neujahr
- ChatGPT Atlas: Neues Update macht den KI-Browser besser
- Apple führt Global 500 2026 als wertvollste Marke an
- Apple-Zulieferer Luxshare: Hacker stehlen Produktdaten
- Threads führt weltweit Werbung ein – das ändert sich jetzt



