Die Entwicklung leistungsfähiger KI-Modelle erfordert enorme Datenmengen – darunter auch Texte aus Büchern. Doch was passiert, wenn diese Daten urheberrechtlich geschützt sind? Genau darum geht es in einer neuen Sammelklage gegen Apple, die gerade in den USA eingereicht wurde. Zwei Autoren werfen dem Unternehmen vor, ihre Werke illegal zum Trainieren von KI-Modellen verwendet zu haben. Die Klage könnte rechtliche Maßstäbe für den Umgang mit urheberrechtlich geschütztem Material im KI-Bereich setzen.
Vor dem Bundesgericht in Nordkalifornien wurde eine Klage eingereicht, in der Apple beschuldigt wird, Bücher ohne Zustimmung der Rechteinhaber für das Training eigener Sprachmodelle verwendet zu haben. Die Kläger sind die Autoren Grady Hendrix und Jennifer Robertson. Sie vertreten eine Sammelklägergruppe, deren Werke Teil des verwendeten Datenmaterials gewesen sein sollen. Grundlage der Vorwürfe sind unter anderem technische Dokumente von Apple selbst.
Books3 – der umstrittene Datensatz
Im Zentrum der Anschuldigungen steht der Datensatz Books3. Dabei handelt es sich um eine Sammlung von Büchern, die laut Klageschrift ohne Erlaubnis der Rechteinhaber digitalisiert und verbreitet wurden – also um Raubkopien. Dieser Datensatz wurde unter anderem im Projekt RedPajama eingesetzt, das wiederum in Apples eigener Veröffentlichung zu den OpenELM-Modellen als Datenquelle genannt wird. Apple hat die OpenELM-Modelle im Jahr zuvor auf der Plattform Hugging Face veröffentlicht und in einem begleitenden Papier detailliert erklärt, wie sie trainiert wurden. Aus diesen Informationen geht hervor, dass RedPajama – und damit indirekt Books3 – Teil des Trainingsmaterials war. Die Kläger argumentieren, dass Apple damit wissentlich urheberrechtlich geschützte Inhalte genutzt habe, um ein eigenes kommerzielles KI-Modell zu entwickeln. Besonders kritisch sehen sie, dass Apple die Inhalte nicht selbst erstellt oder lizenziert habe, sondern auf eine Datenquelle zurückgriff, die seit längerem wegen Urheberrechtsverletzungen in der Kritik steht.
OpenELM und Foundation Language Models im Fokus
Die Klage betrifft nicht nur OpenELM, Apples quelloffenes Sprachmodell, sondern auch die sogenannten Foundation Language Models des Unternehmens. Diese proprietären Modelle sollen laut Klage ebenfalls mit Books3 trainiert worden sein, was die Autoren als systematische Verletzung geistigen Eigentums werten. Das Ziel der Klage ist unter anderem die vollständige Zerstörung aller KI-Modelle und Datensätze, die Inhalte der betroffenen Autoren enthalten. Grundlage dafür ist Paragraph 503(b) des US-Urheberrechtsgesetzes, der es erlaubt, illegal hergestellte Kopien zu vernichten. Darüber hinaus fordern die Kläger die Zulassung der Sammelklage, Schadenersatz, Rückzahlungen, eine dauerhafte Unterlassungsverfügung gegen Apple sowie die Übernahme aller Anwaltskosten.
Rechtslage unklar – Vergleich mit anderen Fällen
Der Fall gegen Apple ist nicht der erste seiner Art. In den letzten Monaten wurden mehrere große KI-Unternehmen wegen ähnlicher Vorwürfe verklagt. Der bislang größte Vergleich wurde mit Anthropic erzielt: 1,5 Milliarden US-Dollar zahlte das Unternehmen, um einen Urheberrechtsstreit beizulegen. Anders lief es bei Meta. Hier wurde eine Klage abgewiesen, weil das Gericht entschied, dass die Nutzung urheberrechtlich geschützter Bücher für das Training von KI unter die sogenannte „Fair Use“-Regel falle. Diese erlaubt eine bestimmte Nutzung geschützter Inhalte ohne Zustimmung der Rechteinhaber, etwa zu Forschungs- oder Analysezwecken. Auch in der Politik ist das Thema angekommen. US-Präsident Donald Trump äußerte sich kürzlich zu den laufenden Verfahren. Er stellte infrage, ob es realistisch sei, für jede einzelne Textquelle Lizenzen zu erwerben, und argumentierte, dass dies die Entwicklung von KI erheblich ausbremsen würde.
Bedeutung des Falls für Apple und die Branche
Die Klage gegen Apple hat das Potenzial, juristische Standards für den Umgang mit urheberrechtlich geschützten Texten im KI-Bereich zu beeinflussen. Sollte das Gericht zugunsten der Kläger entscheiden, könnten zahlreiche Sprachmodelle rechtlich angreifbar werden – nicht nur bei Apple. Gleichzeitig steht Apple als einer der weltweit führenden Technologiekonzerne unter besonderer Beobachtung. Für die betroffenen Autoren geht es um den Schutz ihrer kreativen Arbeit. Für Apple geht es um den rechtlichen Rahmen, in dem KI-Entwicklung künftig stattfinden darf. Und für die gesamte Branche stellt sich die grundlegende Frage: Wo verläuft die Grenze zwischen technologischem Fortschritt und geistigem Eigentum? (Bild: Shutterstock / iwonder TV)
- Apple Vision Pro zwischen Innovationsdruck und Nischen-Erfolg
- Apple Aktie: Bank of America hebt Kursziel auf 260 Dollar