
Ki-Training
trotz
Nutzungsvorbehalt.
Ki-Training
trotz
Nutzungsvorbehalt.
von
Darf man Fotos aus dem Internet herunterladen, um KI-Modelle zu trainieren? Wann ist ein Nutzungsvorbehalt gegen KI-Training wirksam? Und warum scheitern klassische AGB-Klauseln an der Hürde der Maschinenlesbarkeit?
Ki-Training mit Fotos
Ausgangspunkt war ein Foto, das von einem professionellen Fotografen aufgenommen und über eine bekannte Bildagentur online vermarktet wurde. Auf der Website der Agentur war das Bild öffentlich abrufbar – allerdings nur als mit Wasserzeichen versehene Vorschauversion, flankiert von Nutzungsbedingungen, die automatisierte Zugriffe und Scraping untersagten.
Im Jahr 2021 griff ein eingetragener Verein, der sich der Erforschung und Entwicklung Künstlicher Intelligenz verschrieben hat, im Rahmen eines automatisierten Prozesses auf dieses Foto zu. Das Ziel bestand nicht darin, das Bild selbst zu veröffentlichen oder weiterzuverwerten, sondern es in einen riesigen Datensatz mit Milliarden von Bild-Text-Paaren einzubeziehen. Hierzu wurde das Foto kurzzeitig heruntergeladen, maschinell mit einer bereits vorhandenen Bildbeschreibung abgeglichen und anschließend nicht gespeichert. In den Datensatz aufgenommen wurden lediglich Metadaten und ein Verweis auf die ursprüngliche Fundstelle im Internet.
Der Fotograf sah darin eine unzulässige Nutzung seines Werks zur Erstellung von KI-Trainingsdaten und verlangte Unterlassung. Nachdem das Landgericht Hamburg die Klage abgewiesen hatte, verfolgte er sein Begehren in der Berufung weiter und zwang somit das Hanseatische Oberlandesgericht, sich grundlegend mit der Frage auseinanderzusetzen, wann ein Nutzungsvorbehalt gegen Text- und Data-Mining tatsächlich wirksam ist.
Opt-out nur, wenn Maschinen es verstehen
Das deutsche Urheberrecht erlaubt Text- und Data-Mining grundsätzlich auch ohne Lizenz, sofern das Werk rechtmäßig zugänglich ist. Diese gesetzliche Erlaubnis kann jedoch ausgeschlossen werden. Voraussetzung ist ein Nutzungsvorbehalt. Für online zugängliche Werke gilt dabei eine entscheidende Einschränkung: Der Vorbehalt ist nur wirksam, wenn er in maschinenlesbarer Form erfolgt.
Diese Formulierung mag technisch klingen, ist aber rechtlich hoch aufgeladen. Denn sie verlagert die Wirksamkeit eines urheberrechtlichen Verbots aus der klassischen Welt der Vertragstexte in die Sphäre automatisierter Systeme. Genau hier setzt das Urteil an.
Im entschiedenen Fall hatte die Bildagentur, über die der Fotograf sein Werk vertrieb, in ihren Nutzungsbedingungen einen unmissverständlichen Passus aufgenommen. Automatisierte Zugriffe, Scraping, Indexierung – all das war untersagt. Für menschliche Leser eindeutig. Aber auch für Maschinen?
Was das OLG Hamburg unter Maschinenlesbarkeit versteht
Mit seinem Urteil vom 10.12.2025 – Az. 5 U 104/24 macht das OLG Hamburg deutlich, dass Maschinenlesbarkeit nicht mit bloßer maschineller Erfassbarkeit gleichzusetzen ist. Es genügt nicht, dass ein Text technisch ausgelesen werden kann. Entscheidend ist vielmehr, ob ein automatisiertes System den Vorbehalt auffinden, interpretieren und bei der Entscheidung über die Nutzung zuverlässig berücksichtigen kann.
Damit verschiebt das Gericht den Maßstab weg von der menschlichen Perspektive. Die Frage lautet nicht: „Kann man das Verbot lesen?“, sondern: „Kann ein automatisierter Prozess es eindeutig umsetzen?“
Diese Unterscheidung ist zentral. Denn sie erklärt, warum ein AGB-Text selbst dann nicht genügt, wenn er sprachlich eindeutig formuliert ist. Maschinen müssen nicht nur Wörter erkennen, sondern deren rechtliche Bedeutung korrekt einordnen – und zwar ohne Auslegung, Kontextwissen oder juristische Subsumtion.
Das OLG formuliert diese Linie nicht ausdrücklich technisch, aber dogmatisch präzise. Maschinenlesbarkeit ist funktional zu verstehen. Sie liegt nur dann vor, wenn der Vorbehalt geeignet ist, automatisierte Abläufe tatsächlich zu steuern.
Maßstab zur Maschinenlesbarkeit
Auf welchen Zeitpunkt kommt es bei der Frage der Maschinenlesbarkeit an? Das OLG Hamburg stellt klar: Maßgeblich ist nicht der aktuelle Stand der Technik, sondern der Zeitpunkt der beanstandeten Nutzung. Der Download des Fotos erfolgte in der zweiten Jahreshälfte 2021.
Der Fotograf argumentierte, dass moderne Tools oder KI-Systeme durchaus in der Lage seien, AGB-Texte auszuwerten. Das OLG ließ dieses Argument jedoch nicht gelten. Entscheidend sei, ob solche Möglichkeiten zum damaligen Zeitpunkt zuverlässig bestanden hätten. Dazu fehle es an substantiiertem Vortrag.
Damit weist das Gericht das Risiko klar zu. Wer sich auf einen Nutzungsvorbehalt beruft, muss darlegen können, dass dieser im relevanten Zeitraum maschinenlesbar war. Ein späterer technologischer Fortschritt heilt diesen Mangel nicht.
Der Rechteinhaber muss darlegen, dass der von ihm gewählte oder ihm jedenfalls zurechenbare Nutzungsvorbehalt zum Zeitpunkt der angegriffenen Nutzungshandlung maschinenlesbar war.
Diese zeitliche Fixierung verleiht dem Urteil zusätzliche Schärfe. Sie zeigt, dass Maschinenlesbarkeit kein abstraktes Ideal ist, sondern eine konkrete, beweisbedürftige Tatsache.
AGB, Quellcode, Metadaten – alles nicht genug
Bemerkenswert ist, dass das OLG selbst dann keinen wirksamen Vorbehalt annimmt, wenn der Text nicht nur in den AGB, sondern auch im Quellcode der Website enthalten war. Auch das genügt nicht, solange nicht ersichtlich ist, dass automatisierte Systeme den Vorbehalt tatsächlich als rechtlich relevantes Signal erkennen konnten.
Der Senat macht damit deutlich: Maschinenlesbarkeit ist keine Frage des Speicherorts, sondern der Struktur.
Ein in natürlicher Sprache formulierter Text bleibt aus Sicht des Gerichts interpretationsbedürftig. Genau diese Interpretationsbedürftigkeit widerspricht dem Zweck der Regelung. Denn Text und Data Mining soll vollautomatisch möglich sein – und ebenso vollautomatisch unterbleiben, wenn ein wirksames Opt-out besteht.
KI-Training erlaubt
Der Senat beginnt mit einer Selbstverständlichkeit: Das automatisierte Herunterladen eines Fotos stellt eine Vervielfältigung dar. Die Tatsache, dass der Verein das Bild nur für Sekunden im System hielt und anschließend lediglich die Metadaten in den Datensatz übernahm, macht diese Handlung urheberrechtlich nicht weniger relevant.
Gleichzeitig hält das OLG die Nutzung für von der Schranke des Text- und Data-Minings gedeckt. Der Zweck des Downloads war eindeutig: Das Bild sollte automatisiert mit der bereits vorhandenen Textbeschreibung verglichen werden. Damit sei die Tätigkeit als Text- und Data-Mining zu qualifizieren – und grundsätzlich erlaubt, solange das Werk rechtmäßig zugänglich war. Das war es hier mangels eines maschinenlesbaren Nutzungsvorbehalts.
Fast nebenbei bestätigt das OLG außerdem, dass sich der beklagte Verein zusätzlich auf die Forschungsschranke des § 60d UrhG berufen kann. Die Validierung und Qualitätssicherung von Datensätzen sei ein genuin wissenschaftlicher Prozess, auch wenn die Ergebnisse später in kommerziellen KI-Systemen verwendet werden. Die gelegentlich geäußerte Sorge, dass § 60d für private Forschungseinrichtungen nicht greife, wies das OLG zurück.
Bedeutung für die Praxis
Wer verhindern möchte, dass Inhalte für Text und Data Mining – und damit mittelbar für KI-Training – genutzt werden, muss sicherstellen, dass der Nutzungsvorbehalt maschinenlesbar ist und dies im Zweifel auch nachweisen können.
Fazit
Auch nach dieser Entscheidung ist die Frage, wie ein maschinenlesbarer Nutzungsvorbehalt für das Training von KI aussehen muss, unklar. Das Gericht stellt nämlich klar, dass es auf den jeweiligen Zeitpunkt ankommt. Aufgrund der exponentiellen Entwicklung von Künstlicher Intelligenz könnte der Sachverhalt heute anders zu beurteilen sein. Zudem verfügt nicht jede KI über die gleichen Fähigkeiten.
Solange es keinen einheitlichen Standard gibt, ist auch nicht eindeutig, ob Mittel wie robots.txt-Dateien, strukturierte Metadaten oder spezifische TDM-Opt-out-Protokolle reichen.
Um die Rechtsunsicherheit zu beseitigen, wären daher verbindliche Standards wichtig, um mehr Rechtssicherheit für Rechteinhaber und Betreiber von KI-Systemen zu schaffen.
Wir beraten
Sie gerne zum
Thema KI!







