Jagd auf alte Bücher: Wie KI-Firmen Antiquariate leerkaufen und Kulturgut vernichten

700.000 Bücher allein in Deutschland – und sie landen im Müll

Es begann mit nächtlichen Massenbestellungen. Ab Anfang Mai 2026 trafen bei einem deutschen Online-Antiquariat systematisch zwischen drei und fünf Uhr morgens automatisierte Aufträge ein – immer exakt ein Exemplar pro Titel, immer Non-Fiction ab 1970 mit ISBN. Der Händler wurde stutzig, tauschte sich mit Kollegen aus und entdeckte: Dutzende Antiquariate in ganz Europa erlebten dasselbe.

Der Käufer: ein kanadisches Unternehmen namens Zoom Books. Die Ware: vergriffene Kochbücher, Biografien, Fachliteratur – Lagerleichen, die seit Jahren niemand haben wollte. Der Verwendungszweck: mutmaßlich KI-Trainingsdaten. Und das Ziel nach dem Scannen: die Tonne.

Was der Schweizer Rundfunk (SRF) am 22. Juni 2026 enthüllte, ist kein Einzelfall – es ist ein systemisches Phänomen mit kulturellen Konsequenzen, über die bisher kaum jemand spricht.

Die Masche: Kaufen, Scannen, Wegwerfen

Das Geschäftsmodell ist erschreckend einfach. KI-Unternehmen brauchen riesige Mengen an Textdaten für das Training ihrer Sprachmodelle. Die frei zugänglichen Texte im Internet sind weitgehend ausgeschöpft – moderne Large Language Models haben das öffentliche Web durchkämmt, was durchkämmbar war.

Also greifen sie zu gedruckten Büchern. Gezielt gesucht werden alte Fachbücher aus Regionalgeschichte, Sprach-, Rechts- und Wirtschaftswissenschaften – Texte mit historischen Sprachstufen und stilistischen Feinheiten, die im heutigen Internet schlicht nicht existieren. Diese „Datenlücke“ macht antiquarische Bestände zum begehrten Rohstoff.

Zoom Books bestreitet die Vorwürfe und verweist auf ein reguläres Recycling- und Handelsmodell. Doch die Systematik der Käufe spricht eine andere Sprache: Auf Lagerfotos sieht man die Bücher lieblos in große Kisten geworfen – kein seriöser Buchhändler behandelt Ware so. Für den EU-Markt wurde ein Zwischenlager an der tschechisch-deutschen Grenze hochgezogen. Branchenkenner schätzen das Volumen auf 700.000 Titel allein in Deutschland, drei Millionen weltweit.

Der Fair-Use-Trick: Eine juristische Grauzone

Hinter dem Phänomen steckt ein umstrittenes Konstrukt aus dem US-amerikanischen Urheberrecht. Wer digitale Texte aus dem Netz kopiert, riskiert Schadensersatzklagen. Wer Bücher hingegen physisch kauft und nach dem Einlesen vernichtet, kann sich auf das Fair-Use-Prinzip berufen – so zumindest die Logik der KI-Firmen.

Das Fair-Use-Prinzip erlaubt in den USA die Nutzung urheberrechtlich geschützten Materials ohne Erlaubnis, sofern sie „transformativ“ ist und der öffentlichen Bildung dient. Die Argumentation der Unternehmen: Wir besitzen die Bücher, wir „lesen“ sie nur – und weil wir die physischen Kopien danach vernichten, bleibt keine widerrechtliche digitale Kopie im Umlauf.

„Die Annahme ist: Sie müssen die Bücher physisch besitzen und nach dem ‚Lesen‘ vernichten – um zu argumentieren, dass keine widerrechtliche Kopie im Umlauf bleibt und es als Fair Use durchgeht“, erklärt ein betroffener Buchhändler gegenüber SRF.

Der Präzedenzfall Anthropic: Project Panama

Die Methode ist nicht neu. Bereits im Januar 2026 enthüllte die Washington Post ein internes Projekt des KI-Unternehmens Anthropic mit dem bezeichnenden Codenamen „Project Panama“. Dessen Ziel, so interne Dokumente: „destructively scan all the books in the world“ – alle Bücher der Welt zerstörend zu scannen.

Anthropic, das Unternehmen hinter dem KI-Assistenten Claude, hatte Millionen von Büchern erworben, gescannt und den Inhalt in seine Sprachmodelle eingespeist. Ein US-Bundesrichter entschied im Juni 2025, dass diese Praxis für legal erworbene Bücher unter Fair Use fällt – sie sei „außergewöhnlich transformativ“. Gleichzeitig ordnete der Richter einen Prozess zu den raubkopierten Büchern an, die Anthropic zum Aufbau einer internen „Forschungsbibliothek“ verwendet hatte. Im August 2025 einigte sich Anthropic mit Autoren und Verlagen auf einen 1,5-Milliarden-Dollar-Vergleich – ohne Schuldeingeständnis.

Das Urteil schafft einen gefährlichen Präzedenzfall: Legal gekaufte Bücher zerstörend zu scannen, ist Fair Use. Nur Piraterie ist illegal. Die Botschaft an die Branche ist verheerend klar. Und genau in diese Lücke stößt nun Zoom Books – in industriellem Maßstab. Dass die US-Regierung Anthropic erst kürzlich zur Abschaltung von Fable 5 zwang, zeigt, wie tief der Konflikt zwischen KI-Firmen und Regulierungsbehörden inzwischen reicht.

Was das für Deutschland und Europa bedeutet

Für Europa ist diese Entwicklung ein doppelter Albtraum – juristisch wie kulturell.

Erstens: Das Urheberrecht. Anders als die USA kennt das europäische Recht kein vergleichbares Fair-Use-Prinzip. Die EU-Urheberrechtsrichtlinie erlaubt Text- und Data-Mining nur unter engen Voraussetzungen – und Rechteinhaber können dem ausdrücklich widersprechen (Opt-out). Dass nun US-Firmen über ein Zwischenlager an der tschechisch-deutschen Grenze europäische Bücher aufkaufen und in die USA verschiffen, um sie dort unter US-Recht zu scannen, ist eine gezielte Umgehung europäischer Schutzstandards.

Zweitens: Das kulturelle Erbe. Antiquariate funktionieren traditionell als zirkulierende Bibliotheken: Alte Titel gehen in den Handel, werden verkauft, kommen Jahre später wieder zurück. Werden vergriffene Bücher nun systematisch aufgekauft und zu Altpapier vernichtet, verschwindet dieses Wissen unwiederbringlich aus dem analogen Kreislauf. Es konzentriert sich als exklusive Datenmasse in den Händen weniger US-Konzerne – still, systematisch und bisher ohne öffentliche Debatte.

Drittens: Das Demokratie-Problem. Die Kontrolle über historische Quellen, über seltene Sprachstufen, über Nischenwissen ist keine rein wirtschaftliche Frage. Wer die Trainingsdaten kontrolliert, kontrolliert auch, welches Wissen KI-Modelle reproduzieren – und welches nicht. Wenn europäische Regionalgeschichte nur noch in den Gewichtungen US-amerikanischer Sprachmodelle existiert, ist das ein fundamentales Problem kultureller Souveränität.

Pro und Contra: Die unbequeme Abwägung

✅ Dafür spricht:

Bessere KI-Modelle: Gedruckte Bücher enthalten Sprachmuster und Wissensbestände, die im Web nicht verfügbar sind. Ihre Nutzung kann KI-Sprachmodelle nuancierter und historisch präziser machen.
Wirtschaftlicher Anreiz für Antiquariate: Händler werden jahrzehntealte, unverkäufliche Lagerbestände los. Das kurzfristige Geschäft ist für viele existenzsichernd.
Wissensdemokratisierung: Inhalte, die in vergriffenen Büchern schlummerten, werden – zumindest indirekt – über KI-Modelle wieder zugänglich.
Keine Urheberrechtsverletzung im klassischen Sinn: Die Bücher werden legal erworben. Das Fair-Use-Urteil gibt der Praxis eine – wenn auch umstrittene – rechtliche Grundlage.

❌ Dagegen spricht:

Unwiederbringlicher Kulturverlust: Jedes vernichtete Buch ist für immer weg. Anders als digitale Daten können physische Bücher nicht „wiederhergestellt“ werden.
Umgehung europäischen Rechts: Die Export-nach-USA-Masche hebelt gezielt EU-Schutzstandards für Text- und Data-Mining aus.
Konzentration von Wissen: Das analoge Erbe Europas wird zur exklusiven Datenmasse weniger US-Konzerne. Das ist ein Monopol auf kulturelles Gedächtnis.
Fehlende Transparenz: Autoren und Verlage erfahren nicht, dass ihre Werke gescannt und in KI-Modelle eingespeist wurden – von Vergütung ganz zu schweigen.
Präzedenzwirkung: Das Anthropic-Urteil ermutigt weitere Akteure zu derselben Praxis. Die drei Millionen von Zoom Books sind vermutlich erst der Anfang.

Einordnung

Die Pro-Argumente sind real, aber sie wiegen leicht gegenüber dem systematischen, intransparenten und irreversiblen Charakter der Praxis. Dass Antiquariate kurzfristig profitieren, ist kein Argument für eine Entwicklung, die langfristig genau diese Antiquariate ihrer Existenzgrundlage beraubt. Und dass Wissen „demokratisiert“ wird, indem es in proprietären KI-Modellen verschwindet, ist ein Widerspruch in sich. Die öffentlich finanzierte Alternative – etwa Harvards Million-Book-Corpus mit gemeinfreien Werken – zeigt, dass es auch anders ginge.

Drei Dinge, die jetzt passieren müssen

1. EU-weite Meldepflicht für Massenaufkäufe. Wenn systematisch Bücherkontingente für KI-Training exportiert werden, muss das Transparenzregistern unterliegen – analog zu Rüstungsexporten oder Kulturgutschutz. Nationalbibliotheken sollten ein Vorkaufsrecht für bedrohte Bestände erhalten.

2. Opt-out durchsetzen, nicht nur deklarieren. Das europäische Text- und Data-Mining-Opt-out muss technisch und rechtlich so ausgestaltet werden, dass es nicht durch physischen Kauf und Export umgangen werden kann. Das ist eine Aufgabe für den EU-Gesetzgeber – und sie duldet keinen Aufschub.

3. Öffentliche Digitalisierungsprogramme ausbauen. Statt das analoge Erbe an private US-Konzerne zu verlieren, braucht Europa eigene, offen lizenzierte Digitalisierungsinitiativen – finanziert durch öffentliche Mittel, zugänglich für alle. Die Harvard-Initiative mit einer Million gemeinfreier Bücher zeigt, dass der Weg über öffentlich finanzierte Korpora funktioniert. Was Tech-Konzerne mit Angst-Narrativen erreichen, zeigt im Umkehrschluss, wie wichtig unabhängige Dateninfrastrukturen sind.

Fazit

Die Jagd auf alte Bücher ist kein Kavaliersdelikt. Sie ist die Spitze eines Eisbergs, an dem sich entscheidet, wem das kulturelle Gedächtnis der Welt gehört. Dass KI-Firmen Bücher aufkaufen und vernichten, mag juristisch in einer Grauzone operieren – kulturell ist es ein Brandschatzen des kollektiven Wissens.

Wenn dreieinhalb Millionen Bücher still und heimlich in US-Rechenzentren verschwinden, während Europas Antiquariate leergekauft werden, dann ist das nicht Fortschritt. Es ist digitaler Kolonialismus mit ISBN-Nummern. Und die Uhr tickt – denn die nächste Massenbestellung kommt bestimmt.

FAQ

Warum kaufen KI-Firmen überhaupt alte Bücher?

Die frei verfügbaren Texte im Internet sind für das Training moderner KI-Sprachmodelle weitgehend ausgeschöpft. Gedruckte Bücher – besonders ältere Fachliteratur – enthalten Sprachmuster, Fachwissen und stilistische Feinheiten, die online nicht existieren. Sie sind das letzte große, unerschlossene Textreservoir.

Ist das legal?

In den USA hat ein Bundesrichter 2025 entschieden, dass das Scannen legal erworbener Bücher für KI-Training unter Fair Use fallen kann. In Europa hingegen gelten strengere Regeln: Text- und Data-Mining ist nur unter engen Bedingungen und mit Opt-out-Möglichkeit für Rechteinhaber erlaubt. Der Export von Büchern in die USA, um dort unter laxerem Recht zu scannen, umgeht gezielt europäische Schutzstandards.

Welche Bücher sind besonders betroffen?

Laut den betroffenen Händlern werden vor allem Non-Fiction-Titel ab Erscheinungsjahr 1970 mit ISBN-Nummern aufgekauft. Besonders begehrt: alte Fachbücher aus Regionalgeschichte, Sprach-, Rechts- und Wirtschaftswissenschaften – also Texte mit spezifischem Vokabular, das im Internet unterrepräsentiert ist.

Was können Autoren und Verlage tun?

Sie können vom europäischen Opt-out-Recht für Text- und Data-Mining Gebrauch machen. Allerdings hilft das nur, wenn der Scan in der EU stattfindet. Bei Export in die USA griffe US-Recht. Hier besteht dringender gesetzgeberischer Handlungsbedarf auf EU-Ebene.