Beteiligt die Autoren!: Der Datenklau der Algorithmen

Das Sprachmodell ChatGPT sorgt für Furore. Die Künstliche Intelligenz, die mit riesigen Textmengen aus dem Internet trainiert wurde, produziert auf Knopfdruck Texte. Drehbücher, Essays, Gedichte, sogar Code schreiben kann das Tool. Und das in einer Qualität, die selbst Fachleute verblüfft. So hat die Software kürzlich erfolgreich eine Jura-Prüfung an einer US-Hochschule bestanden. ChatGPT gehört zu einer neuen Generation von KI-Systemen, die das Zeug hat, die Kulturproduktion zu revolutionieren: die sogenannte generative AI.

Das Sprachmodell errechnet eine Wahrscheinlichkeit, mit der ein Wort auf das nächste folgt – und erstellt auf dieser Grundlage selbständig logisch kohärente Texte. Man kann es sich ein wenig wie die Fallblattanzeigen an Bahnhöfen und Flughäfen vorstellen, die die Ankunftszeit von Flügen und Zügen angeben und deren einzelne Blättchen sich mit einem lauten Klappern alle 15 Minuten aktualisieren – nur, dass ChatGPT weitaus mehr Zeichenkombinationen beherrscht und auch nicht Gefahr läuft, dass sich Feinstaub in den Schaltwerken festsetzt (an der Ästhetik von Flughafentafeln orientierte sich der „Landsberger Poesieautomat“, den der Schriftsteller Hans Magnus Enzensberger konstruierte und der nach dem Zufallsprinzip lyrische Sechszeile produzierte).

Künstliche Intelligenz operiert mit Tonschnipseln und Pixeln

Ganz ähnlich funktionieren KIs, die Musik komponieren oder Bilder malen, mit dem Unterschied, dass die Software nicht mit Buchstaben, sondern mit Tonschnipseln oder Pixeln operiert. Der Bildgenerator DALL-E etwa, der ebenfalls aus der Softwareschmiede von Open AI stammt, erstellt auf Knopfdruck Bilder. Gibt man in das kleine Suchfeld das Sujet „cristiano ronaldo playing soccer on mars“ (Cristiano Ronaldo spielt Fußball auf dem Mars) ein, erhält man ein abstraktes Öl-Gemälde, das aussieht, als hätte ein Maler zum Pinsel gegriffen. Ist das Kunst? Oder kann das weg?

Die Frage, ob die maschinelle Verknüpfung von Pixeln und Zeichen nach einer rein mathematischen Logik Kunst darstellt, stellt den Kulturbegriff auf eine harte Probe, denn unser Verständnis von Kultur basiert ja darauf, dass geistige Schöpfungen etwas sind, was nicht immer planvoll, kalkulierend, sondern zufällig zustande kommt. Das unterscheidet den Menschen von einer (Rechen-)Maschine. Und genau auf dieser Vorstellung beruht auch das Urheberrecht: dass leicht kopierbare Werke schutzwürdig sind, weil sonst überhaupt kein Anreiz mehr bestünde, Neues zu schaffen.

Wenn Künstliche Intelligenz Artefakte in kleinste Sinneinheiten zerlegt, ist der Schöpfer nackt

Nun haben digitale Technologien das Urheberrecht in den vergangenen Jahren empfindlich geschleift. Das Internet ist ein billiger Copy-Shop, wo man sich diverse Objekte zusammenkopieren kann: Texte, Bilder, Gifs. Die Rechtsprechung hat die Messlatte für die sogenannte Schöpfungshöhe, die für den Werkscharakter maßgeblich ist, in den vergangenen Jahrzehnten deutlich gesenkt.

Nach der Formel der „kleinen Münze“ gelten sogar Preislisten und Telefonbücher als urheberrechtlich geschützt. Wenn aber eine Künstliche Intelligenz Artefakte bis auf ihre kleinsten Sinneinheiten zerlegt und den Menschen in seiner Formelhaftigkeit entlarvt, ist da nichts mehr, was geschützt werden könnte. Der Schöpfer ist nackt. Ein Renoir unterscheidet sich von einem Picasso nur durch ein anderes Pixelmuster.

Bevor man nun über den Urheberrechtschutz computergenerierter Werke redet, sollte man über die Schutzwürdigkeit derer diskutieren, die zum Milliardenmarktwert von Open AI und anderer Softwarefirmen beitragen: Wikipedia-Autoren, Buchautoren., Illustratoren, Lektoren, Fotografen. Sie liefern mit ihren Werken die Vorprodukte für einen industriellen Weiteverarbeitungsprozess: Trainingsdaten, mit denen die KI gefüttert wird.

Tech-Konzerne wie Google und Amazon bedienen sich seit Jahren an frei zugänglichen Internettexten wie der englischsprachigen Wikipedia wie an einem Steinbruch, ohne die Autoren bzw. Organisationen daran zu beteiligen. Die Kleckerbeträge, die Google und Amazon an die Wikimedia Foundation spenden, wiegen den ökonomischen Nutzen, den die Konzerne aus der Online-Enzyklopädie ziehen, in keiner Weise auf.

Nun war es schon immer ein Webfehler der Commons-Idee, dass nicht nur die Allgemeinheit, sondern auch gewinnorientierte Akteure von gemeinnütziger Arbeit profitieren. Das Dilemma der „Tragik der Allmende“ ist aus der Volkswirtschaft wohlbekannt. Man kann Amazon nicht verbieten, seine Sprachassistentin Alexa mit Wikipedia-Texten zu trainieren, sonst müsste Wikipedia seine Grundprinzipien von heute auf morgen über Bord werfen.

Doch die Hemmungslosigkeit, mit der Tech-Konzerne die digitale Allmende abweiden und damit ihre eigenen Geschäftsmodelle speisen, wirft die Frage auf, unter welchen Umständen künftig noch Gemeinschaftsgüter produziert werden. Wer pflegt noch Wikipedia-Artikel, wenn diese für kommerzielle Suchanfragen oder Antwortbausteine genutzt werden? Wer schreibt noch Bücher, wenn Sprachmodelle Versatzstücke zu drittklassigen Romanen verleimen und damit Verlagsprogramme bestückt werden?

In Großbritannien gingen Musikschaffende bereits auf die Barrikaden

In Großbritannien gingen im vergangenen Jahr Musikschaffende auf die Barrikaden, weil die Regierung das Data Mining weitegehend liberalisieren wollte. In einem offenen Brief an die Kulturstaatssekretärin Nadine Dorries warnten die Künstler vor einem „music laundering“ durch KI, einer „Musikwäsche“, bei der Ideenklau durch Algorithmen reingewaschen werde.

Auch die Justiz ist mit der Angelegenheit befasst. So hat die amerikanische Bildagentur Getty in Großbritannien vor wenigen Tagen Klage gegen die Softwarefirma Stability AI eingereicht, die einen Bildgenerator herausgibt. Der Vorwurf: Stability AI habe unrechtmäßig Material aus Gettys Bilddatenbank verwendet.

29

Milliarden Dollar beträgt laut dem „Wall Street Journal“ der Marktwert des Unternehmens OpenAI.

Wenn künftig KI-Systeme kommerziell Bücher schreiben oder Lieder komponieren, braucht es für diese Art der maschinellen Zweitverwertung einen fairen Ausgleich: ein Vergütungssystem, das Urheber angemessen an ihren Werken beteiligt. Institutionalisiert werden könnte dies durch eine Verwertungsgesellschaft nach dem Vorbild der VG Wort. Künstler sind keine Datenmineure, die im Bergbau der Zeichen schürfen, ihre Ideen kein Abfall, den man zu neuem Stoff recycelt.

Es käme ja auch niemand auf die Idee, sich von einem Straßenzeichner malen zu lassen, um dann, nachdem man das Porträt abfotografiert und mit einem KI-basierten Insta-Filter bearbeitet hat, ohne Bezahlung zu sagen: „Vielen Dank, hat Spaß gemacht!“ Achtung vor Kunst drückt sich auch in anständiger Bezahlung aus.

Das gilt im Übrigen auch für diejenigen, die die Grundlage dafür schaffen. So wurde bekannt, dass Open AI Tausende Clickworker in Uganda, Kenia und Indien beschäftigt, die für weniger als zwei Dollar die Stunde gewaltverherrlichende Texte labeln mussten. KI bedeutet jede Menge Handarbeit, und der Mensch ist immer noch die billigere Sortiermaschine. Das ist eine traurige Wahrheit, die einem der Plapperautomat ChatGPT nicht erzählt.

Zur Startseite