Kurz notiert: CC Signals

Ich bin heute auf die Ankündigung von Creative Commons zu den so genannten CC Signals gestoßen und habe mir ein bisschen Zeit genommen, um mich dazu zu orientieren. Meine ersten Learnings und Schlussfolgerungen teile ich hier.

Was ist CC Signals?

Die Abkürzung CC steht für Creative Commons. Bisher arbeite ich vor allem mit dem Lizenzset dieser Organisation. Denn die ‚Creative Commons Lizenzen‘ haben sich als Standard im pädagogischen Bereich bei der Arbeit mit Open Educational Resources (OER) etabliert. Mit einer CC-Lizenz lässt sich bei einem Inhalt festlegen, wie er weiter genutzt werden darf.

Als die CC-Lizenzen entwickelt wurden, gab es generative KI-Systeme in der heutigen Form und Verfügbarkeit noch nicht. Inwieweit CC-lizenzierte Inhalte für das Training von KI-Modellen verwendet werden dürfen, ist deshalb nicht geregelt. Genau diese Lücke wird mit CC Signals zu schließen versucht. Die Argumentation lautet: Wenn wir es nicht regeln, wird nicht mehr geteilt. Das ist schlecht für alle!

(Für die individuelle Nutzung kommt man mit CC-Lizenzen dagegen schon jetzt durchaus weiter: Einen Text der z.B. unter CC BY lizenziert ist, darf ich in ein Sprachmodell eingeben und mir eine Zusammenfassung generieren lassen, aber muss dann eben bei der Weiternutzung des neu entstandenen Textes einen entsprechenden Lizenzhinweis angeben. Das ist lizenztechnisch ähnlich, als wenn ich einen CC-BY lizenzierten Text mit einem Übersetzungstool übersetzen lasse).

Wie funktioniert CC Signals?

CC Signals sollen eine Art Set, wie auch bei den bisherigen Lizenzen und zusätzlich zu diesen werden. Man soll sich somit aus einzelnen Bestandteilen ein passendes CC Signal zusammen stellen können.

Diese Elemente werden diskutiert:

  • Credit – Namensnennung (= Nennung des Urhebers + Quelle)
  • Direct Contribution – direkte Unterstützung (Zahlt oder unterstützt direkt den Rechteinhaber.)
  • Ecosystem Contribution – Unterstützung des Ökosystems (= Zahlt oder unterstützt die Gemeinschaft, aus der der Inhalt stammt.)
  • Open – Offenheit (= Nutzung ist nur erlaubt mit einem offenen KI-System).

Spontan fände ich für meine weiterhin unter CC BY veröffentlichten Inhalte z.B. das CC Signal Credit + Open sympathisch. Dieses würde ich dann zusammen mit der Lizenz sowohl maschinenlesbar als auch für Menschen lesbar auf meine Website packen.

Kann ich die CC Signals jetzt schon nutzen?

Bis jetzt gibt es die CC Signals nur als Ankündigung und ersten Entwurf. Das Ziel ist nun, gemeinsam mit der Community daran zu arbeiten und zu diskutieren. Eine erste richtige Version soll dann planmäßig im Spätherbst veröffentlicht werden.

Offene Fragen betreffen insbesondere die Frage, wie die geplante Unterstützung in den Signals geregelt werden soll.

Um sich an der Entwicklung und Diskussion zu beteiligen, nutzt man am besten das dafür eingerichtete Github-Repository. Zum Austausch in sozialen Netzwerken gibt es den Hashtag #CCSignals.

Sind CC Signals eine gute Sache?

Zu dieser Frage habe ich noch keine abschließende Einschätzung, aber zumindest ein paar erste, kritische Gedanken von anderen zusammen getragen:

  1. Wenn man gegenüber KI-Systemen grundsätzlich kritisch bis ablehnend eingestellt ist, dann sind die CC Signals definitiv ein schlechter Weg. Es wäre dann sinnvoller, direkt in den Lizenzen festzulegen, dass ein Training mit offenen Inhalten grundsätzlich untersagt ist. Das lässt sich damit begründen, dass man Inhalte unter CC freigegeben hat, damit andere Menschen (!) – nicht Maschinen – diese Inhalte weiternutzen können. Vor diesem Hintergrund können CC Signals auch als unpassend für die CC Community eingeordnet werden.
  2. Die CC Signals könnten technisch zum Beispiel in einer robots.txt Datei auf einer Website oder einem Repository abgelegt werden. Diese Datei würde AI-Crawlern signalisieren, was mit den Inhalten gemacht oder auch nicht gemacht werden darf. Das Problem ist allerdings, dass sich offensichtlich die wenigsten Crawler an solche Festlegungen halten.
  3. Angesichts der bisherigen Praxis, dass KI-Unternehmen massenhaft Inhalte ungefragt für das Training ihrer Modelle verwendet haben, ist es etwas naiv anzunehmen, sie könnten nun plötzlich aufgrund eines freundlichen Signals für die Inhalte bezahlen. Hier bräuchte es mehr rechtliche Verbindlichkeit.

Ich ergänze noch, dass die Handhabbarkeit von CC Signals mir sehr auf größere Repositories und Organisationen ausgelegt zu sein scheint. Mir ist im Kontext Offenheit aber Dezentralität sehr wichtig. Und ich selbst teile meine Inhalte auch als Einzelperson.

Positiv lese ich, dass die CC Signals ein wichtiger Schritt sein könnten, um offene Inhalte in einem KI-geprägten Internet zu bewahren und zu stärken.

Die Diskussion wird sicherlich – auch in der deutschsprachigen OER-Community – spannend!


Beitrag weiternutzen und teilen

Dieser Beitrag steht unter der Lizenz CC BY 4.0 und kann somit gerne offen weitergenutzt und geteilt werden. Hier kannst du dir den Beitragslink und/oder den Lizenzhinweis kopieren. Wenn du den Beitragslink in das Suchfeld im Fediverse (z.B. bei Mastodon) eingibst, wird er dir dort angezeigt und du kannst ihn kommentieren.


Erschienen in der Kategorie:
Anregungen zum Weiterlesen