Visualisierungs-Experimente mit Midjourney

Wenn sich so genannte KI für eine Sache ganz wunderbar eignet, dann zur Prokrastination ;-) In diesem Sinne ein kleiner Einblick in meine Annäherungen zum KI-Bildgenerierungs-Werkzeug Midjourney.

Was ist Midjourney?

Midjourney ist ein Werkzeug, mit dem über eine Text-Eingabe Bilder generiert werden können. Die Nutzung ist etwas gewöhnungsbedürftig, weil die Eingaben und die Bildgenerierung über einen Discord-Server laufen. Wer Discord bislang noch nicht nutzt, wird deshalb vermutlich ein bisschen Zeit zur Einarbeitung benötigen.

Ich empfehle folgende Schritte:

  1. Über die Website Discord.com richtet man sich einen kostenfreien Discord-Account ein.
  2. Man meldet sich an und öffnet dann im gleichen Browser die Website Midjourney.com und wählt dort ‚Join the Beta‘ aus.
  3. Man erhält die Anfrage, ob man der Einladung zu einem Midjourney-Discord-Server folgen will. Das bejaht man.
  4. Man landet in einer zu Beginn relativ unübersichtlichen Chat-Umgebung, in der ständig irgendwelche neuen Nachrichten aufploppen. Davon muss man sich aber nicht irritieren lassen, sondern kann in der linken Spalte auf einen der zahlreichen ‚Newbie‘-Kanäle klicken.
  5. In solch einen Newbie-Kanal werden nun die Prompts eingegeben, um Bilder zu generieren. Der Output wird (neben den Aktivitäten von vielen anderen Nutzenden) auch in diesem Chat angezeigt.

Wie schreibe ich eine Eingabe?

Die Eingabe erfolgt über den Befehl /imagine prompt xxx. Sobald Du die ersten Buchstaben dieses Befehls eingibst, wird der Befehl schon autovervollständigt – und Du kannst Deine Eingabe hinter das Wort Prompt eintragen. Es gelten dabei die gleichen ‚Regeln‘, die auch bei anderen KI-Modellen hilfreich sind. Insbesondere sollte ein Prompt möglichst detailliert sein und nicht nur Anforderungen zum ‚Was‘, sondern auch zum ‚Wie‘ erhalten.

Für mich nützliche Ergänzungen zur inhaltlichen Beschreibung sind vor allem:

  • xxx style gestaltet das Bild in einem bestimmten Stil. Ich mag z.B. ‚watercolor style‘ (= wie mit Wasserfarben gemalt) sehr gerne.
  • –ar 16:9 gestaltet das Bild in einem Präsentationsformat. Für diesen Zweck kann ich Bilder am besten weiternutzen (Ich nutze sie meist für Präsentationen)

Hier ist ein Screenshot vom Midjourney Server mit einem gerade eingegebenen Prompt, so dass man sich das Ganze besser vorstellen kann:

Screenshot von Midjourney

Nachdem Du Deinen Prompt eingegeben hast, wartest Du ein paar Sekunden bzw. manchmal auch Minuten. Während dessen ploppen im Chatverlauf Bilder von anderen auf. Irgendwann siehst Du dann auch Dein Ergebnis. Dir werden dazu jeweils immer 4 mögliche Variationen angezeigt. Mit Klick auf U1-U4 kannst Du eine der vier Versionen allein und höher skaliert anzeigen lassen. Wenn Du das Bild dann nochmals anklickst, öffnet es sich in einem neuen Fenster und Du kannst es Dir abspeichern.

Wenn Du die kostenfreie Version nutzt, ist irgendwann Schluss. Wenn Du mehr und schneller Bilder generieren willst, kannst Du /subscribe eingeben – und Du erhältst dann einen Link zur kostenpflichtigen Registrierung.

Was bringt mir das Ganze in der Bildung?

Um über möglichen Nutzen in der Bildung zu reflektieren, ist es hilfreich, sich unterschiedliche Ebenen zu vergegenwärtigen:

  1. Die Nutzung von Midjourney kann erstens als Werkzeug erfolgen, das die Arbeit von Lernenden und Lehrenden erleichtern oder auch spaßiger machen kann. In diesem Fall wird Midjourney genutzt, um passende Visualisierungen zu bestimmten Themen zu generieren. Wenn ich beispielsweise in einer Präsentation gerne einen Papagei auf einem Laptop sitzend zeigen will, dann kann ich sehr lange nach genau solch einem Bild recherchieren – oder ich gebe es als Prompt bei Midjourney ein. Vor allem, wenn man sich dazu entscheidet, eine gesamte Präsentation sehr visuell aufzubereiten, funktioniert das mithilfe von Midjourney recht gut. Man kann sich dann zu Beginn auch für einen Stil oder ein Farbmuster entscheiden – und das für alle zu generierenden Bilder anwenden.
  2. Die zweite Möglichkeit ist, die Nutzung Midjourney zur Reflexion von KI als Lerngegenstand. Hilfreich finde ich dabei vor allem, dass der ‚Befehlscharakter‘ der Eingaben im Prozess der Bilderstellung sehr deutlich ist. Man kann auf diese Weise sehr gut nachvollziehbar machen, wie die Bildgenerierung erfolgt. Zugleich können auch viele andere Aspekte von KI reflektiert werden – beispielsweise eine sehr stereotype Darstellung von Männern/ Frauen oder von unterschiedlichen Kulturen. Ich finde das bei Bildern nochmals um einiges offensichtlicher als bei Text.

Auf der Ebene von Internetquatsch ist Midjourney schließlich toll, weil hier bei vielen Bildgenerierungen die geballte Kreativität der Internet-Community zum Ausdruck kommt. Ich hatte zum Beispiel viel Spaß beim Betrachten unterschiedlichster Tiere in Hochzeitskleidern oder von Personen der Zeitgeschichte in verschiedenen ‚Verkleidungen‘. Da man auf dem Discord-Server jeweils die Eingaben und Ergebnisse von anderen Nutzer*innen sehen kann, ist das Ganze auch ein schönes Beispiel für kreative Kollaboration.

Visualisierungen mit Midjourney in Kombination mit Texten von ChatGPT

Eine für mich hilfreiche Herangehensweise ist es, zunächst mithilfe von ChatGPT nach möglicherweise passenden Metaphern für eine bestimmte Herausforderung zu suchen, die besten davon auszuwählen und dann von Midjourney als Bild gestalten zu lassen. Ich habe das am Beispiel von ‚Lernen ohne Noten‘ gemacht. Mein Prompt bei ChatGPT war, dass der Bot sich in die Rolle einer Person hineinversetzen soll, die Noten für kontraproduktiv für gutes Lernen hält – und mir aus dieser Perspektive den Satzanfang: ‚Lernen ohne Noten ist wie …‘ auf zehn unterschiedliche Arten vervollständigen soll. Die Ideen, die mir am besten gefielen, habe ich mir dann auf Englisch übersetzen lassen und dann als Prompt bei Midjouney eingegeben.

Hier sind die (etwas kitschigen) Ergebnisse:

Lernen ohne Noten ist wie ein Vogel, der ohne Käfig fliegen kann.
Lernen ohne Noten ist wie ein gemeinsames Fest, bei dem alle Menschen zusammenkommen und gemeinsam feiern statt sich zu bewerten.
Lernen ohne Noten ist wie ein Himmel voller Sterne, bei dem jeder leuchten darf.

Wie ist das rechtlich?

Ich bin keine Juristin und habe mir lediglich auf Basis meiner laienhaften Kenntnisse die folgende Meinung zur rechtlichen Weiternutzung von KI-generierten Bildern gebildet:

Es kann gut sein, dass es rechtlich nicht erlaubt ist, dass Unternehmen wie Midjourney massenhaft urheberrechtlich geschützte Bilder als Trainingsmaterial zur Entwicklung von KI-Werkzeugen verwendet haben. Das ist aber nicht mein Problem als Einzelnutzerin, sondern das Problem dieser Unternehmen. In der aktuellen Situation, in der rechtlich noch vieles ungeklärt ist, kann es durchaus eine spannende Strategie sein, ganz bewusst KI-Bilder zu generieren – und diese unter CC0 für alle zur Nutzung freizugeben. Für die Transparenz finde ich es hilfreich, dass ich bei Veröffentlichung dazu schreibe, dass es sich um KI-generierte Bilder handelt und was mein Prompt war. Gerade bei sehr ausgefeilten und detaillierten Prompts ist meine Erwartung für die Zukunft, dass für solche Prompts (quasi in Vertretung der technologisch entwickelten Bilder) urheberrechtlicher Schutz beansprucht werden kann.

Mehr zum Thema Recht, OER und KI findet man in diesem Artikel bei irights.

Fazit

Die sehr berechtigte Grundsatz-Kritik an ‚KI‘ in Bezug auf fehlende Offenheit, fehlende demokratische Gestaltung und dem vollen Zugang nur gegen Bezahlung trifft auch bei Midjourney zu. Für eigene Erkundungen, für die pädagogische Nutzung von Bildern, für Internetquatsch und als Arbeitserleichterung kann Midjourney aber trotz alledem hilfreich sein. Beim Ausprobieren wünsche ich Dir viel Freude!

Das Beitragsbild zeigt eine laut ‚Nein‘ rufende Schulklasse mit Lehrer – und zeigt zugleich auch sehr deutlich, wie irritierend KI-Werkzeuge oft noch Bilder generieren ;-)


Beitrag merken & teilen

Hier kannst Du dir den Link zum Beitrag kopieren - beispielsweise um ihn für Dich zu speichern oder mit anderen zu teilen. Wenn Du den Link in den Suchschlitz im Fediverse einfügst, kannst Du den Beitrag von dort aus kommentieren. Die Kommentare erscheinen dann nach Freigabe hier auf der Website.

Beitrag weiternutzen

Der Beitrag steht unter der Lizenz CC BY 4.0. Du kannst ihn gerne unter Angabe des Lizenzhinweises offen weiternutzen.

👉 Lust auf mehr?

Monatliche Impulse zu guter Bildung in einer zunehmend digital geprägten Welt erhältst du mit meiner Edumail, die du kostenfrei abonnieren kannst. Bei Interesse an einer Zusammenarbeit freue ich mich über deine Anfrage.

2 Kommentare

@nele das ist das erste mal dass ich wissentlich unter einem blogbeitrag via mastodon kommentieredas ist ziemlich coolwenn es mein tröt durch die freigabe schafft möchte ich die gelegenheit nutzen und euch alle lieb aus dem fediverse grüßen 👋