A new AI-GE* is coming

Es ist äußerst wahrscheinlich, dass jeder von uns bereits mit Bildern konfrontiert wurde, die nicht aus jemandes Hirn oder Hand entsprungen sind. Ich rede von KI bzw. AI. Künstlicher „Intelligenz“. Über die Definition, die moralischen und ethischen Aspekte kann man äußerst stürmisch diskutieren.

Wer sich der Diskussion anschließen will, dem empfehle die jeweiligen Foren der AI-Platformen oder Boards der CG-Society.

Auch aus architektonischer Sicht tun sich hier unbegrenzte (ja, unbegrenzte!) Möglichkeiten auf, wie künstliche Intelligenz zukünftigen zu Entwürfen beitragen kann. Als Ausgangspunkt, Inspiration und Ideengeber.

Im Nachfolgenden präsentiere ich die Ergebnisse von einigen Experimenten mit der MIDJOURNEY-AI (MJ) die ich in Richtung Architektur unternommen habe.

Erste Schritte und je 4 Variationen

MJ präsentiert nach Eingabe des Prompts immer 4 Ergebnisse, die man weiter skalieren oder variieren kann.

Über die Buttons U1..U4 und V1..V4 kann man die Ergebisse weiterverfolgen U(pscalen) oder V(arianten) davon entwickeln lassen
Der Refresh-Button tut genau, was man erwartet. Neuer Versuch, neues Glück, völlig neue Varianten

Ich wollte mal sehen, wie Architektur der Großen Namen in einem „world without men“-Szenario aussehen könnte.
Dazu habe ich den folgenden Prompt verwendet und um den jeweiligen Namen des Architekten geändert.

/imagine prompt: hyper realistic photograph epic cinematic office building NAME ARCHITEKT overgrown abondoned city apocalypse 

Und tatsächlich werden Bilder generiert, die die Sprache des jeweiligen Büros sprechen könnten auch die angedachten Atmosphäre vermitteln.

Upscaling. Vergrößern wir das ganze

MJ bietet dann verschiedene Möglichkeiten für das Upscaling.

to Max – Maximum Details hinzufügen
Light – Details werden reduziert, das Bild wird klarer
Beta – ist ein Mittelding.

Es gibt unendlich viele Möglichkeiten, die Bilder auch weiter zu verändern und öffnet ein unglaublich großes Feld zum Experimentieren

Schon nach wenigen Versuchen wird klar, wie die KI funktioniert. Sie sammelt Farben, Strukturen, Kontraste, Blickwinkel aus dem Fundus namens „Internet“ und kombiniert diese zu einem „best guess“. Zoomt man in die Darstellungen wird auch die Unschärfe der Formulierung sichtbar. Kanten sind wenig schief. Es gibt keinen Zusammenhang innerhalb der Bilder. Sollte ein Stück Gebäude herausgebrochen sein, würde man es am Boden erwarteten. Dieses zusammenhängende „Denken“ scheint die KI heute noch nicht zu kennen. Ein Glück.

Weiteres upscaling

Der Prozess

Es dauert bis zu 60 Sekunden, bis ein oder mehrere Bilder generiert sind. Alle paar Sekunden gibt es ein Update.. Das sieht dann im Zeitraffer in etwa folgendermaßen aus:

Die KI beim Arbeiten

Versuchen wir uns an Architektur. Die KI wird mittels dem Messenger Discord bedient. Man schickt ihr quasi einen Befehl und MJ sendet die Bilder dann als Nachricht direkt zurück.

/imagine prompt:latest_architectural_competition_building_modern_office
/imagine prompt:latest_architectural_competition_building_in_the_woods

Try and Try and Try…. there are no Errors

Weitere Versuche aus meiner Kommunikation mit MJ zeigen erstaunliche Ergebnisse.
Hinweis: Die Prompts der jeweiligen Eingaben lassen sich bis zu einem bestimmten Grad noch am Dateinamen erkennen.

Und ich muss ehrlich gestehen, dass ich bisher nur an der Oberfläche von dem was möglich ist gekratzt habe. Beschränken wir uns hier auf den Eindruck und das Thema Architektur.

Wie sieht eine KI aus ?

Zu guter Letzt frag ich die die KI noch nach einem Bild von künstlicher Intelligenz. Ich finde es ganz spannend, dass die Bilder alle einen gewissen Stil haben. Sogar die Gesichter ähneln sich von Versuch zu Versuch und stellen eine junge, asiatisch aussehende Frau oder eine Art Frankenstein dar. Googelt man das prompt, kommt etwas völlig anderes. Es handelt sich bei MJ als um mehr als eine Bilder-Suchmaschine, die Bilder einfach nur zusammenmatscht. Ich bin beeindruckt.

/imagine prompt:artificial intelligence thinking --s 5000

Persönliche Notiz

Ich habe das Gefühl, hier eine Büchse der Pandora aufgemacht zu haben. Nichts ist mehr wie es scheint. Ich werde keinem „Foto“ mehr trauen können. Keinem Bild. Keinem Künstler der nicht belegen kann, wie er die Kunst gemacht hat. Jeder hat die Möglichkeit, seine ganz eigene Gedankenwelt in fotorealistische Bilder zu packen und andere sogar davon zu überzeugen. Ich hoffe, dass diese Technik nicht zu massenhaftem Illegalen Tun genutzt wird. Es ist so leicht. Deepfake lässt grüßen.

edit: nach reichlichen Tests stehe ich fest: es kommt immer was Erstaunliches raus aber nie das, was man erwartet. Eine zielgerichtete Eingabe, die an Ende einen Zweck oder Sinn erkennen lassen, ist nicht möglich.

Quellen und Ressources

Mehr findet Ihr auf Midjourney.com, weitere Ressources einfach googlen.

COPYRIGHT: Alle Bilder in diesem Beitrag sind durch mich initiiert und durch die KI generiert. Sie sind einzigartig und erscheinen hier zum ersten mal. Eine Weiterverwendung Bedarf meiner schriftlichen Zustimmung.
(Geht doch selbst zur AI und macht euch eigene Bilder! 😉 )

* für AI-Age