Menu Close

Tauchgänge im Ozean kollektiver Bilder / Dives in the Ocean of Collective Images

„Ängste und Hoffnungen“ Collage auf Basis von digitalen Photos (händisch generiert)

In meiner Photoblase ist er ein Begriff. Wenn es um Fragen KI generierter Bilder geht, kommt man kaum an ihm vorbei. Er wird gerade überallhin eingeladen, um von seinen Erfahrungen zu sprechen. Meine letzte Begegnung mit Boris Eldagsen fand im relativ neuen und nicht unspannenden Podcast „FotoPsychoLogisch“ von Joachim M. Feigl. Er sprach darin über Kreativität und seine Erfahrung mit unbewussten Symbolen und Archetypen im Schaffensprozess. Besonders gut hat mir der Gedanke gefallen, dass man unabhängig davon, ob man im Schaffensprozess von einem Konzept oder von einem Set von Intuitionen ausstattet, man immer noch die andere Seite braucht, um ein tragfähiges Kunstwerk zu schaffen. Natürlich wurde auch über KI und KI-generierte Bilder gesprochen. Es hat mich angeregt noch etwas weiter über den Aspekt nachzudenken, dass man ja, wenn man mittels Worteingabe (prompt) Bilder generieren lässt, immer auf ein kollektives Reservoir von Bildern zurückgreift, aus dem die KI, vermittels Mustererkennung, `scheinbar´ neue Bilder generiert. Dieses Reservoir ist letztlich schon vergleichbar mit der von C.G. Jung behaupteten kollektiven Unbewussten, da auch dieses aus Bildfragmenten besteht, die sich kulturell determinierten, wiedererkennbaren Mustern zuordnen lassen. Diese Archetypen sind tief in jedem von uns verwurzelt und strukturieren auch unsere Wahrnehmung.

Im globalen Netz sind ja auch Milliarden einzelne Bilder abgelagert, die, verbunden mit Wortsprache, in Form von Bildtiteln, Beschreibungen, anhängendem Text, Stichwörtern, Erklärungen für nicht sehende Menschen und so weiter der KI als Trainingsmaterial dienen. Diese Bilder sind ja auch nicht permanent an der Oberfläche, sondern irgendwo im Netz, unserem outgesourcten Erinnerungsraum in der Cloud sedimentiert. Wenn wir also heute mit Worten Bilder beschwören, hat das nicht mehr viel mit Zauberei zu tun, aber sehr wohl damit, dass die KI für uns ins digitale Bildgedächtnis der Menschheit abtaucht und mit zum Teil trivialen, zum Teil überraschenden und nicht selten verstörenden Bildern wieder auftaucht. Ein Unterschied ist, dass Jungs Archetypen aus dem unbewussten Bildgedächtnis jedes einzelnen Menschen hervorgeholt werden müssen, während das Bildgedächtnis heutzutage auch digital vorliegt. Die These, dass die KI was mit dem Unbewussten zu tun hat, vertritt auf seine etwas verquere Weise auch Slavoj Žižek, der dann auch noch Parallelen zwischen dem Versuch der KI-Anbieter bestimmte Inhalte zu tabuisieren, mit dem Aufbau einer Art kollektiven Über-Ichs in Zusammenhang bringt, das wir offensichtlich brauchen, damit das nicht alles aus dem Ruder läuft.

He is a household name in my photo bubble. When it comes to issues of AI generated images, you can hardly get past him. He is invited everywhere right now to talk about his experiences. My last encounter with Boris Eldagsen was in the relatively new and not unexciting podcast “FotoPsychoLogisch” by Joachim M. Feigl. In it, he talked about creativity and his experience with unconscious symbols and archetypes in the creative process. I particularly liked the idea that regardless of whether you are working from a concept or a set of intuitions in the creative process, you still need the other side to create a viable work of art.

Of course, there was also talk about AI and AI- generated imagery. It inspired me to think a bit further about the aspect that if you generate images by means of word input (prompt), you always fall back on a collective reservoir of images, from which the AI ‘apparently’ generates new images by means of pattern recognition. This reservoir is ultimately already comparable to the collective unconscious claimed by CG Jung, since this too consists of image fragments that can be assigned to culturally determined recognizable patterns. These archetypes are deeply rooted in each of us and also structure our perception.

In the global network, billions of individual images are deposited, which, combined with word language, serve the AI as training material in the form of image titles, descriptions, attached text, keywords, explanations for non-sighted people and so on. After all, these images are not permanently on the surface but sedimented somewhere in the network, our outsourced memory space in the cloud. So when we conjure up images with words today, it no longer has much to do with magic, but it does have a lot to do with the fact that the AI dives for us into the digital image memory of humanity and reappears with images that are in part trivial, in part surprising and not infrequently disturbing. One difference is that Jung’s archetypes have to be retrieved from the unconscious image memory of each individual human being, whereas today the image memory is also available digitally. The thesis that AI has something to do with the unconscious is, in his somewhat twisted way, also advocated by Slavoj Žižek , who then also draws parallels between the attempt of AI providers to make certain content taboo with the construction of a kind of collective superego, which we obviously need so that things don’t all get out of hand.

Boris Eldagsen als Denker im Stil von Boris Eldagsen (generiert von Dall-E2 über Bing)

Hier sind zwei Dinge wichtig, die auch Boris Eldagsen nicht müde wird hervorzuheben. Zum ersten, dass KI-generierte Bilder keine Photographien, sondern Promtographien  sind. Sie bedienen sich zwar, wenn z.b ein Fotograf den Promt textet photographischer Sichtweisen und Techniken haben aber weder mit Optik (lens based) noch mit lichtempfindlichen Medien (Film oder Sensor) etwas zu tun. Deswegen ist es wichtig zu verstehen, dass es sich um eine neue Kategorie handelt, die nicht oder zumindest nicht generell ins photographische integriert werden kann und soll. Hat man das einmal verstanden und akzeptiert, ist man frei damit zu spielen, am laufenden Band Content zu produzieren oder auch (und da landen wir wieder bei Boris Eldagsen), damit Kunst zu schaffen. Dazu gehört aber, dass sich das, was wir als Menschen sehen und imaginieren und das, was die KI generiert, in einen Dialog begeben, um etwas Neues hervorzubringen.

Zum Abschluss möchte ich Boris dafür danken, dass er mit seinem genialen Coup ein KI-generiertes Bild bei den `Sony World Photography Awards´  unterzubringen, diesen zumindest in einer Kategorie zu gewinnen und dann die Größe zu besitzen, den Preis zurückzuweisen . Dadurch ist der Diskurs um dieses Thema zumindest ein wenig in die Tiefe getrieben worden. Dass die Medien über dieses Thema jede Menge unreflektierten Mist verbreiten, lässt sich wohl nicht verhindern, aber man kann ja zumindest versuchen dagegen anzuschreiben.

Two things are important here, which Boris Eldagsen also never tires of pointing out. First, that AI-generated images are not photographs but promtographies. They make use of photographic views and techniques, e.g. when a photographer texts the prompt, but they have nothing to do with optics (lens based) nor with light-sensitive media (film or sensor). Therefore, it is important to understand that this is a new category that cannot and should not be integrated into the photographic one, or at least not in general.

Once you have understood and accepted this, you are free to play with it, to produce content on a continuous basis or (and here we land again with Boris Eldagsen) to create art with it. But this requires that what we see and imagine as humans and what the AI generates enter into a dialogue to produce something new.

Finally, I would like to thank Boris for his brilliant coup of submitting an AI-generated image to the `Sony World Photography Awards’, winning it in at least one category, and then having the magnitude to reject the award. As a result, the discourse around this topic has been at least a little in depth. The fact that the media spread a lot of unreflected crap about this topic can probably not be prevented, but one can at least try to write against it.

Ein Instagram Posts von Boris Eldagsen (Dort kann die `Affaire´ gut verfolgt werden)

4 Comments

  1. Rolf Noe

    Hier noch ein paar sehr relevante Gedanken von Derel aus der fc zum Thema, die ich euch nicht vorenthalten wollte:
    Der Gedankenfehler liegt nach meiner Meinung darin, zu glauben, dass die KI “ins digitale Bildgedächtnis der Menschheit” eintauche. Sie kann nur in das eintauchen, womit sie trainiert wurde, also nur in digitalisierte teile, dann auch “nur” ins digitale oder digitalisierte Bildgedächtnis als Spiegel unserer Gesellschaft mit all unseren Vor-Urteilen und Erwartungen. Gebe ich z.B. bei DALL-E “man” ein, werden mir beim ersten Versuch drei nordeuropäische gepflegte Managertypen Mitte dreißig mit heute modischem Haarschnitt und ein gleichaltriger Asiate angeboten. Beim dritten Versuch zwei Nordeuropäer, ein Afrikaner und ein Asiate. Das der KI antrainierte Nutzer-Vor-Urteil zu “Mann” hier im europäischen Norden dürfte wohl klar sein. Siehe:
    BLICK IN DEN KI-SPIEGEL by DereL25.5.23, 10:23
    Was aber passiert, wenn ich „man“ in Afrika oder Asien eingebe? Gebe ich bei DALL-E aber „Dorf in den Tugenbergen“ ein, weiß die KI damit nichts anzufangen, obwohl diese Region in Kenia kulturell äußerst interessant ist und spätesten seit dem Buch „Menschwerdung eines Affen“ von Heike Behrend einem breiteren Publikum bekannt wurde. Die Tugenberge gibt es für die KI also (noch) nicht. Robert Mapplethorpe gibt es, Peter Lindbergh nicht. Das zum „digitale Bildgedächtnis der Menschheit“.
    Zudem generiert KI keine Bilder von der Welt, sondern Bilder von Begriffen. Den Gedanken vermisse ich bei Eldagsen, den ich ansonsten schon seit dem letzten Jahr schätze, habe ihn zumindest von ihm noch nicht gehört. Insofern spielt hier z.B. auch die Semantik, auf die die KI trainiert wurde, eine große Rolle, die sich von Sprache zu Sprache unterscheidet. Worauf greift die KI zu? Auf das individuelle semantische Verständnis eines jeden Nutzers oder auf das kollektive einer bestimmten Gruppe?
    Ein weiteres Problem liegt darin, dass wir Promtographien und Fotos in all den möglichen Spielarten in der Bilderflut nicht mehr werden unterscheiden können, es sei denn, sie werden dekonstruiert. Da es aber die Stärke von Bildern ist, dass sie blitzschnell und einfach simultan wahrgenommen werden, wird sich kaum einer dieser Mühe eine Überprüfung unterziehen, wenn das Bild halbwegs glaubwürdig ist. Die Unterscheidung wird dann rein akademisch sein.
    Welche Perspektive werden wir haben? Die Fotografie, wie wir sie jetzt kennen, wird eine in all dem Post Photographischem Randerscheinung werden. Bei Dokumentationen werden wir auf unsere mehr oder weniger große Medienkompetenz zurückgreifen müssen. Die einen werden glauben, die anderen ver-zweifeln, wieder andere schlichtweg ignorieren. Weiterhin werden wir rauschhafte Überwältigungs-Promtographien mit bisher noch nicht gekannten Präsentationsformen bekommen. Die Bühnenshows von Pink Floyd werden uns Älteren als milder Vorgeschmack in kollektiver Erinnerung sein. 😉
    Vielen Dank für den Gedankenaustausch und die Gedankenanregungen. So kann ich auch meine Gedanken sortieren. “Gutes Licht” werde ich mal als Prompt eingeben. 😉

Leave a Comment / Schreib einen Kommentar

This site uses Akismet to reduce spam. Learn how your comment data is processed.