Logo art-in.de


Digitale Bilder mit KI, GAN und OpenAI GPT3 und DALL·E 2

Untersuchung und Beispiele
Eingabedatum: 14.03.2020

Digitale Bilder mit KI, GAN und OpenAI GPT3 und DALL·E 2

bilder


Zu Beginn steht eine zufällige Verteilung der Pixel im Bild.

GAN (Generative Adversarial Networks)

Neuronale Netze können Berechnungen zu Bildern, Texten und Wörtern erstellen, aber solange man ihnen kein Ziel vorgibt, wissen sie nicht wie sie sich weiterentwickeln sollen. Um solch eine Entwicklung zu initiieren, lässt man zwei neuronale Netze zusammenarbeiten, einerseits einen Generator, der entwickelt und andererseits einen Diskriminator, der die Entwicklung des Generators anhand von Daten aus der Vergangenheit positiv oder negativ beurteilt.
So entstehen Häufungen und Muster z.B. von Pixeln, die der Diskriminator von den Ausgangsdaten nicht mehr unterscheiden kann.
In diesem Fall handelt es sich bei den Ausgangsdaten um Gesichter.

Responsive image

Der hier dargestellte Zyklus umfasst mehr als 1.000.000 Iterationen.

Responsive image

Responsive image

Während die oben gezeigten Bilder auf Grafikkarten in der Cloud berechnet wurden, kann der Grafikkartenhersteller nvidia aufgrund der anderen Resourcen auch Trainingsdaten zur Verfügung stellen, mit denen folgende Bilder generiert wurden.

digitales Bild

digitales Bild
Overfitted

OpenAI GPT-3



Eine weitere Stufe in der digitalen Bildwerdung wurde durch die Entwicklungen von OpenAI und dem GPT3 Modell, dass sowohl der Sprach- als auch Bildgenerierung dient, erklommen.
Auch hier kommt es zum Einsatz der Transformer. Die Transformer sind in der Lage anwendungsbezogen die Gewichtung der Gewichtungen individuell zu optimieren.
Das heißt, es werden auf der Metaebene signifikante Korrekturen/Eingrenzungen bei der Selektion vorgeschaltet.

Ein bekanntes Beispiel stellen die Avocado-Sessel dar. Hier wurde das DALL·E Modell durch eine Texteingabe angewiesen, einen Sessel in Avocadoform zu entwerfen, was das Modell dann auch in vielfältigen, attraktiven Versionen vollzog.
"DALL·E is a neural network that can generate images from the wildest text and image descriptions.
CLIP uses a new method of training for image classification, meant to be more accurate, efficient, and flexible across a range of image types."

Wir nutzten für die folgenden kurzen Videos das Clip Modell (ClipBigGan, ein jupyter-notebook). Es handelt sich bei den Videos um erste, experimentelle Studien und Versuche.


Textvorgabe: a banana attached by tape in the white cube


Textvorgabe: fine art installation in a white cube

Während bei der KI gestützten Textgenerierung der Nebensatz eindeutig dem Absatz, aufgrund der Shorttherm und Longtherm Funktion, zugeordnet werden kann, verhält es sich im künstlich generierten Bildraum differenzierter. Hier entstehen scheinbare Fehlleistungen, die dem menschlichen Denken fremd erscheinen.

fine art installation in a white cube

Zu sehen ist die zweite Version einer Interpretation der Signatur von Marcel Duchamp. Während bei der ersten Interpretation der VGG19 Algorithmus, der Auffälligkeiten neu assoziierte, zum Tragen kam, wird hier mit dem Gpt-3 Modell von OpenAI auf der Basis einer Texteingabe Wissen abgefragt.

Responsive image

Update: OpenAI DallE2

Zu Art und Umfang der im Sommer 2022 benutzten Modelle erklärt ein Sprecher vom Midjourney: "Bei den derzeitigen Daten handelt es sich um grobe Auszüge aus dem Internet. Die Wissenschaft ist neu, aber um Ihnen eine Vorstellung zu geben, lernt das Modell aus 250 TB, merkt sich aber nur 2 GB ( das entspricht einer 125.000-fachen Reduzierung der Daten). Das heißt, es lernt hauptsächlich auf hoher Abstraktionsebene und allgemeinen Gemeinsamkeiten."

Im Dezember 2021 veröffentlichte OpenAI mit GLIDE (Guided Language to Image Diffusion for Generation and Editing) ein textgeführtes Diffusionsmodell, welches auch die Grundlage für Dall E 2 bildet.

Bei der Diffusion wird ein hochaufgelöstes Bild in Gaußsches Rauschen umgewandelt. Das Ziel des Trainings eines Diffusionsmodells besteht darin, den umgekehrten Prozess zu erlernen, d.h. aus einem Rauschen ein Bild zu erzeugen. Indem man sich entlang dieser Kette rückwärts bewegt, können so neue Daten erzeugt werden.

Responsive image

Banana attached by tape at the wall in a white cube

Responsive image
Readymade by Marcel Duchamp in a white cube

Responsive image
concept context identity by Marcel Duchamp in a white cube

Responsive image
Readymade by Marcel Duchamp in a white cube

Responsive image
Modern Style Readymade by Marcel Duchamp

Responsive image
work of art by Marcel Duchamp in the 21st century

work of art in a white cube
work of art in a white cube, Midjourney

work of art in a white cube
work of art in a white cube II, Midjourney







Kataloge/Medien zum Thema: Digitales



  • "Video. Die 80er Jahre" - K21, Düsseldorf (25.03. - 21.05.06)

  • GiebichenStein Designpreis 2012 für ausgezeichnete Designprojekte in fünf Kategorien vergeben

  • Bling, Bling! MindFrames: Media Study at Buffalo 1973 - 1990 im ZKM, Karlsruhe ( noch bis 18.3.07)

  • Bibliotheca Insomnia. Das digitale Bauhaus II (27.8. - 17.9.06)

  • Carlos Amorales, Navid Nuur, San Keller - Kunsthalle Fridericianum, Kassel

  • Spezial: Wunderkammer - Zeitgenössisches Kuriositätenkabinett, Brüssel

  • FUTUR PERFEKT. Vollendete Zukunft

  • Ars Electronica

  • Chat Jet (Part 2) Skulptur in Reflexion

  • Thomas Ruff

  • REAL HUMANS

  • Die 80er. Figurative Malerei in der BRD

  • Internationaler Faber-Castell Preis für Zeichnung

  • Letzte Runde des Jubiläumsprogramms der BURG

  • DIPLOM15

  • Digital Archives

  • Nikolaus Geyer. Weder Freund noch Feind

  • Mehr als nur Worte [Über das Poetische]

  • Biotopia

  • Hybrid Layers

  • Der Begriff - digital - in Texten zur zeitgenössischen Kunst

  • Daniel Birnbaum verlässt Moderna Museet in Stockholm

  • PERSPECTIVAS LATINAS

  • Der Begriff - Readymade - in Texten zur zeitgenössischen Kunst

  • Marta Herford erfolgreich beim Fonds Digital der Bundeskulturstiftung

  • Mœbius 360° als digitales Angebot

  • Biennale für aktuelle Fotografie 2020 erweitert ihr digitales Vermittlungsangebot

  • Glasgow International - Festival

  • Kunstsammlung Nordrhein-Westfalen ist ab 5.5.2020 wieder geöffnet

  • Museen digital entdecken! Am 17. Mai 2020 ist Internationaler Museumstag

  • Das Museum der Zukunft ist kein Museum mehr

  • Folkwang RUNDGANG 2020 im TV-Format

  • Künstlerpublikationen: analog – digital!

  • Kultur. Gemeinsam. Leben.

  • Schloss Solitude mit drei neuen digitalen Formaten

  • Neuer Museumspodcast des Hessischen Landesmuseums Darmstadt

  • Beyond the Pain

  • Digitale „Kunstsprechstunde“ in der Galerie der Stadt Backnang

  • Dokumentarfilm: Exploring Art at the European Patent Office

  • Language for Sale

  • Deutsche Barockgalerie goes Online - Kunstsammlungen und Museen, Augsburg

  • Das kleine d in Texten zur zeitgenössischen Kunst

  • Patrick Fabian Panetta. If You Know, You Know.

  • Meret Oppenheim. Mon exposition - Kunstmuseum Bern (22.10.2021 - 13.02.2022)

  • documenta fifteen Kassel Künstler*liste und Informationen

  • facets, faces - Das Jahrgangsprojekt von Curatorial Studies

  • Tag der offenen Türe – DIGITAL

  • Digitaler Tag der offenen Tür

  • House of Mirrors – Künstliche Intelligenz als Phantasma

  • ars viva 2022. Tamina Amadyar, Lewis Hammond, Mooni Perry

  • top



    Anzeige
    Responsive image


    Anzeige
    artspring berlin


    Anzeige
    artspring berlin

    Anzeige Galerie Berlin

    Responsive image
    Galerie Parterre Berlin




    Anzeige Galerie Berlin

    Responsive image
    Haus am Lützowplatz




    Anzeige Galerie Berlin

    Responsive image
    tunnel 19




    Anzeige Galerie Berlin

    Responsive image
    Freundeskreis Willy-Brandt-Haus e.V.




    Anzeige Galerie Berlin

    Responsive image
    Galerie Nord | Kunstverein Tiergarten