Key Takeaways
- DALL·E ist ein neues neuronales Netzwerk, das Bilder basierend auf Text zeichnen kann.
- Das Netzwerk ist eines von einer wachsenden Zahl von KI-Projekten, die die kreative Leistung von Menschen nachahmen können.
- Experten sagen, dass von KI gezeichnete Bilder keine Originalkreationen sind.
Beweg dich, Picasso. Ein neues neuronales Netzwerk kann Bilder basierend auf Text zeichnen.
DALL·E, ein Portmanteau der Namen des Künstlers Salvador Dalí und Pixars WALL·E, kann jeden beliebigen Text nehmen und daraus ein Bild erstellen. Das System verwendet ein neuronales Netzwerk, das mit Milliarden von Bildern und Textbeispielen trainiert wurde. Es ist eines von einer wachsenden Zahl von KI-Projekten, die die kreative Leistung von Menschen nachahmen, aber nicht replizieren können.
"Da sich die natürliche Sprache ständig weiterentwickelt und sehr abhängig von kontextuellen Nuancen ist, ist es eine sehr bedeutende Leistung, einer Maschine beizubringen, Sprache gut genug zu verstehen, um ein Bild zu zeichnen", Tamara Schwartz, Professorin für Cybersicherheit am York College of Pennsylvania, sagte in einem E-Mail-Interview. "Stellen Sie sich einen Polizeizeichner vor, das ist ein seltenes Talent, der die Fähigkeit hat, ein Bild auf der Grundlage einer Zeugenbeschreibung zu erstellen."
Mit Big Data Bilder produzieren
DALL-E wurde vom KI-Forschungsunternehmen OpenAI entwickelt und funktioniert, indem es riesige Datenmengen aus dem Internet sammelt. Die Daten werden dann von einem natürlichen Sprachmodell verarbeitet und darauf trainiert, Bilder aus Text zu erzeugen. DALL-E funktioniert ähnlich wie das kürzlich veröffentlichte GPT-3, ein von OpenAI erstelltes Sprachmodell, das zur Generierung von Origin altextpassagen aufgefordert werden kann. GPT-3 wurde mit einer halben Billion Wörter Internettext trainiert und kann überraschend lebensechten Text erzeugen.
Einer Maschine beizubringen, Sprache gut genug zu verstehen, um ein Bild zu zeichnen, ist eine sehr bedeutende Leistung.
Michael Yurushkin, Gründer und CTO von BroutonLab, einem Data-Science-Unternehmen, sagte in einem E-Mail-Interview, dass DALL-E „einer der wenigen erfolgreichen Versuche der Menschheit ist, unsere Kreativität und Vorstellungskraft nachzuahmen“. Er fügte hinzu: „Es ist einfacher zu verstehen, wie KI etwas vorhersagt, indem sie relevante Daten durchgeht, aber zu verstehen, wie sie Zeichnungen aus Dingen erstellen kann, von denen sie noch nie zuvor ‚gehört‘hat, ist schwieriger.“
Schwartz weist darauf hin, dass die KI keine Informationen erstellt, sondern Sprachdaten nimmt und sie in Bilder umwandelt.
"Die anfängliche Kreativität kommt von dem Menschen, der die Aufgabe erstellt hat", sagte Schwartz. „Es gibt eine gewisse ‚Kreativität‘seitens der KI, weil sie mit verschiedenen Kombinationen von Daten experimentiert und dann aus einer Reihe potenzieller Ergebnisse auswählt. Ein Mensch untersucht jedoch die Ausgaben und bringt der KI bei, wie sie aus den vielen Kombinationen auswählen kann."
Roboter-Detektivarbeit?
Eine Maschine kann viel schneller mit dieser Daten- und Objektkombination experimentieren als ein menschlicher Künstler. Schwartz bemerkte, dass DALL-E eines Tages mit einem Detektiv zusammenarbeiten könnte, der versucht, einen Tatort anhand einer Skizze zu rekonstruieren, die auf Augenzeugenaussagen basiert.
"Wenn Zeugen ihre Aussagen machen, könnte der Computer diese gesprochenen Informationen in natürlicher Sprache nehmen und eine Zeichnung der Szene oder viele Zeichnungen der Szene erstellen", sagte sie. "Diese Visualisierungen könnten dann integriert werden, um ein genaueres Bild verlorener Beweise zu erstellen. Diese Visualisierung könnte durch die Integration früherer Bilder des Ortes vor dem Verbrechen angereichert werden."
Mehrere andere KI-gesteuerte Programme können Kunst produzieren. Zum Beispiel verwendet Ai-Da ein Roboterarmsystem und Gesichtserkennungstechnologie gepaart mit künstlicher Intelligenz, um Kunst zu schaffen. Das System kann ein vor der Maschine platziertes Bild analysieren, das in einen Algorithmus einfließt, um die Armbewegungen des Roboters zu erzeugen.
Menschliche Künstler sollten sich jedoch keine Sorgen machen, dass sie von Roboteroberherren ersetzt werden, argumentierte Ahmed Elgammal, der Direktor des Art and Artificial Intelligence Lab an der Rutgers University, letztes Jahr in der New York Times.
"Während sich die Definition von Kunst ständig weiterentwickelt, ist sie im Kern eine Form der Kommunikation zwischen Menschen", schrieb er. „Ohne einen menschlichen Künstler hinter der Maschine kann die KI kaum mehr tun, als mit der Form zu spielen, sei es das Manipulieren von Pixeln auf einem Bildschirm oder von Noten auf einem musikalischen Hauptbuch. Diese Aktivitäten können fesselnd und wahrnehmbar faszinierend sein, aber ohne Interaktion zwischen ihnen fehlt es an Bedeutung Künstler und Publikum."
Nachdem ich mir die Arbeit von DALL-E angesehen habe, verstehe ich Elgammals Argument, dass die von der KI erstellten Bilder keine Kunst sind. Andererseits sind sie besser als jede Kunst, die ich schaffen könnte. Also wirklich, was ist der Unterschied?