Wie KI-Systeme menschliche Kreativität imitieren

👤 Autor Abigail Brown 📧 brown@technologyhumans.com.
⏱ Public 2023-12-17 06:43.
🖍 Zuletzt bearbeitet 2025-01-24 12:06.

Key Takeaways

DALL·E ist ein neues neuronales Netzwerk, das Bilder basierend auf Text zeichnen kann.
Das Netzwerk ist eines von einer wachsenden Zahl von KI-Projekten, die die kreative Leistung von Menschen nachahmen können.
Experten sagen, dass von KI gezeichnete Bilder keine Originalkreationen sind.

Beweg dich, Picasso. Ein neues neuronales Netzwerk kann Bilder basierend auf Text zeichnen.

DALL·E, ein Portmanteau der Namen des Künstlers Salvador Dalí und Pixars WALL·E, kann jeden beliebigen Text nehmen und daraus ein Bild erstellen. Das System verwendet ein neuronales Netzwerk, das mit Milliarden von Bildern und Textbeispielen trainiert wurde. Es ist eines von einer wachsenden Zahl von KI-Projekten, die die kreative Leistung von Menschen nachahmen, aber nicht replizieren können.

"Da sich die natürliche Sprache ständig weiterentwickelt und sehr abhängig von kontextuellen Nuancen ist, ist es eine sehr bedeutende Leistung, einer Maschine beizubringen, Sprache gut genug zu verstehen, um ein Bild zu zeichnen", Tamara Schwartz, Professorin für Cybersicherheit am York College of Pennsylvania, sagte in einem E-Mail-Interview. "Stellen Sie sich einen Polizeizeichner vor, das ist ein seltenes Talent, der die Fähigkeit hat, ein Bild auf der Grundlage einer Zeugenbeschreibung zu erstellen."

Mit Big Data Bilder produzieren

DALL-E wurde vom KI-Forschungsunternehmen OpenAI entwickelt und funktioniert, indem es riesige Datenmengen aus dem Internet sammelt. Die Daten werden dann von einem natürlichen Sprachmodell verarbeitet und darauf trainiert, Bilder aus Text zu erzeugen. DALL-E funktioniert ähnlich wie das kürzlich veröffentlichte GPT-3, ein von OpenAI erstelltes Sprachmodell, das zur Generierung von Origin altextpassagen aufgefordert werden kann. GPT-3 wurde mit einer halben Billion Wörter Internettext trainiert und kann überraschend lebensechten Text erzeugen.

Einer Maschine beizubringen, Sprache gut genug zu verstehen, um ein Bild zu zeichnen, ist eine sehr bedeutende Leistung.

Michael Yurushkin, Gründer und CTO von BroutonLab, einem Data-Science-Unternehmen, sagte in einem E-Mail-Interview, dass DALL-E „einer der wenigen erfolgreichen Versuche der Menschheit ist, unsere Kreativität und Vorstellungskraft nachzuahmen“. Er fügte hinzu: „Es ist einfacher zu verstehen, wie KI etwas vorhersagt, indem sie relevante Daten durchgeht, aber zu verstehen, wie sie Zeichnungen aus Dingen erstellen kann, von denen sie noch nie zuvor ‚gehört‘hat, ist schwieriger.“

Schwartz weist darauf hin, dass die KI keine Informationen erstellt, sondern Sprachdaten nimmt und sie in Bilder umwandelt.

"Die anfängliche Kreativität kommt von dem Menschen, der die Aufgabe erstellt hat", sagte Schwartz. „Es gibt eine gewisse ‚Kreativität‘seitens der KI, weil sie mit verschiedenen Kombinationen von Daten experimentiert und dann aus einer Reihe potenzieller Ergebnisse auswählt. Ein Mensch untersucht jedoch die Ausgaben und bringt der KI bei, wie sie aus den vielen Kombinationen auswählen kann."

Roboter-Detektivarbeit?

Eine Maschine kann viel schneller mit dieser Daten- und Objektkombination experimentieren als ein menschlicher Künstler. Schwartz bemerkte, dass DALL-E eines Tages mit einem Detektiv zusammenarbeiten könnte, der versucht, einen Tatort anhand einer Skizze zu rekonstruieren, die auf Augenzeugenaussagen basiert.

"Wenn Zeugen ihre Aussagen machen, könnte der Computer diese gesprochenen Informationen in natürlicher Sprache nehmen und eine Zeichnung der Szene oder viele Zeichnungen der Szene erstellen", sagte sie. "Diese Visualisierungen könnten dann integriert werden, um ein genaueres Bild verlorener Beweise zu erstellen. Diese Visualisierung könnte durch die Integration früherer Bilder des Ortes vor dem Verbrechen angereichert werden."

Mehrere andere KI-gesteuerte Programme können Kunst produzieren. Zum Beispiel verwendet Ai-Da ein Roboterarmsystem und Gesichtserkennungstechnologie gepaart mit künstlicher Intelligenz, um Kunst zu schaffen. Das System kann ein vor der Maschine platziertes Bild analysieren, das in einen Algorithmus einfließt, um die Armbewegungen des Roboters zu erzeugen.

Menschliche Künstler sollten sich jedoch keine Sorgen machen, dass sie von Roboteroberherren ersetzt werden, argumentierte Ahmed Elgammal, der Direktor des Art and Artificial Intelligence Lab an der Rutgers University, letztes Jahr in der New York Times.

"Während sich die Definition von Kunst ständig weiterentwickelt, ist sie im Kern eine Form der Kommunikation zwischen Menschen", schrieb er. „Ohne einen menschlichen Künstler hinter der Maschine kann die KI kaum mehr tun, als mit der Form zu spielen, sei es das Manipulieren von Pixeln auf einem Bildschirm oder von Noten auf einem musikalischen Hauptbuch. Diese Aktivitäten können fesselnd und wahrnehmbar faszinierend sein, aber ohne Interaktion zwischen ihnen fehlt es an Bedeutung Künstler und Publikum."

Nachdem ich mir die Arbeit von DALL-E angesehen habe, verstehe ich Elgammals Argument, dass die von der KI erstellten Bilder keine Kunst sind. Andererseits sind sie besser als jede Kunst, die ich schaffen könnte. Also wirklich, was ist der Unterschied?

Wie KI-Systeme menschliche Kreativität imitieren

Inhaltsverzeichnis:

Key Takeaways

Mit Big Data Bilder produzieren

Roboter-Detektivarbeit?

Empfohlen:

KI-Musik ist gut, aber sie wird die menschliche Kreativität nicht ersetzen

Wie VR die Art und Weise verändern könnte, wie Sie zu Konzerten gehen

Wie elektronisches Spielzeug die Kreativität unserer Kinder stiehlt

Wie neue Technologien Sie in eine menschliche Batterie verwandeln könnten

IMovie- und GarageBand-Updates für mehr Kreativität

Ihr LinkedIn-Kontakt könnte ein Deepfake sein

WhatsApp überarbeitet Gruppenchats und nennt sie „Communities“

OnePlus 10 Pro 5G startet in den USA

MLBs Spiel der Woche kehrt 2022 auf YouTube zurück

Forscher setzen auf KI, um Meeresbewohner zu schützen

So verwenden Sie den Smart Data-Modus auf dem iPhone 13

So verwenden Sie den Kinomodus auf dem iPhone 13

So komprimieren Sie Dateien in ein ZIP-Archiv in Windows

Google TV vs. Android TV: Was ist der Unterschied?

Wie man Personen auf Twitter per E-Mail findet

Wie KI hilft, alte Inschriften zu entziffern

So teilen Sie Zellen in Excel

So erstellen Sie ein iMovie-Projekt

Was ist ein Einsch altknopf und was sind die Ein/Aus-Symbole?

Twitters Tor-Tool stürzt den Totalitarismus