Key Takeaways
- Meta setzt stark auf KI, um das Metaversum zu liefern.
- Project CAIRaoke ist ein Framework, das Entwicklern hilft, bessere kontextsensitive digitale Assistenten zu entwickeln.
-
Meta stellt sich Project CAIRaoke-gestützte Assistenten vor, die in VR-Headsets und AR-Brillen integriert sind.
Wenn es nach Meta geht, könnten unsere Kämpfe mit digitalen Assistenten der Vergangenheit angehören.
In einer virtuellen Veranst altung im Februar präsentierte Meta ein neues neuronales Modell für digitale Assistenten namens Project CAIRaoke, von dem es behauptet, dass es in der Lage sein wird, viel bessere kontextbezogene Gespräche zu führen.
"Das Hauptproblem bei digitalen Assistenten ist, dass sie sich an das Benutzerverh alten und die Umgebung anpassen sollen, aber sie funktionieren umgekehrt", sagte Vivek Khurana, Head of Engineering, Knot Offices, Lifewire per E-Mail. "Das Projekt CAIRoke scheint der richtige Schritt in Richtung eines Assistenten zu sein, der sich an das Nutzerverh alten und die Bedingungen anpasst."
Echte Assistenten
In einem technischen Beitrag argumentierte Alborz Geramifard, AI Tech Lead von Meta, dass die aktuelle Generation digitaler Assistenten, sowohl text- als auch sprachbasiert, viel zu wünschen übrig lässt, da ihnen Kontextbewusstsein fehlt.
Trotz ihrer komplexen KI-gestützten Gehirne können sie einfache Anfragen nicht verstehen, die für einen 10-Jährigen sinnvoll wären. Zum Beispiel würde eine Aufforderung, „alle Benachrichtigungen stumm zu sch alten, außer wenn es ein Anruf von meiner Mutter ist“, jeden aktuellen digitalen Assistenten verblüffen.
Um diese Hürde zu überwinden, sagte Geramifard, dass es das Projekt CAIRaoke als eine Kombination der vier Sprachmodelle der künstlichen Intelligenz (KI) aufbaut, die heute in Assistenten verwendet werden. Er schrieb, dass Project CAIRaoke im Gegensatz zu den meisten Assistenten, die darauf programmiert sind, auf bestimmte Wörter und Sätze zu reagieren, darauf ausgelegt ist, den Kontext besser zu verstehen und die Fähigkeit zu haben, verschiedene Sätze zu erkennen, die verwendet werden, um dasselbe auszudrücken. Dieser Ansatz ermöglicht eine natürlichere und fließendere Konversation.
Die technischen Informationen in Geramifards Beitrag verdauend, sagte Khurana, dass Entwickler durch das Projekt CAIRoke in der Lage sein würden, Assistenten zu bauen, die leicht mit dem Benutzer in Dialog treten können, da sie Entscheidungen treffen können, indem sie sich eine breite Palette von Informationen ansehen, und nicht nur das Modell, mit dem sie trainiert wurden.
Er illustrierte das Hinzufügen von Kontext zu Gesprächen durch ein Beispiel eines digitalen Assistenten, der Essensbestellungen entgegennimmt, der in der Lage sein wird, neu eingeführte Menüpunkte basierend auf den Vorlieben des Benutzers oder früheren Bestellungen vorzuschlagen. „Das eröffnet Entwicklern ganz neue Möglichkeiten, Self-Service-Assistenten für den Kundenservice zu bauen“, meint Khurana.
Perspektive aus der ersten Person
Meta hat viel auf KI gesetzt, um seine Vision des Metaversums als die Entwicklung des Internets zu verwirklichen, das viel interaktiver und immersiver ist, und Project CAIRoke ist eine wichtige Komponente dieser Erfahrung.
In einer Videopräsentation sagte Mark Zuckerberg, CEO von Meta, dass sein neues und erheblich verbessertes Framework für digitale Assistenten den Ansatz hinter seinem Open-Source-Chatbot namens BlenderBot mit der neuesten Konversations-KI kombiniert, um bessere Dialogfähigkeiten zu bieten.
Der im Juli 2021 aktualisierte BlenderBot 2.0 ist einzigartig in seiner Fähigkeit, relevante Informationen in einem Gespräch zu notieren und im Langzeitgedächtnis zu speichern, auf das er sich dann für sinnvolle Interaktionen in der Zukunft verlässt. Darüber hinaus wird das „Wissen“für jede Person, mit der BlenderBot interagiert, separat gespeichert, um maßgeschneiderte Erfahrungen zu liefern.
Laut Zuckerberg erweitert Project CAIRaoke die BlenderBot 2.0-Technologie, um aufgabenorientierte Gespräche zu unterstützen.
Das System wird derzeit mit Metas Portal-Familie von Videoanrufgeräten getestet, die über eine KI-betriebene intelligente Kamera verfügen, die schwenkt und zoomt, um den Benutzern zu folgen, während sie sich frei bewegen. Portal fungiert auch als digitaler Assistent, der sich derzeit auf Alexa von Amazon verlässt, um mit Smart-Home-Zubehör und anderen Aufgaben zu kommunizieren.
Es gibt keinen Zeitplan dafür, wann Project CAIRaoke auf den Portal-Geräten verfügbar sein wird, aber das Unternehmen gab an, dass es hofft, es irgendwann auch auf Virtual-Reality-(VR)-Headsets und Augmented-Reality-(AR)-Brillen ausrollen zu können.
"Das Hauptproblem bei digitalen Assistenten ist, dass [sie] sich an das Benutzerverh alten und die Umgebung anpassen sollen…"
Geramifard stellt sich vor, dass die neue Ära der digitalen Assistenten in der Lage sein wird, die Interaktionen zwischen Menschen und Geräten neu zu definieren. Sie könnten zum Beispiel einen Project CAIRaoke-gestützten Assistenten, der in eine AR-Brille integriert ist, nach Hemdvorschlägen fragen, die zu einer bestimmten Hose passen, basierend auf Ihrer Lieblingsfarbe, und seine Vorschläge sogar basierend auf Ihrem aktuellen Geschmack optimieren.
"Auf Geräten wie VR-Headsets und AR-Brillen erwarten wir, dass diese Art der Kommunikation irgendwann die allgegenwärtige, nahtlose Methode für Navigation und Interaktion sein wird, ähnlich wie Touchscreens Tastaturen auf Smartphones ersetzten", prognostizierte Geramifard.