Key Takeaways
- Videoanrufe sind explodiert, und doch sind Hard- und Software so schlecht wie eh und je.
- iPhones und iPads haben bessere Kameras, weil sie es sich leisten können.
- Software und KI fügen bereits moderne Funktionen hinzu.
Innerhalb eines Jahres sind Videoanrufe von einer einmal im Monat stattfindenden FaceTime mit den Großeltern zu einem wesentlichen Bestandteil des Alltags geworden. Aber die Technologie steckt immer noch im Skype-Zeit alter fest.
Videoanrufe sind vielleicht die primitivsten Dienste, die wir nutzen. Wir haben mit Audioverzögerungen und eingefrorenem Video zu tun, und die meisten Anrufe beginnen damit, dass alle sagen: „Kannst du mich hören?“Aber das soll sich ändern. Apple hat gerade das erstaunliche Center Stage zum M1 iPad Pro hinzugefügt, Reincubate’s Camo macht dasselbe für den Mac, und die Branche erwacht zu den Möglichkeiten des Einsatzes künstlicher Intelligenz (KI) in Video-Chats.
"Man hat den Eindruck, dass Videoanrufe 'fertig' sind und dass Skype das Problem im Jahr 2003 gelöst hat. Seitdem gibt es zwar viele Social-Video-Apps, aber Videoanrufe sind größtenteils ein Thema für Unternehmen." Es hat sich nicht viel geändert“, sagte Aidan Fitzpatrick, CEO von Reincubate, Lifewire per E-Mail.
Warum sind Webcams so schlecht?
Bevor wir zu den schrecklichen Apps kommen, wollen wir herausfinden, warum Webcams so schlecht sind. Meistens liegt es an den Kosten. Die nach vorne gerichteten Kameras in iPhones und iPads sind beispielsweise hervorragend. Sie haben auch Tiefenerkennungsfunktionen, die sich hervorragend zur Verbesserung von Videos eignen, aber dazu kommen wir noch. Telefone sind teuer, während Laptops billig sind.
"Apple (und in geringerem Maße Android-Anbieter) haben viel in Kameratechnologie investiert, aber ihre Hardware ist immer noch nicht billig", sagt Fitzpatrick. „Sie können diese neue Technologie als Teil ihrer Telefone bündeln, aber es gab weniger zwingende Gründe, sie in einer eigenständigen Webcam oder sogar in Laptops zu bündeln. Wenn Verbraucher 750 bis 1.000 US-Dollar für eine Webcam bezahlen würden, wäre dies der Fall beginnen, mehr Sinn zu machen, aber es gibt nicht genug Nachfrage zu diesem Preis, um dies zu rechtfertigen."
Werden Laptop-Kameras besser? Wahrscheinlich nicht. Sogar Apples brandneuer iMac, der während der Videoanrufe der COVID-Ära geboren wurde, hat dieselbe 1080p-Webcam wie frühere Macs. Und doch sieht es viel besser aus als diese älteren Macs. Und hier kommt die Software ins Spiel.
KI und Apps
Die Verbesserung der Webcam des iMac 2021 ist (fast) ausschließlich auf die Software zurückzuführen. Jetzt, da Macs die gleichen Chips wie iPhones und iPads verwenden, können sie von Apples jahrelanger Forschung in der Bildverarbeitungstechnologie profitieren, die eine Mischung aus Software und speziellen Chips zur Verarbeitung von Bildern und Videos ist.
Diese Technologie kann verblüffend sein. Das neue M1 iPad Pro verfügt über Center Stage. Dadurch wird das Video von der hochauflösenden Ultraweitwinkel-Frontkamera aufgenommen und automatisch auf die Personen im Bild gezoomt (oder zugeschnitten). Das bedeutet, dass die virtuelle Kamera Ihnen folgen kann, wenn Sie sich bewegen oder hinein- und herauszoomen und wenn Personen dem Anruf beitreten oder ihn verlassen.
Jetzt macht Camo von Reincubate dasselbe für den Mac. Camo verwendet die Kamera auf Ihrem iPhone oder iPad als Webcam für Ihren Mac, komplett mit allen möglichen coolen Verarbeitungen, wie z. B. das Verwischen des Hintergrunds oder das bessere Aussehen.
"Sie können sich ein Video wie dieses ansehen, in dem jemand die führenden Webcams vergleicht, aber er vergleicht immer nur Webcams mit Webcams", sagt Fitzpatrick. „Wenn Sie einen Schritt zurücktreten und die Bildqualität hier mit dem echten Leben – oder einem Film – vergleichen, werden Sie feststellen, dass sie schrecklich sind. Die Leute neigen dazu, Webcams mit älteren, schlechteren Kameras zu vergleichen: ‚Es ist besser als nichts.‘“
KI kann auch andere Probleme lösen. Sprachkollisionen treten beispielsweise auf, wenn mehrere Personen gleichzeitig sprechen. Ein neues Patent von IBM behebt dies. „Das System ist in der Lage, die Lautstärke und das Timing für die Benutzerstimmen der Telefonkonferenz anzupassen“, sagte Lauren Hawksworth von Founders Legal Lifewire per E-Mail, „was auch eine nahtlosere Kommunikation ermöglichen kann, ohne andere Parteien vollständig stummzusch alten.“
Weitere KI-Möglichkeiten umfassen Echtzeit-Untertitel und Videoverarbeitung, um den Eindruck zu erwecken, als würden sich die Leute gegenseitig anschauen, nicht ihre Kameras. Und in Zukunft könnte Virtual Reality oder Augmented Reality Bildschirme abschaffen und es so aussehen lassen, als würden Sie einen physischen Raum teilen.
Beleuchtung, Kamera, Tarnung
Während die Kameraqualität wichtig ist, sind wir ein Teil des Problems. Schreibtischgebundene Laptop-Kameras blicken uns in die Nase, und wir zünden uns nie richtig an. Außerdem haben wir immer noch keinen guten, gemeinsamen Konsens darüber, wie wir uns verh alten sollen.
Die Leute finden heraus, wo sie hinsehen müssen, wie ausdrucksstark sie sein sollen, wie viel von ihrem Körper auf dem Bild zu sehen sein sollte und welchen Hintergrund sie haben sollten. Die Forschung wurde bereits durchgeführt, um diese Fragen zu beantworten, aber die Kultur muss sich darum herum entwickeln, und die Antworten sind nicht immer intuitiv“, sagt Fitzpatrick. „Alle Studien sagen, dass virtuelle Hintergründe schrecklich sind (die Daten sagen, dass sie geringes Vertrauen, geringe Authentizität und mangelnde Vorbereitung signalisieren), aber die Leute benutzen sie immer noch.“
Wenn sich die Welt wieder öffnet, werden Videos möglicherweise weniger dringend, aber einige Verwendungszwecke bleiben bestehen. Home Office ist ein willkommener Trend, ebenso wie virtuelle Arztbesuche oder Remote-Yoga-Sessions. Und hoffentlich wird sich die Videosoftware weiter verbessern.