Wie die Spracherkennung schnell, genau und vertraulich bleibt

Inhaltsverzeichnis:

Wie die Spracherkennung schnell, genau und vertraulich bleibt
Wie die Spracherkennung schnell, genau und vertraulich bleibt
Anonim

Key Takeaways

  • Fluent ist eine datenschutzfreundliche, superschnelle Spracherkennungs-Engine, die keine Internetverbindung benötigt.
  • Es kann in fast jedes Gerät eingebettet werden.
  • Funktioniert in jeder Sprache.
Image
Image

Fluent.ai ist eine virtuelle Spracherkennungsmaschine, die Ihre Befehle nicht an das Internet sendet, fast sofort reagiert, in jeder Sprache arbeiten kann und so klein ist, dass sie sogar in billige, niedrige Geräte eingebaut werden kann -Stromversorgungsgeräte wie zum Beispiel eine Fitnessuhr.

Im Gegensatz zu Siri und Alexa ist Fluent ein in sich geschlossener Assistent, der Sie sofort versteht und von Ihnen lernt, sodass er immer besser wird, je öfter Sie ihn verwenden. Es hat nicht die Tiefe von normalen virtuellen Assistenten, aber es ist nicht dazu gedacht. Stattdessen ist es schneller, genauer und vertraulicher als die Bemühungen von Apple, Amazon und Google.

"Speech-to-Text verwendet die Verarbeitung natürlicher Sprache und leitet dann die Absicht ab", sagte Probal Lala, CEO von Fluent, Lifewire während eines Zoom-Interviews. "Es erfordert viele Daten und viel Rechenleistung. Fließend geht direkt von der Sprache zur Absicht, nimmt Ihre Stimme und wandelt sie direkt in eine Aktion um."

Bottom Line

Fluent ist eine Sprachsteuerungssoftware. Es funktioniert, indem es auf Ihren Befehl hört und alle Wörter entfernt, die es nicht benötigt, sodass nur die wesentlichen Substantive und Verben übrig bleiben. „Licht ausmachen“, wird einfach aus und Licht. Die wesentlichen Elemente werden aus einem chaotischen menschlichen Satz entfernt und in Schritte umgewandelt. Es ist fast so, als würde man einen Computer programmieren und eine komplexe Idee in die einfachste Anweisung umwandeln.

Wofür kann es verwendet werden?

Fluent kann für alles verwendet werden. Der Schlüssel ist, dass es für eine bestimmte Situation trainiert wird. Mit einer Smartwatch könnten ihr beispielsweise Befehle für Fitness oder Heimautomatisierung, Kalender- und Timererstellung usw. beigebracht werden. Das Einschränken der Datenbank macht alles fokussierter und hält es schnell.

"Die Wahrheit ist, dass Sie mit Wearables kein Gespräch suchen", sagte Lala, "ich möchte vielleicht, dass mein Lieblingsübungsprogramm beginnt, und zwar sehr schnell."

Geschwindigkeit und Genauigkeit sind der springende Punkt. Das Ein- und Aussch alten der Lichter dauert Millisekunden, anstatt darauf warten zu müssen, dass Siri Ihre Stimme an die Cloud sendet, warten, bis sie verarbeitet wird, und Sekunden später das Licht ausgeht.

Dieses enge Training hält auch die Größe der App gering. Letztes Jahr hat Google eine herunterladbare Offline-Version seines Assistenten bereitgestellt. Es war, sagt Lala, 85 Megabyte groß, funktionierte nur auf Englisch, und es dauerte sechs Monate, es zu trainieren.

"Wir haben ein Modell, das mit 13.000 Befehlen arbeitet und mit 500 Kilobyte arbeitet", sagte er.

Bottom Line

Der andere Vorteil einer Offline-Spracherkennungsmaschine ist der Datenschutz. In einer intelligenten Kinderuhr zum Beispiel „will man nicht, dass die Stimme eines Kindes in die Cloud geht“, sagt Lala. Tatsächlich kann Fluent in Geräten funktionieren, die niemals mit dem Internet verbunden sind. Das ist nicht nur gut für die Privatsphäre, sondern auch für die Sicherheit. Sie könnten eine Offline-Spracherkennungs-Engine in Forschungslabors, militärischen Einrichtungen und anderen Orten verwenden, an denen Mobiltelefone und Kameras verboten sind.

Limits

Natürlich hat dieses Modell einige Nachteile. Einer ist, dass Befehle nicht nachträglich hinzugefügt werden können. Sobald die Erstausbildung abgeschlossen ist, war es das. Ihr Fluent-basierter Assistent kann auch nicht im Internet für Sie nachschlagen – Sportergebnisse, den Schauspieler, den Sie in diesem Film erkennen, aber einfach nicht zuordnen können, und so weiter.

Image
Image

Stattdessen ist das System intelligent genug, um zu erkennen, wenn es nicht helfen kann, und es leitet die Anfrage an etwas weiter, das es kann. Wenn Sie Ihre Uhr nach der Wettervorhersage fragen, wird Fluent feststellen, dass sie sie nicht versteht. "Dann ruft es einen in der Uhr vorprogrammierten Dienst an, sei es Amazons Alexa oder Google, und ruft dann die Cloud an " und gibt Ihren rohen Sprachbefehl weiter, um die Antwort zu erh alten.

Dieser hybride Ansatz behält die Geschwindigkeit eines lokalen Offline-Assistenten bei, mit der Leistung von Alexa oder Google Assistant als Backup.

Können Sie Fluent-Geräte kaufen?

Noch nicht. Das Unternehmen lizenziert seine Technologie und führt die Schulungen für andere Unternehmen durch. Dank COVID wurden zwei große Markteinführungen auf das nächste Jahr verschoben. Aber Sie können davon ausgehen, dass es in Uhren und anderen Fitnessgeräten, Lautsprechern, Heimautomatisierungs-Hubs usw. angezeigt wird.

Es wäre großartig, wenn dies auch direkt in Smartphones wie das iPhone integriert würde, um alltägliche Aufgaben schneller zu erledigen und nur bei Bedarf auf Siri zurückzugreifen. Das wäre die echte Killer-App.

Update: 22. Oktober, 10:12 Uhr. Änderungen vorgenommen, um Fluent als Spracherkennungs-Engine und nicht als Sprachassistenten zu bezeichnen.

Empfohlen: