So funktioniert Googles Hum-to-Search-Funktion

Inhaltsverzeichnis:

So funktioniert Googles Hum-to-Search-Funktion
So funktioniert Googles Hum-to-Search-Funktion
Anonim

Key Takeaways

  • Google hat ein neues Tool eingeführt, mit dem Nutzer nach Liedern suchen können, indem sie summen, singen oder pfeifen.
  • Das neue Tool verwendet maschinelles Lernen, um einen gesummten Titel mit einer Datenbank von mehr als einer halben Million Songs abzugleichen, die ständig aktualisiert wird.
  • Google-Nutzer fragen jeden Monat fast 100 Mal, welcher Song gespielt wird.
Image
Image

Google hat eine neue Funktion namens "Hum to Search" eingeführt, um ein frustrierendes Problem zu lösen: ein Lied im Kopf zu haben und nicht herauszufinden, wie es heißt.

Die Idee, einen Song zu summen, scheint unglaublich einfach zu sein, also warum führt Google diese Funktion erst 2020 ein? Nun, es stellt sich heraus, dass das Identifizieren von Songs auf diese Weise ziemlich kompliziert ist, teilweise weil unsere gesummten Versionen dazu neigen, sich ziemlich vom Origin altrack zu unterscheiden. In einem kürzlich erschienenen Beitrag in seinem KI-Blog erklärt Google, wie es maschinelles Lernen verwendet hat, um dieses Problem zu beheben und den Menschen letztendlich dabei zu helfen, einen Song zu finden, indem sie die Melodie summen, pfeifen oder singen, selbst wenn ihre Wiedergabe nicht ganz genau ist.

"Unser Fokus bei Hum to Search liegt darauf, Menschen dabei zu helfen, Musik zu identifizieren und zu finden, die ihnen im Gedächtnis geblieben ist", sagte ein Google-Sprecher Lifewire in einer E-Mail.

Fang einfach an zu summen

Google-Nutzer fragen jeden Monat fast 100 Millionen Mal, welches Lied gespielt wird, sagte Aparna Chennapragada, Googles Vizepräsidentin und General Managerin für Verbrauchereinkäufe, in einem Video, das mehrere neue Suchfunktionen vorstellt. Jetzt gibt es eine Möglichkeit, das herauszufinden.

Die Funktion "Hum to Search" ist in die mobile App von Google, das Widget für die Google-Suche und Google Assistant integriert. Um über die App darauf zuzugreifen, tippen Sie auf das Mikrofonsymbol und sagen Sie „Was ist das für ein Lied?“. Die Auswahl der Sch altfläche „Titel suchen“funktioniert ebenfalls.

Um richtig zu funktionieren, muss die Funktion mindestens 10-15 Sekunden lang summen. Android-Benutzer können summen, um Songs in mehr als 20 Sprachen zu finden, während auf iPhones nur englische Songs funktionieren. Das Tool ist nicht immer in der Lage, einen Song sofort zu identifizieren, aber sobald es das tut, sind die Ergebnisse ziemlich gut.

"Mehr als die Hälfte der Songs einer Vielzahl von Variablen (Ton, Tonhöhe, Lautstärke usw.) werden von unseren Algorithmen erkannt, aber natürlich hängt die Genauigkeit von der Qualität des Summens ab, der Art von das Lied und mehr", sagte der Google-Sprecher Lifewire in einer E-Mail. "Aber sobald es erkannt wird, sind etwa vier von fünf Antworten richtig."

Dies ist jedoch nicht das erste Mal, dass das Summen in einer Musikerkennungs-App verwendet wird. SoundHound bietet eine ähnliche Funktion, wie von CNN Business angemerkt, und ist auch für Android und iOS verfügbar. Laut dem Google-Sprecher wirft die neue Funktion weder Datenschutzbedenken auf, noch „ändert sie die Art und Weise, wie Google audiobasierte Interaktionen handhabt“, teilten sie Lifewire in einer E-Mail mit.

Maschinelles Lernen

Trotz der Einfachheit des Konzepts ist es technisch ziemlich schwierig, eine Melodie zu summen, um die Studioaufnahme zu finden. Dafür gibt es mehrere Gründe, erklärt Christian Frank von Google Research in einem Blogbeitrag vom 12. November. Zunächst einmal kann eine gesummte Version des Songs stark von der eigentlichen Aufnahme abweichen, was es schwierig macht, die beiden abzugleichen. Während Shazam und eine Vielzahl anderer Apps bereits existieren, um den Song zu identifizieren, den Sie in einem Restaurant oder an einem anderen öffentlichen Ort hören, kann es schwieriger sein, eine gesummte Melodie als Grundlage für diese Suche zu verwenden.

"Mit Texten, Hintergrundgesang und Instrumenten kann der Ton einer Musical- oder Studioaufnahme ganz anders sein als eine gesummte Melodie", schreibt Frank."Aus Versehen oder absichtlich, wenn jemand seine Interpretation eines Songs summt, können Tonhöhe, Tonart, Tempo oder Rhythmus oft leicht oder sogar erheblich variieren."

Image
Image

Da sich die gesummten Versionen von Liedern so sehr von den Originalen unterscheiden können, stellt Frank fest, dass viele frühere Methoden es erforderten, das Summen einer Person mit einer Version des Liedes abzugleichen, die nur eine Melodie hat, oder mit einem Titel, der Summen enthält. Dies hat reale Anwendungsfälle zu einer Herausforderung gemacht, da die Datenbanken mit diesen Songs begrenzt sein können und manuell aktualisiert werden müssen.

Google erklärt, dass für die Funktion „Hum to Search“maschinelle Lernmodelle verwendet werden, um Audio in eine „zahlenbasierte Sequenz“umzuwandeln, die die Melodie des Songs darstellt – was darin steht, kann man sich als „Fingerabdruck“vorstellen."

Benutzerfreundlicher

Die Verwendung von maschinellem Lernen in Googles Hum-to-Search-Funktion macht das Tool letztendlich viel einfacher in der realen Welt zu verwenden. Da Hum to Search die gesummte Melodie des Suchenden mit dem tatsächlichen Song abgleicht, kann das Tool mit den neuen Songs arbeiten, sobald sie veröffentlicht werden, anstatt mit einer Datenbank, die ständig mit gesummten Versionen jedes Titels aktualisiert werden muss. Außerdem brauchen Sie keine perfekte Tonhöhe, um es zu verwenden.

"Das aktuelle System erreicht ein hohes Maß an Genauigkeit in einer Song-Datenbank, die über eine halbe Million Songs enthält, die wir ständig aktualisieren", sagte Google in seiner Hum to Search-Ankündigung. „Dieser Songkorpus hat noch Raum zum Wachsen, um mehr der vielen Melodien der Welt aufzunehmen.“

Empfohlen: