Com funciona la funció Hum to Search de Google

Taula de continguts:

Com funciona la funció Hum to Search de Google
Com funciona la funció Hum to Search de Google
Anonim

Clau per emportar

  • Google ha llançat una nova eina que permet als usuaris cercar cançons taral·leant, cantant o xiulant.
  • La nova eina utilitza l'aprenentatge automàtic per fer coincidir una pista taulada amb una base de dades de més de mig milió de cançons que s'actualitza contínuament.
  • Els usuaris de Google pregunten quina cançó es reprodueix gairebé 100 vegades cada mes.
Image
Image

Google ha llançat una nova funció anomenada "Hum to Search" per resoldre un problema frustrant: tenir una cançó clavada al cap i no poder esbrinar com es diu.

La idea de tararear per trobar una cançó sembla increïblement senzilla, així que per què Google només llança aquesta funció el 2020? Bé, resulta que identificar les cançons d'aquesta manera és realment bastant complicat, en part perquè les nostres versions tarareades solen ser força diferents de la cançó original. En una publicació recent al seu bloc d'IA, Google explica com va utilitzar l'aprenentatge automàtic per solucionar aquest problema i, en última instància, ajudar la gent a trobar una cançó taral·leant, xiulant o cantant la melodia, fins i tot quan la seva interpretació no és precisa..

"El nostre enfocament de Hum to Search és ajudar la gent a identificar i trobar la música que se'ls queda enganxada al cap", va dir a Lifewire un portaveu de Google en un correu electrònic.

Comenceu a tararear

Els usuaris de Google pregunten quina cançó es reprodueix gairebé 100 milions de vegades al mes, va dir Aparna Chennapragada, vicepresident i director general de compres de consumidors de Google, en un vídeo que presenta diverses funcions de cerca noves. Ara hi ha una manera d'esbrinar-ho.

La funció "Hum to Search" està integrada a l'aplicació per a mòbils de Google, el giny de Cerca de Google i l'Assistent de Google. Per accedir-hi mitjançant l'aplicació, toca la icona del micròfon i digues "Què és aquesta cançó?" Seleccionar el botó "Cerca una cançó" també funciona.

Per funcionar correctament, la funció requereix que taraleu durant almenys 10-15 segons. Els usuaris d'Android poden tararear per trobar cançons en més de 20 idiomes, mentre que només les cançons en anglès funcionen als iPhones. L'eina no sempre és capaç d'identificar una cançó immediatament, però un cop ho fa, els resultats són força bons.

"Més de la meitat de les cançons d'un ampli conjunt de variables (to, to, volum, etc.) són reconegudes pels nostres algorismes, però, per descomptat, la precisió depèn de la qualitat del taral·leig, el tipus de la cançó i més", va dir el portaveu de Google a Lifewire en un correu electrònic. "Però un cop reconegut, aproximadament quatre de cada cinc respostes són correctes."

Aquesta no és la primera vegada que s'utilitza el taral·leig en una aplicació d'identificació de música. SoundHound ofereix una funció similar, tal com va assenyalar CNN Business, i també està disponible a Android i iOS. Segons el portaveu de Google, la nova funció no planteja cap problema de privadesa, ni "canvia la manera com Google gestiona les interaccions basades en àudio", van dir a Lifewire en un correu electrònic.

Aprenentatge automàtic

Tot i la senzillesa del concepte, tararear una melodia per trobar la gravació d'estudi és tècnicament força difícil. Hi ha diverses raons per a això, explica Christian Frank de Google Research en una publicació del blog del 12 de novembre. En primer lloc, una versió tarareada de la cançó pot diferir molt de l'enregistrament real, cosa que dificulta fer coincidir les dues. Així, tot i que Shazam i moltes altres aplicacions ja existeixen per identificar la cançó que escolteu en un restaurant o un altre lloc públic, utilitzar una melodia taral·leada com a base per a aquesta cerca pot ser més complicat.

"Amb lletres, veus de fons i instruments, l'àudio d'un enregistrament musical o d'estudi pot ser molt diferent d'una melodia tarareada", escriu Frank."Per error o disseny, quan algú tararea la interpretació d'una cançó, sovint el to, la tonalitat, el tempo o el ritme poden variar lleugerament o fins i tot significativament."

Image
Image

Com que les versions tararejades de les cançons poden ser molt diferents de les originals, en Frank assenyala que molts mètodes anteriors han requerit fer coincidir el tararear d'una persona amb una versió de la cançó que només tingui una melodia o una pista que inclogui taral·leig. Això ha fet que els casos d'ús del món real siguin difícils, ja que les bases de dades amb aquestes cançons poden estar limitades i s'han d'actualitzar manualment.

Google explica que per a la funció Hum to Search, utilitza models d'aprenentatge automàtic per convertir l'àudio en una "seqüència basada en números" que representa la melodia de la cançó; el que diu es pot considerar una "empremta digital".."

Més fàcil d'utilitzar

L'ús de l'aprenentatge automàtic a la funció Hum to Search de Google fa que l'eina sigui molt més fàcil d'utilitzar al món real. Com que Hum to Search coincideix amb la melodia tarareada del cercador amb la cançó real, l'eina pot treballar amb les cançons noves a mesura que es publiquen en lloc d'una base de dades que s'ha d'actualitzar constantment amb versions taulades de cada pista. A més, no necessites un to perfecte per utilitzar-lo.

"El sistema actual assoleix un alt nivell de precisió en una base de dades de cançons que conté més de mig milió de cançons que estem actualitzant contínuament", va dir Google en el seu anunci Hum to Search. "Aquest corpus de cançons encara té espai per créixer per incloure més de les moltes melodies del món."

Recomanat: