Com és fluid, el reconeixement de veu es manté ràpid, precís i privat

Taula de continguts:

Com és fluid, el reconeixement de veu es manté ràpid, precís i privat
Com és fluid, el reconeixement de veu es manté ràpid, precís i privat
Anonim

Clau per emportar

  • Fluent és un motor de reconeixement de veu súper ràpid que respecta la privadesa que no necessita connexió a Internet.
  • Es pot incrustar a gairebé qualsevol dispositiu.
  • Funciona en qualsevol idioma.
Image
Image

Fluent.ai és un motor de reconeixement de veu virtual que no envia les teves ordres a Internet, actua gairebé a l'instant, pot funcionar en qualsevol idioma i és tan petit que es pot incorporar fins i tot a un preu baix i barat. -dispositius elèctrics com un rellotge de fitness, per exemple.

A diferència de Siri i Alexa, Fluent és un assistent autònom que us entén a l'instant i aprèn de vos altres perquè millori com més l'utilitzeu. No té la profunditat dels assistents virtuals habituals, però no està pensat. En canvi, és més ràpid, més precís i més privat que els esforços d'Apple, Amazon i Google.

"La parla a text utilitza el processament del llenguatge natural i després deriva la intenció", va dir a Lifewire el CEO de Fluent, Probal Lala, durant una entrevista de Zoom. "Requereix moltes dades i molta potència de processament. Fluent passa directament de la parla a la intenció, agafant la teva veu i convertint-la directament en una acció."

Conclusió

Fluent és un programari de control per veu. Funciona escoltant la vostra ordre i eliminant totes les paraules que no necessita, deixant només substantius i verbs essencials. "Apaga els llums", es converteix en just apagat i llums. Els elements essencials es despullen d'una frase humana desordenada i es converteixen en esglaons. És gairebé com programar un ordinador, convertir una idea complexa en el conjunt d'instruccions més senzill.

Per a què es pot utilitzar?

Fluent es pot utilitzar per a qualsevol cosa. La clau és que estigui entrenat per a una situació concreta. Amb un rellotge intel·ligent, per exemple, es pot entrenar en ordres per a fitness, o per a la domòtica, la creació de calendari i temporitzador, etc. Limitar la base de dades fa que tot estigui més centrat i es manté ràpid.

"La veritat és que amb els wearables, no estàs buscant tenir una conversa", va dir Lala, "Vull que potser comenci la meva rutina d'exercicis preferida, i ho vull molt ràpidament."

La velocitat i la precisió són el principal objectiu. Encendre i apagar els llums triga mil·lisegons, en lloc d'haver d'esperar que Siri enviï la teva veu al núvol, espera que es processi i, uns segons més tard, s'apaguen els llums.

Aquest entrenament estret també manté la mida de l'aplicació reduïda. L'any passat, Google va oferir una versió descarregable i fora de línia del seu assistent. Tenia, diu Lala, 85 megabytes, només funcionava en anglès i va trigar sis mesos a entrenar-lo.

"Tenim un model que funciona amb 13.000 ordres i funciona en 500 kilobytes", va dir.

Conclusió

L' altre avantatge d'un motor de reconeixement de veu fora de línia és la privadesa. En el rellotge intel·ligent d'un nen, per exemple, "no voleu que la veu d'un nen vagi al núvol", diu Lala. De fet, Fluent pot funcionar dins de dispositius que mai es connecten a Internet. Això no només és bo per a la privadesa, sinó també per a la seguretat. Podeu utilitzar un motor de reconeixement de veu fora de línia dins de laboratoris de recerca, instal·lacions militars i altres llocs que prohibeixen els telèfons mòbils i les càmeres.

Límits

Per descomptat, aquest model té alguns inconvenients. Una és que les ordres no es poden afegir més tard. Un cop finalitzada la formació inicial, això és tot. Tampoc el teu assistent basat en Fluent no pot cercar les teves puntuacions esportives a Internet, l'actor que reconeixes a la pel·lícula, però que simplement no pots col·locar, i així successivament.

Image
Image

En canvi, el sistema és prou intel·ligent com per reconèixer quan no pot ajudar i lliurarà la sol·licitud a alguna cosa que pugui. Si demaneu al vostre rellotge la previsió meteorològica, Fluent s'adonarà que no entén. "Llavors trucarà a un servei que estigui preprogramat al rellotge, ja sigui l'Alexa d'Amazon o Google, i després farà una trucada al núvol", passant la vostra ordre de veu sense processar per obtenir la resposta.

Aquest enfocament híbrid manté la velocitat d'un assistent local fora de línia, amb la potència d'Alexa o l'Assistent de Google com a còpia de seguretat.

Podeu comprar algun dispositiu fluid?

Encara no. L'empresa està donant llicències per a la seva tecnologia i realitza la formació per a altres empreses. Gràcies a la COVID, dos llançaments importants s'han ajornat a l'any vinent. Però podeu esperar veure'l a rellotges i altres dispositius de fitness, altaveus, concentradors de domòtica, etc.

Seria fantàstic que també s'incorporés directament a telèfons intel·ligents com l'iPhone, fent les tasques del dia a dia més ràpides i només recorrent a Siri quan sigui necessari. Aquesta seria la veritable aplicació assassina.

Actualització: 22 d'octubre, 10:12. S'han fet canvis per referir-se a Fluent com a motor de reconeixement de veu i no com a assistent de veu.

Recomanat: