Google: dimmi che voce hai e ti dirò chi sei, IA abbina suono a volti

Nuova IA brevettata da Google, è in grado di associare le voci ai volti grazie al machine learning.

di Daniele Magliuolo, pubblicato il
Nuova IA brevettata da Google, è in grado di associare le voci ai volti grazie al machine learning.

Non ci sono limiti per Google, ora l’intelligenza artificiale di Mountain View sta lavorando su un nuovo progetto capace di assimilare la voce ai volti, riconoscere cioè tra diversi modelli a quale volto associare la voce. Un esperimento che evolve ulteriormente quello già avviato da Big G tempo fa.

Google, l’IA al servizio della voce

Il nuovo machine learning di Google è in grado di riconoscere la voce tra tante, ed associarla al volto preregistrato. Detta così, non sembra francamente chissà quale grande scoperta, e non pare nemmeno così utile, ci immaginiamo cose alla Law & Order, con l’IA in questione ad aiutare Benson nella risoluzione del caso fornendo l’identikit finale del colpevole grazie al solo suono della voce. Ma Google ha già brevettato il tutto, quindi la cosa va spiegata decisamente meglio per farne capire l’importanza anche a chi come noi, ad una prima lettura, ha fatto fatica a capire.

Potrebbe interessarti anche: Quante radiazioni emettono gli smartphone e quali sono i più pericolosi?

La prima operazione eseguita è la ricerca dei diversi volti presenti all’interno di un filmato, dopodiché ogni viso viene controllato per identificare quando la persona corrispondente pronuncia qualcosa. L’IA cerca poi un punto della clip in cui il soggetto parla mentre gli altri stanno in silenzio e ne analizza l’audio per generare un profilo sonoro univoco che sarà poi associato alla sua identità.  Una volta creato tale archivio, l’IA sarà in grado di riconoscere le voci anche quando più speaker parleranno contemporaneamente.

A che serve? Cancellate dalla memoria Law & Order, questa tecnologia sarà invece molto utile per migliorare e rendere ancora più sicuri i sistemi di riconoscimento facciale, ampliandoli quindi anche con il riconoscimento vocale. Potrebbe inoltre essere utilizzata per la creazione di sottotitoli, come ad esempio per i video dei siti di streaming o su Youtube.

Potrebbe interessarti anche: WhatsApp perde colpi e i clienti l’abbandonano, cosa sta accadendo?

Condividi su
flipboard icon
Seguici su
flipboard icon
Argomenti: novità Google, Nuove tecnologie