Briciole di pane



Language is the new interface

Language is the new interface

05 Agosto 2019 Una fotografia inedita, unica o quasi nel suo genere in Italia, sulla diffusione degli smart speaker. La ricerca realizzata da Celi, società di proprietà al 100% di H-Farm (dal 2017) e attiva da diversi anni sul fronte delle tecnologie di riconoscimento vocale per il mondo automotive, in collaborazione con l’istituto di ricerca Kkienn, ci dice in altre parole come e quanto sia sviluppato il rapporto fra gli italiani e i dispositivi intelligenti che sanno riconoscere i comandi vocali impartiti dall’utente e agire di conseguenza. Il dato forse più importante che emerge dall’indagine, svolta nella seconda metà di giugno, è che il 13% del panel online di 700 consumatori preso a campione ha in casa uno smart speaker. Una penetrazione già significativa, dicono gli autori dello studio, sullo stesso livello dei gadget indossabili e superiore a quello delle bici elettriche, per quanto ancora molto lontana dalle percentuali di adozione di smartphone e personal computer (rispettivamente al 95% e all’88%) e di altri prodotti smart come le tv (53%) o cuffie wireless (32%). Ben delineato è il profilo dell’utente medio di questi prodotti, e quindi persone fra 25 e 45 anni, benestanti, in molti casi con in tasca una laurea e dipendenti full time presso aziende medio grandi. Le applicazioni sono “basic”.

Ciò che emerge dall’indagine è in definitiva un quadro in cui si evidenzia grande curiosità per questa tecnologia, la certezza di ripeterne l’acquisto (lo conferma un terzo degli utenti), un livello di soddisfazione buono e la consapevolezza di una qualità dello strumento che può migliorare ulteriormente. «Oggi siamo su un crinale, pronti ad attraversare una frontiera: da una parte abbiamo i sistemi per la navigazione a menu con la voce, dall’altra la tecnologia in grado di soddisfare un bisogno. A fare da ponte fra questi due mondi ci sono strumenti, ormai consolidati e funzionanti, di text-to-speech e speech-to-text. La sfida da vincere è nota: arrivare a soluzioni con componenti di semantica integrata in grado di comprendere i comandi, contestualizzarli e interpretarne il significato per poter rispondere all’esigenza che esprimono». L’analisi di Vittorio Di Tomaso, presidente e Ceo di Celi, in sede di presentazione della ricerca, traccia una direzione ben precisa sui futuri sviluppi delle interazioni uomo-macchina attraverso la voce. Se le prime tracce di applicazione della tecnologia text-to-speech su un computer risalgono al 1984, con l’Apple Macintosh, l’accelerazione è arrivata in tempi più recenti, nel 2008, con i servizi di voice search sui device mobili, nel 2008 con Google, è proseguita con i comandi vocali di Siri per iPhone e iPad (nel 2011) per arrivare alle interazioni con gli apparecchi connessi introdotte nel 2014 da Amazon, con Alexa.

La verbalizzazione del pensiero rapresenta il prossimo traguardo. Lo scenario di riferimento per analizzare l’impatto potenziale dell’intelligenza artificiale applicata agli assistenti virtuali, secondo Di Tomaso, è rappresentato da tre universi: i due miliardi di smartphone oggi dotati di tecnologie vocali (di questi circa un miliardo hanno a bordo Google Assistant, e quindi tutta la galassia di terminali Android, e 800 milioni Siri), le auto connesse (l’automobile è, dopo il telefono, l’ambiente dove i consumatori usano più spesso interfacce vocali) e i circa 200 milioni di smart speaker installati nelle case di tutto il mondo. Se l’industria automotive è partita prima nel fare proprie queste tecnologie, è emblematico come – a detta del manager di Celi – le grandi aziende tech abbiano progressivamente accelerato per farne un punto di forza delle rispettive strategie di sviluppo.

«Language is the new interface», ebbe a dire nel 2016 il numero uno di Microsoft, Satya Nadella, una dichiarazione di intenti che si riflette nelle parole pronunciate dal noto futurista Ray Kurzweil in occasione della Ted Conference 2018, secondo cui il linguaggio naturale è il “Santo Graal” dell’intelligenza artificiale. Gli sforzi delle aziende che operano in questo settore convergono non a caso nel costruire sistemi di voice recognition che possano rendere l’interazione vocale riconoscibile e personalizzabile. L’orizzonte di questa tecnologia, come conferma Di Tomaso, è insomma quello di affidare alla macchina la verbalizzazione del pensiero, e per questo si tenderà a sviluppare e realizzare dispositivi in grado di equivalere in tutto e per tutto (o quasi) il comportamento del cervello umano.

A quando questo ulteriore strappo nel processo di rivoluzione segnato dall’AI? Non troppo lontano. Nel 2022, secondo le ultime predizioni della società di ricerca Idc, il 30% delle imprese di classe enterprise su scala mondiale utilizzerà tecnologie vocali conversazionali per attività di customer engagement. Ed è una percentuale destinata a crescere in maniera esponenziale.

Voice War
È in atto una “voice war”. A combatterla i due giganti del settore assistenti vocali, Amazon e Google, con le loro piattaforme Alexa e Google Assistant e i rispettivi device, Amazon Echo e Google Home. Il campo di battaglia sono le nostre case, ma presto si sposterà anche nelle automobili, nelle camere d’albergo, per strada: ovunque ci sia una copertura Wi-fi, in pratica. Amazon, che è la prima a essere scesa in campo (Echo è uscito nel novembre 2014), ha più di 10mila dipendenti dedicati allo sviluppo e al marketing di Alexa e a oggi ha venduto un numero stimato in 100 milioni di unità del proprio device. Google è leggermente in ritardo (la prima versione di Google Assistant è del maggio 2016), ma sta velocemente recuperando, anche forte del fatto di avere il software installato di default su ogni telefonino Android (circa un miliardo su tutto il pianeta).

Nel prossimo futuro, altri giocatori sono destinati ad aggiungersi alla partita. Di sicuro Samsung, che ha iniziato la sperimentazione con il proprio assistente virtuale “Bixby” nell’aprile 2017; probabilmente Baidu e Huawei (già attivi sul mercato domestico cinese), poi Microsoft (Cortana è operativo dall’aprile 2014). Oltre naturalmente all’incognita Apple, che potrebbe decidere di riportare in carreggiata Siri: la vera Cenerentola dei voice assistant, quella che pur avendo battuto tutti sul tempo – la prima release è del 2011 – non ha mai fatto il decisivo salto in avanti.

In questa fase la sfida è in gran parte tecnologica, ma riguarda anche il marketing: per Amazon e Google ogni ricorrenza sul calendario, vera (Natale) o creata ad hoc (Black Friday, Prime Day), è buona per ribassare i prezzi dei propri device, già normalmente venduti praticamente a prezzo di costo, e presidiare così un’altra stanza nelle nostre case. Senza risparmiarsi nemmeno l’occasionale gesto eclatante: a maggio, ad esempio, Google ha regalato un Google Mini a ciascuno dei 19.596 spettatori presenti all’Oracle Arena di Oakland, per la finale della Nba di basket.

Ma cosa rende questa guerra così importante? Il fatto che la somma di una serie di evoluzioni e perfezionamenti nel campo dell’intelligenza artificiale e del machine learning – dal “voice recognition” alla sintesi text-to-speech (testo scritto trasformato automaticamente in parlato) – hanno reso possibile una nuova interfaccia utente basata unicamente sulla voce, che a sua volta si è sviluppata diventando una nuova piattaforma. Questa piattaforma, con i suoi molti sviluppatori e i suoi (potenzialmente) moltissimi utenti, è la vera ragione della “voice war”. Lo scenario, se vogliamo, è simile a quello cui ci si è trovati di fronte negli anni ’90 con Internet e nei primi 2000 con gli smartphone. Con la sostanziale differenza che lì l’interazione era mediata dal click del mouse o dal touch del dito, mentre qui è una pura invocazione: quindi incredibilmente più naturale, immediata e ubiqua.

La voce è ubiqua come ubiqua è la copertura Wi-fi, ovvero tutto ciò che serve ai voice assistant per funzionare. E come saranno ubiqui, nel prossimo futuro, i punti di accesso: smart speaker in casa, in ufficio e in hotel, cellulari, cruscotto dell’auto, passando poi per tv, cuffiette intelligenti, consolle di gaming, elettrodomestici... Ma per vincere la “voice war” non basta dotarsi di un’interfaccia utente: bisogna “essere piattaforma”. Ovvero, aprirsi alla terze parti, integrare applicazioni (le skill di Alexa e le action di Google) prodotte da altri, che popolino il proprio universo. Questo punto spiega sia l’arretratezza di Siri (totalmente chiusa alle terze parti), sia il successo di Alexa, in cui Amazon ha visto anche l’occasione di poter instaurare, per la prima volta, un rapporto con i consumatori non mediato dai megarivali di sempre, Google, Facebook ed Apple. Per i quali, e in particolare per Google, la battaglia è invece tutta focalizzata sul non perdere la propria posizione dominante di controllo. In questo senso, è corretto dire che Amazon sta giocando in attacco, e Google in difesa. Un primo risultato, intanto, questa guerra l’ha già prodotto: a oggi, un terzo delle famiglie Usa ha un device/assistente vocale in casa.

C’è infine un altro aspetto che rende l’attuale scenario simile al web del 1995: il fatto che, lato utente, i voice assistant siano ancora un po’ nerd e “legnosi”, proprio come certi basici e ingenui siti internet delle origini. E, soprattutto, la constatazione che, al momento, “lì dentro” non ci sia molto da fare. Esaurito il repertorio delle interazioni base («Alexa, raccontami una barzelletta»), quello che rimane sono “repurpose” di altri media (ad esempio l‘audio del telegiornale) e tristi colate di text-to-speech grezzo e molto poco sexy. Siamo, insomma, di fronte a una nuova media platform dalle enormi potenzialità, che però al momento è semi-disabitata. Il che vuol dire che aspetta soltanto di essere riempita di contenuti adatti, specifici, attuali.

Bibliografia:
L’assistente darà Parola al pensiero, di Gianni Rusconi, da Il Sole 24 Ore di giovedì 1 Agosto 2019
La «guerra della voce» si gioca sulla piattaforma (da riempire), da Il Sole 24 Ore di giovedì 1 agosto 2019, di Mauro Del Rio

 

Multimac Srl  -   800 593 293  -   info@multimac.it  -   P.Iva 01281830289  -   Company info  -   Privacy  -   Sitemap  -   Copyright © 2019. All rights reserved.

Login

Per poter acquistare i prodotti sul nostro sito è necessario accedere con la propria email e password.

Accedi

Password dimenticata?
Non possiedi i dati di accesso? Registrati

Chiudi

Richiesta prezzo speciale
per progetto

» Leggi l'informativa sulla privacy Invia richiesta
Chiudi