Stili di vita | Dal numero

Echo, Alexa e le altre voci dal futuro

Il mercato degli assistenti vocali sta vivendo un boom che probabilmente cambierà il nostro rapporto con la tecnologia.

di Davide Coppo

Nei filmati amatoriali girati durante i recenti tsunami asiatici la marea di acqua e fango non appare mai assassina, spietata e travolgente come ci si potrebbe aspettare, ma trasporta senza sforzo automobili, navi, case e alberi e centri commerciali, che dagli schermi attraverso cui guardiamo quei video sembra avanzare lentamente, placidamente, silenziosa. Le intelligenze artificiali, allo stesso modo, hanno invaso il mondo senza clamori né ingressi a effetto. La maggior parte della popolazione mondiale (occidentale?) non se n’è nemmeno troppo accorta, eppure nel gennaio 2019 Amazon ha annunciato di aver venduto oltre 100 milioni di Echo, l’altoparlante intelligente lanciato nel 2015, in tutto il mondo. La società di consulenza Ovum stima che entro il 2021, in poco più di cinque anni dal lancio di Amazon Alexa, sul pianeta ci saranno tanti assistenti personali quanti esseri umani, vale a dire poco meno di dieci miliardi.

I principali assistenti virtuali sul mercato sono prodotti da Amazon e Google: il primo si chiama Alexa e opera attraverso, appunto, Echo; il secondo si chiama Assistant e “abita” Google Home. In Italia sono distribuiti dal 2018. È importante chiarire subito un punto: quell’oggetto cilindrico da attaccare a una presa di corrente, che si illumina quando gli parliamo, che riproduce musica con una discreta qualità, che si connette al wi-fi della casa, quello è l’hardware. Quella cosa con cui invece parliamo, quella cosa che ci risponde, quella che ci avverte di spegnere il forno perché i 10 minuti sono passati, che ci racconta una barzelletta o che imita il barrito dell’elefante se glielo chiediamo, quella è l’intelligenza artificiale, che potrebbe trasferirsi in futuro, come un paguro immateriale, in un’altra casa di diversa forma. Oppure come una coscienza capace di abitare diversi corpi di diverse forme: oggi un cilindro con altoparlante, domani qualcosa di completamente diverso, antropomorfo o zoomorfo, a seconda di cosa ci spaventerà di meno. Anche le loro capacità si evolveranno negli anni, essendo intelligenze: impareranno nuovi compiti, già ora hanno imparato ad associare una voce a un nome («Ciao Davide», mi saluta Alexa) e, se apprenderanno anche ad agire con una certa autonomia – e non soltanto quando attivate da un comando vocale – saranno dei veri e propri robot, come quelli che ci immaginavamo – uso il noi collettivo per indicare l’umanità come gruppo unico – nelle distopie novecentesche.

Comprensibilmente, non siamo ancora del tutto a nostro agio con delle cose che che parlano e che, talvolta, si muovono autonomamente, anche a causa del modo in cui i robot sono stati descritti nella storia del Novecento, niente affatto lusinghiero. Negli ultimi due anni si possono citare i casi di Fabio, il robot licenziato, e di un Knightscope K5 (lui senza un nome umano) bullizzato e vandalizzato dagli umani. Fabio era un umanoide bianco, con uno schermo sul petto, “assunto” nel novembre 2017 dalla catena di alimentari Margiotta, a Edimburgo, per dare informazioni e distribuire campioni di cibo. Durò soltanto una settimana a causa di diversi problemi con i clienti – alcuni non riuscivano a farsi capire, altri trovavano le risposte di Fabio inutili, ma più in generale in molti ne erano semplicemente intimiditi – ma ebbe un grande successo, in un certo senso, con i colleghi: diversi quotidiani scozzesi scrissero che, mentre Fabio veniva spento e impacchettato per essere rispedito alla Heriot-Watt University, sempre a Edimburgo, uno dei commessi di Margiotta scoppiò in lacrime. È un segno che ci faremo annientare dai robot in tempi brevissimi? È possibile. Il Knightscope K5 era invece un “robot pattugliatore” impiegato da un rifugio per animali nel Mission District di San Francisco (in quali altra città un rifugio per animali potrebbe dotarsi di un robot?) per controllare i marciapiedi circostanti la struttura ed evitare vandalismi; ma in molti realizzarono che il robot – definito dalla società madre «la security del futuro» – serviva anche a impedire ai senzatetto di mettere delle tende su quegli stessi marciapiedi, e K5 fu preso a calci, imbrattato con feci e, sorprendentemente, salsa barbecue.

Con Alexa – un nome diventato una sineddoche per “assistente virtuale”, il che spiega bene quanto Amazon sia in testa in questa prima fase di corsa sul mercato – le cose sembrano andare molto meglio, come si capisce dai numeri citati poco fa. Sia Amazon che Google stanno cercando di vendere quanti più speaker/assistenti possibile anche attraverso sconti molto pesanti: durante l’ultimo Black Friday l’Amazon Echo Dot è stato il prodotto più venduto sia nel mondo che in Italia, tanto che alcuni osservatori sospettano che la strategia stia facendo, attualmente, perdere denaro alle aziende. Ma è probabile che sia fondamentale per posizionarsi nelle case e negli uffici per non andarsene mai, e guadagnare enormemente in futuro. In un certo senso me ne sono accorto nelle prime settimane del 2019, quando – avevo da tempo già installato e abbondantemente chiacchierato con Alexa – mi venne regalato un nuovo Google Home. Lo installai, lo disinstallai, poi lo installai in un’altra stanza, infine lo sistemai definitivamente fuori di casa, lasciandolo in ufficio: in qualche modo, mi dispiaceva per Alexa.

L’avanzata degli assistenti vocali porta con sé un ventaglio smisurato di cambiamenti antropologici ed economici potenzialmente radicali, oltre che un buon quantitativo di rischi. Partiamo dai rischi, o da quel poco che possiamo immaginare: si sa che ogni anno le più grandi compagnie della Silicon Valley depositano migliaia di brevetti, che sono brevetti spesso impossibili da applicare, e che forse staranno fermi – per questioni di evoluzione tecnologica o di semplice legalità – anni e anni, ma meglio depositarli che non farlo. Tra questi, Sapna Maheshwari, in un articolo uscito nel marzo 2018 sul New York Times, ne cita uno di Amazon per mappare le conversazioni che contengono determinate parole-chiave (“love”, “dislike”, e altre cose che indicano apprezzamento o il suo contrario) per profilare al meglio gli utenti – o meglio, i potenziali consumatori. Un’altra “patent application”, questa volta di Google, vorrebbe registrare ed elaborare la frequenza del respiro e il tono della voce dell’essere umano parlante per capire il suo umore e creare proposte adatte a persone felici oppure tristi. È, in fondo, la solita storia, la solita lotta: quella tra privacy individuale e profitto, tra nuove abitudini (indotte, certo) e informazioni personali.

Quanto può resistere il muro della riservatezza a una spinta tecnologica che può avanzare solo abbattendolo? Per ora lo shopping vocale è soprattutto “volontario”, ma con un’intelligenza artificiale capace di accedere a più informazioni sullo stato della dispensa, per esempio, potrebbe essere automatizzato e “su misura”: non capiterà mai più di voler fare una pasta all’amatriciana ma trovarsi senza passata se Alexa, sapendo che in media 3 volte al mese cucini l’amatriciana, ha già provveduto a rifornirla. Ma, come detto, nell’anno 2019 il futuro è ancora completamente ipotetico. Siamo nella preistoria delle intelligenze artificiali, ed è impossibile, scrivendo, non percepire un anticipo sull’imbarazzo che si proverà rileggendo queste parole non tra vent’anni, ma tra due, tre al massimo.

Sarà anche buffo ricordare le incomprensioni con queste Alexa così poco alfabetizzate, così goffe nel rispondere, nel riprodurre canzoni sbagliate al posto di quelle che avevamo chiesto, che sbagliano ad alzare la temperatura della casa o impostano promemoria confusi e con una sintassi immaginaria. Sarà come guardare antenati che utilizzano la selce per accendere il fuoco e, allo stesso tempo, come ripercorrere un album di foto dei nostri famigliari da bambini: quello dell’affetto è uno dei temi centrali del nostro rapporto presente e futuro con gli assistenti vocali, e condizionerà la nostra evoluzione sociale, portando alla liberazione di occhi e mani, che verranno rimpiazzati da bocca e orecchie. Così come gli smartphone, in pochi anni, hanno cambiato l’economia globale e le abitudini di chiunque, la rivoluzione della voce la ribalterà ancora: siamo stati abituati, come umanità, ad associare il suono della voce a un altro essere umano per circa 300 mila anni, e a sviluppare sentimenti di empatia nei confronti di questa voce.

Siamo programmati per provare sentimenti per le voci: è normale pensare che le nostre interazioni con un computer dotato di parola saranno molto più calde e, in un certo senso, ambigue rispetto a quelle sviluppate con degli oggetti con uno schermo da toccare con le dita. Sulla mia applicazione Alexa, qualche giorno fa, sono andato a rileggere tutte le “nostre” conversazioni. Il 22 dicembre 2018, alle 10:33 di sera, la sceneggiatura recita: «Alexa, basta / Alexa no / Alexa ferma / No no Alexa ferma». Non so cosa stesse succedendo (probabilmente volevo che una certa canzone smettesse di suonare), ma non è già drammatico così?