Attualità

Il cuore del 900

Uno studio ha mappato le emozioni nella letteratura dello scorso secolo. Le scoperte dei big data su cosa "provano" i libri degli ultimi cento anni.

di Davide Coppo

Se mi chiedessero di dire, su due piedi e senza perdere tempo a rimuginare, l’autore più rappresentativo della letteratura degli anni Venti, direi Ernest Hemingway, e avrei pochi dubbi. Probabilmente non sarei il solo, ma sbaglierei: innanzitutto nei confronti di Francis Scott Fitzgerald, in secondo luogo nei confronti di centinaia di autori e migliaia di libri più dimenticati di quelli di Hemingway ma non per questo meno rappresentativi. E poi, probabilmente, farei un torto agli anni Venti, pretendendo di tracciare la loro anima basandomi su due soli romanzi, Addio alle armiFiesta. Ma tutto succederebbe perché me l’avrebbero chiesto su due piedi. Tutto il contrario di questo, invece, sta in una ricerca condotta dall’antropologo Alberto Acerbi dell’Università di Bristol (co-autore R. Alexander Bentley) e pubblicata recentemente dal sito Plos One: lo studio si chiama The Expressions of Emotions in 20th Century Books e quello che fa è esattamente la ricerca di uno spettro emotivo approfondito della letteratura dell’ultimo secolo. Utilizzando i famosi big data. E il più grande archivio librario digitale disponibile, Google Ngram.

L’idea e la sua realizzazione non sono semplici, ed è per questo che ho chiesto aiuto ad Acerbi in persona per fare un po’ di chiarezza, e per risolvere qualche dubbio. Innanzitutto di cosa si tratta: si fa un passo indietro e si passa a un altro studio, molto simile, se vogliamo “genitore” del nostro, che si chiama Analysing Mood Patterns in the United Kingdom through Twitter Content ed è stato condotto da Vasileios Lampos (anche lui della University of Bristol). Qui, attraverso quattro macro-categorie espressione di determinati sentimenti (paura, tristezza, gioia e rabbia), ognuna delle quali racchiude dentro sé centinaia di parole collegate ed espressione dello stesso sentire, Lampos ha analizzato centoventi milioni di tweet in ventiquattro settimane, riuscendo a tracciare un “grafico umorale” di quei 168 giorni campione. «I dati presi da Twitter mostravano che l’utilizzo di termini che indicano emozioni correlava molto bene con eventi contemporanei, come i riots dell’agosto 2011 o i tagli alle spese di fine 2010, entrambi in Inghilterra» mi spiega Alberto Acerbi. Acerbi e il suo team hanno allargato il numero delle emozioni a sei aggiungendo le categorie del disgusto e della sorpresa. Ogni termine è un ombrello che racchiude una lista di parole a lui riconducibili: 146 quelle che connotano la rabbia; 92 per la paura; 115 per la tristezza; 224 per la gioia; 30 per il disgusto e 41 per la sorpresa. Banalmente (ma si fa per dire) il team ha “ricercato”, ovvero setacciato, questi riferimenti emotivi in 5,2 milioni di testi del ventesimo secolo, giungendo a conclusioni interessanti, tra cui la quasi convinzione di aver mappato lo Zeitgeist degli ultimi cento anni («anche se non mi è particolarmente caro l’utilizzo di termini come Zeitgeist», mi bacchetta Acerbi).

Quello che si scopre allora è che gli anni ’20, nonostante Caporetto e Addio alle armi e i contrasti di Belli e dannati e le tragiche morti e finzioni del Grande Gatsby è il decennio con il più alto indice di termini relazionati alla gioia – anni ruggenti, come non si registrarono più nemmeno lontanamente. E si scopre anche che sono gli anni Quaranta i più tristi, ossia quelli della deflagrazione europea più violenta della Seconda Guerra Mondiale. E si rimane un po’ sorpresi nel constatare che la reazione emotiva nei confronti della Grande Guerra è molto poco sensibile se confrontata a quella del conflitto mondiale successivo. Poi gli anni Sessanta, la ripresa anche umorale, e il declino nel baratro di tristezza, vicino ma non equivalente a quello dei Quaranta, in piena Guerra Fredda dei Settanta e Ottanta. Un altro grafico mostra l’indice generale della frequenza delle emozioni, che sull’asse temporale delle ascisse x scende sempre di più e si inabissa nella seconda metà del secolo, a testimoniare che la letteratura ha prodotto sempre meno emozioni, o forse sempre meno le ha esplicitate, apparentemente in accordo alla formula dello “show, don’t tell”.

Ma qui non si parla di letteratura intesa unicamente come fiction: il team di Acerbi ha consultato un archivio enorme di testi (testi punto), non di testi soltanto romanzeschi. Questo vuol dire che nei cinque milioni (e più) di testi analizzati e setacciati ci sono manuali di giardinaggio, guide per apprendisti meccanici, saggi sul cosmo, libri di ricette, trattati filologici e trattati filosofici, e così via, e così via, con tutte quante le categorizzazioni letterarie mai inventate per uno scritto. (E sono tutti in lingua inglese.) Questo significa che lo “show, don’t tell” non è un principio sufficiente a spiegare il crollo dell’utilizzo di termini “emotivi” – sarà difficile trovare un libro di giardinaggio o di fai-da-te scritto con l’intento preciso di rimanere fedele a certi principi romanzeschi. E significa anche, o forse a me piace pensare così, che ci siano tracce di emozione (paura, sorpresa, gioia, tristezza), più o meno nascosta, più o meno volontaria, anche in una guida su come trapiantare le piante in primavera. E non è nemmeno così improbabile.

Quello che mi incuriosiva di più era il rapporto tra i numeri e la letteratura. L’ho chiesto ad Alberto Acerbi, se pensa che dietro una sequenza letteraria ci siano sempre dei numeri, come accade con le sinfonie, e se sia stato (anche) questo lo scopo della ricerca. «A un livello molto astratto penso che sì, tutto possa essere quantificato» mi ha risposto. «Il problema è che per fornire una spiegazione “completa” in termini quantitativi della letteratura bisognerebbe includere modelli completi delle neuroscienze, dell’evoluzione, eccetera, e non credo abbia molto senso ridurre (qualsiasi cosa questo voglia dire) la letteratura a dei numeri. Il mio punto è un altro: la lettura di Borges, o di Céline, o di Marx, non verrà mai sostituita da un’analisi quantitativa. Il problema è che pochi di noi possono aspirare a essere Borges o Céline o Marx: la scienza adotta delle pratiche (la quantificazione è forse la più importante) per cui è possibile almeno per tutti – almeno in linea di principio – valutare e ripetere i risultati e questo è ciò che le scienze umane avrebbero bisogno. Un altro problema delle scienze umane che l’uso di matematica e big-data potrebbe risolvere è il fatto che spesso si discuta senza sosta di cosa abbia detto “davvero” Marx, ad esempio: con dati ed esperimenti è un po’ più facile capire quando si sbaglia e cosa fare di diverso».

Riguardo ai dubbi, ho provato a instillarne tre ad Alberto: i) i risultati che includono manuali di meccanica e saggi sulla coltivazione dei kiwi non alterano lo spettro emotivo del secolo? ii) cinque milioni di testi non sono un campione ridotto, e quindi meramente statistico con tutti i rischi di fallacia che la statistica si porta dietro? iii) e se le parole utilizzate siano “sbagliate”? La fiducia nei big data risponde a tutte e tre le mie domande e schiaccia in un secondo i miei dubbi. «Aumentare i dati non cambia molto: stiamo facendo le stesse analisi con la seconda versione del corpus di Google Books, che contiene il doppio dei testi, e i risultati sono identici» dice Alberto, «e se si utilizzano altre “liste” di parole con contenuto emotivo i risultati non cambiano molto, al momento stiamo lavorando anche su questo». Per quanto riguarda la differenzazione tra letteratura romanzesca e “tutto il resto”, anche questa volta l’esperimento all’interno dell’esperimento è già stato condotto. Il risultato? Ancora: cambia poco, e soprattutto le emozioni non“crescono”: «Questo era il risultato più critico rispetto alla distinzione letteratura/non-letteratura perché avrebbe potuto essere dovuto semplicemente all’aumento della percentuale di libri “tecnici” nel corpus nel corso degli anni». E invece.

In realtà una crescita-nella-decrescita c’è, ovvero esiste un termine dei sei che dagli anni Ottanta è tornato a “salire”, ossia la sua frequenza è aumentata, e continua ad aumentare negli anni Zero fino quasi a raggiungere il livello degli anni Quaranta: paura. Sono stati trent’anni di paura, dopo due guerre mondiali e dopo le bombe atomiche e la decolonizzazione e le battaglie per i diritti civili e la fine delle discriminazioni? Questo è quello che comunica la carta, che non è necessariamente la giusta cartina tornasole dell’umanità. Probabilmente, mi sono detto, l’esplosione del consumo mediatico (Internet, televisione) ha agito da benzina sul fuoco della paura. «Ma non darei troppa importanza a questo risultato» mi dice Alberto Acerbi, «anche se capisco che sia molto appetibile. Anzi nelle nuove analisi che stiamo facendo con la versione aggiornata del corpus di testi il trend positivo è ancora più marcato e l’emozione che ha dato il risultato più positivo è anger, rabbia, e mi rendo conto sia ancora più appetibile come argomento». Certo, la Generazione X, mi dico, e poi Palahniuk, e poi, e poi, forse, è in realtà solo colpa di qualche manuale per il giardinaggio. In attesa che i big data spieghino l’anima del mondo.

 

Nell’immagine, un dettaglio della copertina di Cattedrale di Raymond Carver nell’edizione Vintage Books