Un ambito dell’informatica umanistica in continua espansione è quello che utilizza strumenti computazionali per l’analisi – più o meno automatica – di testi o insiemi testuali, grazie anche alla disponibilità sempre maggiore di vasti database o biblioteche digitali che permettono di accedere a numerose opere letterarie libere da diritti d’autore (ad esempio, Biblioteca italiana, Project Gutenberg, Liber Liber). Fra le varie proposte per definire questo approccio, a inizio anni Duemila ha preso campo la dizione Distant Reading , coniata da Franco Moretti nell’ambito delle sue ricerche presso lo Stanford Literary Lab e apparsa per la prima volta in un suo saggio del 2000. Questa formula in realtà non nasce per identificare pratiche di analisi informatica dei testi letterari e tuttavia ne è diventata presto sinonimo (“Distant reading is the computational processing of textual information in digital form. It relies on automated procedures whose design involves strategic human decisions about what to search for, count, match, analyze, and then represent as outcomes in numeric or visual form”, Drucker 2017, 629). Moretti stesso, infatti, nel definire il Distant Reading come un approccio ermeneutico opposto al tradizionale Close Reading , sembra prescindere dall’aspetto computazionale: se il “close reading (in all of its incarnations, from the new criticism to deconstruction)” è, per limiti intrinseci, rivolto “on an extremely small canon” testuale, per focalizzare l’attenzione su un sistema letterario nella sua ampiezza sarà necessario sviluppare una nuova condizione di conoscenza fondata sul non leggere, ossia sul “distanziamento”. Si tratta quindi piuttosto di privilegiare una lettura “distanziata”, che consideri i testi come dei macro-insiemi da interrogare con tecniche statistico-informatiche. Tuttavia, per quanto suggestiva, questa nozione di lettura può apparire fuorviante, quando non riduttiva: “Processing is not reading. It is literal, automatic, and repetitive” (Drucker 2017, 630). Pertanto, si sono diffuse locuzioni altrettanto valide e più neutrali, come “computational criticism”, “digital criticism”, “algorithmic criticism”, “computer-aided text mining”, “computer-assisted text mining”.
Nonostante il ridimensionamento rispetto agli entusiasmi iniziali, resta indubbio che l’avvento degli strumenti informatici in ambito umanistico (come d’altronde per il resto della contemporaneità) abbia introdotto nuove possibilità di analisi da affiancare alle metodologie “tradizionali”. È quanto sostiene Matthew Jockers nel suo libro Macroanalysis, volontariamente abbandonando il termine “reading” in favore di un più neutrale “analysis”. I due approcci – micro e macro – non si escludono e anzi possono coesistere in modalità “blended”, che sfrutta le peculiarità di entrambi, coniugandoli. Ad esempio, rispetto alle questioni di storiografia letteraria o di stilistica, o nel valutare le reciproche influenze tra opere e tra letterature di differenti nazioni oppure la diffusione di un particolare tema letterario in un certo contesto o in un dato periodo temporale, “a macroanalytic approach has distinct advantages over the more traditional practice of studying literary periods and genres by means of a close study of ‘representative’ texts” (Jockers 2014, 28). Nella comunità degli studiosi non mancano contestazioni alla diffusione di queste nuove metodologie. Adam Hammond (2017) ne ha realizzato un esaustivo “catalogo”, soffermandosi su una delle più frequenti, ossia quella che evidenzia come l’impiego di queste tecniche non apporti significativi incrementi conoscitivi rispetto ai metodi tradizionali. Più di recente (2019), Nan Z. Da sulla rivista Critical Inquiry ha mosso svariate critiche a quelli che definisce computational literary studies , a sua volta rilevando come essi producano in genere risultati erronei o già noti, e concludendo che la complessità della letteratura non possa essere ridotta a semplici modelli distributivi di natura statistico-matematica. Lo studio di Da ha offerto l’occasione ad alcuni tra i massimi esperti del settore di tornare sui vantaggi di utilizzare anche queste tecniche senza che le peculiarità intrinseche alla letteratura siano messe a repentaglio. Ted Underwood, ad esempio, che poco prima dell’intervento di Da aveva dedicato un intero capitolo del libro Distant Horizons (2019a) ai “Risks of Distant Reading” (tra cui quello estetico, appunto, ossia la possibilità di perdere, studiando numeri, statistiche e corpora di migliaia di libri, la piacevolezza da sempre insita negli studi umanistici), ha sottolineato come le analisi quantitativo-statistiche non siano incompatibili con gli approcci consolidati:
[…] statistical reasoning is an extension of ordinary human activities like exploration and debate. Humanistic principles still apply here. Quantitative models can test theories, but they are also guided by theory, and they shouldn’t pretend to answer questions more precisely than our theories can frame them. (Underwood 2019b)
Tecniche e strumenti informatici e ad analisi quantitative in ambito letterario non sono immuni da criticità e devono essere utilizzati con criterio e cautela. Tuttavia, come ha scritto Johanna Drucker, “text analysis has value” (2017, 633), ma i risultati conseguiti devono essere interpretati e considerati non come produttori di senso autonomo quanto, semmai, come spunti, suggerimenti iniziali per esplorare nuove prospettive di lettura o per testare ipotesi anche mediante modelli matematici. Le risorse informatiche non sono “oracoli”, da sostituire allo spirito critico del lettore “umano”, ma
[…] are just that, tools, and their value is only as good as the models on which they are made, the protocols used to implement those models, and the qualifications that can be attached to the results. But these tools don’t read, except in the most mechanical sense. (Ibidem)
L’utilizzo di tool informatici per integrare le prassi di analisi testuale, così come si propongono nella nostra piattaforma, se inseriti nel giusto contesto, non può che essere ritenuto un valore aggiunto alle discipline umanistiche.