Il progetto

Il progetto Macchine per leggere, nato dalla collaborazione tra il Dipartimento di Studi letterari, filosofici e di storia dell'arte dell’Università di Tor Vergata e Il Centro per il Libro e la Lettura del Ministero della Cultura, mira a stimolare l’interesse dei giovani studenti per metodologie di lettura “alternativa”, applicandole ad alcuni tra i classici della letteratura italiana. Le recenti tecniche informatiche di analisi dei corpora consentono infatti di affiancare alle consolidate prassi di lettura – close reading – nuove possibilità di interazione con le basi di dati costituite dai testi letterari. Il distant reading, come il termine suggerisce, permette di approcciarsi alla lettura con uno sguardo ad ampio spettro e di individuare, laddove possibile, nuove prospettive di lettura e di interpretazione.

Ognuno dei dieci romanzi qui proposti è corredato dai risultati di alcune analisi digitali compiute sull'intero corpus testuale e sui singoli capitoli. Per ogni testo si è utilizzata una rosa di tecniche che va dalle semplici rilevazioni statistiche (come indici di frequenza di parole o sintagmi) ad analisi più complesse eseguite con algoritmi di text analysis.
I testi completi dei libri sono presentati in forma di plain text e riformattati secondo il paradigma Bionic Reading sviluppato da Renato Casutt, che utilizza una combinazione di caratteri in grassetto e caratteri in tondo per facilitare la lettura.

Tutti i libri proposti e analizzati nell’ambito del progetto Macchine per leggere sono opere fuori diritti. Le digitalizzazioni provengono dal database di  Liber Liber .

Le analisi digitali sono state eseguite utilizzando le seguenti librerie software e algoritmi:

  • Indici di frequenza e analisi delle concordanze: Voyant Tools , suite per l’analisi dei testi progettata da Stéfan Sinclair e Geoffrey Rockwell (traduzione italiana a cura di Fabio Ciotti e di un gruppo di lavoro dell’Associazione per l’Informatica Umanistica e la Cultura Digitale).
  • Analisi dei topic: BERTopic , implementazione per il topic modeling del framework Google BERT sviluppata da Maarten Grootendorst.
  • Sentiment e  plot analysis Syuzhet , libreria R per la sentiment analysis finalizzata all’estrazione dei plot di opere letterarie sviluppata da Matthew L. Jockers.
  • Network analysis: l’algoritmo proposto da Milan Jasonov e ripreso dall’analista digitale Thu Vu che combina due librerie Python: Spacy per la Named Entity Recognition e NetworkX per l’elaborazione del grafico a nodi.