Tesauri, concordanze e frequenze
Qualche tempo fa mi sono procurato un programmino gratuito per l’analisi lessicale: si tratta di un database Access che importa tutte le parole di un dato testo, o corpus, e ne calcola la frequenza. Volendo si possono poi unire i dati con quelli di altri testi a creare una sorta di tesauro personalizzato e compiere diverse operazioni di confronto. Nel complesso ai più può sembrare uno strumento piuttosto arido e rudimentale; infatti i calcoli rilevano il mero numero di parole, l’elenco e il numero delle forme lessicali, la loro ricorrenza. Non aiuta invece a valutare subito la ricchezza del vocabolario di un autore. In parte le osservazioni sono corrette; per di più questo tipo di analisi risente molto dell’approccio positivista di un’epoca che pensava che anche la letteratura si potesse ridurre a statistiche e combinazioni; esisteva addirittura una branca della critica che si definiva letteratura combinatoria. D’altra parte occorre tener presente che tutte le raccolte statistiche di per sé non dicono mai nulla, ma che acquistano significato solamente attraverso un’interpretazione ragionata dei dati. Tuttavia, giocando con il software in questione, possiamo scoprire che il corpus di Dante consiste di circa 280.000 parole, di cui 230.000 per l’opera italiana e 50.000 per quella latina; e che vi sono attestate circa 20.000 forme italiane e 12.000 latine. Già qui uno potrebbe fraintendere e pensare che, in proporzione, il latino di Dante fosse più ricco del suo italiano: forse, ma forme non significa vocaboli e chiunque lo abbia studiato sa che la flessione nominale latina ha fino a 8 forme contro le 2 dell’italiano; per non dire dei verbi o degli aggettivi. Ecco un piccolo esempio di quell’analisi ragionata di cui sopra. Ricordo che ai tempi dell’università tra alcuni docenti di italianistica andava di moda rifilare ai laureandi tesi del tipo: elenco delle frequenze e delle concordanze dell’opera di tal dei tali. Immagino i poveretti a cui potrebbe essere toccato mettersi sotto allo Zibaldone di Leopardi: oltre 993.000 parole, quasi quanto la Bibbia!