Roberto Busa - Il prete e le schede Perforate
L’informatica umanistica e la linguistica computazionale devono la loro nascita a padre Roberto Busa, gesuita e studioso di San Tommaso D’Aquino, docente all’università Gregoriana e poi all’Aloisianum di Gallarate, fu il primo a definire e poi adottare le metodologie ipertestuali, questo negli anni cinquanta, almeno quindici anni prima che nascessero ufficialmente (il termine Hipertext è stato coniato da Ted Nelson nel 1965), e che si diffondessero con il World Wide Web (il primo sito è stato aperto nel 1991 da Tim Berners-Lee).
Steven E. Jones, professore di inglese alla Loyola University di Chicago ce ne racconta l’avventura nel volume: “Roberto Busa, S.J. and the emergence of humanities computing – the priest and the punched cards” edizioni Routledge N.Y. 2016.
Roberto Busa nasce a Belluno nel 1913, entra nella compagnia di Gesù e si dedica agli studi linguistici, all’università Gregoriana gli viene affidato il compito di occuparsi dei testi di San Tommaso D’Aquino, il suo primo lavoro sarà studiare la dottrina della “presenza”, che egli ritiene sia espressa in particolare dalla particella “in”. Busa ricaverà a mano l’elenco di 10.000 concordanze di quella parola sulle 11 milioni di parole di cui è composto il corpus tomista.
Poi si dovrà fermare, rendendosi conto dell’impossibilità di continuare in questo modo, e maturerà la convinzione della necessità di utilizzare un trattamento automatico delle informazioni per questo tipo di ricerche. Prende forma velocemente anche l’idea di costruire un Index Thomisticus, un indice di tutte le parole del corpus tomistico con le loro concordanze.
La storia comincia nel 1949, Padre Busa è insegnate di Metafisica al collegio di studi filosofici Aloisianum di Gallarate, cerca in tutti i modi di mettere in pratica la sua intuizione coinvolgendo alcuni industriali locali per il supporto economico e le infrastrutture necessarie.
Il primo passo è quello di sondare lo stato della tecnologia nel paese più avanzato, riesce a farsi finanziare un viaggio di quattro mesi in Canada e negli Stati Uniti durante i quali stabilisce relazioni con i centri tomistici americani, ma soprattutto esamina diverse macchine e metodi industriali che avrebbero potuto essere utili per i suoi fini, ad esempio nelle sue lettere cita un sistema di catalogazione e di ricerca basato sui microfilm visto in Canada.
La ricerca si concluderà finalmente quando con l’interessamento del cardinale Pellman di New York, influente e conservatore, viene ricevuto da Thomas J. Watson, fondatore dell’IBM.
Il colloquio tra i due raccontato da padre Busa è diventato una leggenda:
“Sapevo, il giorno in cui incontrai Thomas J. Watson Sr., che aveva sulla sua scrivania un report che diceva che le macchine dell’IBM non avrebbero mai potuto fare quello che chiedevo.
Nella sala d’attesa ho visto un piccolo poster con le parole: “le cose difficili le facciamo subito, per quelle impossibili abbiamo bisogno di un po’ di tempo in più”, l’IBM ha sempre amato gli slogan.
L’ho preso e portato con me, quando sedevo di fronte a lui percependo la tremenda forza della sua mente, l’ispirazione mi fece dire: ‘Non è giusto dire no prima di aver provato’, ho tirato fuori il poster e gli ho mostrato il suo stesso slogan. Egli allora assicurò che l’IBM avrebbe collaborato finché il progetto non fosse completato, e ironicamente mi disse: ‘spero che non cambi il logo IBM in International Busa Machines’.
Io l’ho informato che i miei superiori mi hanno dato tanto tempo e incoraggiamento, le loro preghiere, benedizioni e molta acqua santa, ma sfortunatamente niente soldi, io avrei potuto ricompensare l’IBM in molti modi tranne che in quelli finanziari”.
Roberto Busa
L’IBM da allora fornirà fondi e assistenza tecnica, un loro ingegnere, Paul Tasman lavorerà con Padre Busa fino alla morte.
La grande difficoltà dell’opera consistette nel fatto che tutti gli scritti di Tommaso D’Aquino dovettero essere trascritti sulle schede perforate con dei codici di marcatura, che consentissero poi di elaborare i testi analizzandoli statisticamente per capitoli, per capoversi fino ad arrivare al trattamento delle singole parole.
Si calcola che siano servite 18 milioni di ore di lavoro distribuite in trent’anni, il lavoro verrà infatti concluso nel 1980, con la stampa dei 56 volumi dell’index Thomisticus completo.
Si dovettero poi scrivere i programmi di analisi statistica, e quindi sapere esattamente e dettagliatamente cosa si volesse ottenere e fare statistica, in pratica significava inventare una nuova disciplina.
Il senso di questo lavoro sui testi dell’aquinate fu quello di voler costruire, ad uso degli studiosi, una base di informazioni completa e articolata sulla quale lavorare.
L’analisi computazionale di un testo oggi è di aiuto nel valutare la coerenza interna di quanto scrive l’autore esplorandone il linguaggio, attraverso l’analisi della distribuzione delle parole utilizzate e la loro variazione semantica ed altri parametri oggettivamente misurabili.
Questa disciplina viene utilizzata anche per studiare l’uso attuale che si fa di una lingua, analizzando statisticamente corpora costituiti da siti web, riviste di vario tipo, giornali e libri individuati in modo da costituire un campione rappresentativo.
Padre Busa non era un ingenuo, ma come tradizione dei gesuiti, operava nel mondo con una conoscenza dei meccanismi anche economici che lo regolano, scrive in un articolo sull’almanacco letterario Bompiani del 1962:
“Lo sviluppo delle tecniche di comunicazione e di organizzazione consente un superiore sviluppo alle aziende che sono in grado di operare worldwide. D’altronde è in rapida crescita la reciproca influenza fra i mercati, e tra politica e mercato. Con questo sviluppo è diventato indispensabile per un manager considerare un grande numero di particolari e velocemente sintetizzarli, e nello stesso tempo essere in grado di modificare una grande massa di piccoli e diffusi fenomeni periferici. I calcolatori rispondono a questa necessità e forniscono all’economia la necessaria capacità di calcolo industriale e commerciale”
In effetti questa collaborazione serviva anche all’IBM come “pubblicità” per inserirsi nei settori intellettuali e di ricerca, per tentare di esportare il business in Europa, nelle istituzioni scientifiche e nelle aziende a elevato contenuto tecnologico.
Padre Busa è stato molto attivo nel mettere in comunicazione le tecnologie americane con le industrie italiane. A lui si deve anche l’idea di una rete di centri di elaborazione dedicati alla linguistica computazionale dislocati in varie parti del mondo e interconnessi tra di loro.
Nasce così il primo centro di elaborazione a Gallarate nel 1956, il CAAL il centro per l’automazione dell’analisi letteraria, che subito comincerà la collaborazione con il centro EURATOM di Ispra (che per l’occasione acquistò macchine IBM) e con il centro IBM-Georgetown nel Tennesee.
Il centro affronterà anche altre problematiche, come quelle legate ai primi tentativi di traduzioni automatiche, basati su una codifica dei meccanismi del linguaggio, con dei risultati però molto limitati e insoddisfacenti. Queste analisi avevano anche una valenza politica legata alla guerra fredda, nel centro di Gallarate la lingua più studiata per la traduzione automatica era appunto il russo, come frutto di un “agreement” con ambienti governativi americani, che consentì il finanziamento di quelle ricerche sia a Gallarate che all’EURATOM di Ispra.
Il cuore dell’attività era un grande salone dove lavoravano le “perforatrici meccanografiche”, nella quasi totalità erano donne, la cui professione aveva lo stesso nome della macchina che utilizzavano.
La perforatrice meccanografica è un dispositivo assimilabile a una grossa macchina da scrivere che perfora, seguendo un codice, il testo digitato sulle schede, 80 caratteri per ogni scheda.
Io ho cominciato a lavorare nel campo dell’informatica nei primi anni ottanta, al centro di elaborazione dati della SIP, proprio quando la perforatrice stava per essere sostituita dal terminale.
Con i terminali il testo poteva essere inserito nella memoria del computer direttamente, senza passare per la produzione di schede perforate, non serviva più nemmeno il lettore di schede, perché il testo introdotto col terminale veniva letto da un software, l’Internal reader, che simulava il lettore.
Verso la fine degli anni ottanta queste ragazze non servirono più, e vennero assegnate ad altre attività, oggi sarebbero state semplicemente licenziate, come avviene per gli operatori di call center. Ma per anni le scuole professionali hanno continuato a proporre corsi di perforazione meccanografica anche se ormai non aveva più senso.
L’Index Thomisticus è stato concluso nel 1980, dalle schede perforate è stato successivamente trasferito sui nastri magnetici, quindi sui CD Rom e da ultimo in rete. Avendo concluso il lavoro per cui è nato, il CAAL è stato chiuso, dalle sue ceneri è risorta l’associazione CAEL (Computerizzazione analisi ermeneutiche e lessicologiche) che ne continua la tradizione.
Roberto Busa è morto nel 2011 e riposa nel cimitero di Crenna, frazione di Gallarate.
Di seguito il link al sito dell’Index Thomisticus:
http://www.corpusthomisticum.org/it/index.age
Segnalo poi uno strumento per l’analisi computazionale dei testi,
Iramuteq, è un software gratuito, in francese, ma analizza corpus di diverse lingue, tra le quali l’italiano, è molto facile “marcare” un testo, io l’ho usato per cercare di analizzare la Divina Commedia.
http://www.iramuteq.org/
La lettura di questo articolo è riservata agli abbonati
ABBONATI SUBITO!
Hai già un abbonamento?
clicca qui per effettuare il login.
Sostienici
Lascia il tuo commento