|
|
cultura
Perché la memoria resti dobbiamo farne tante copie
Roberto Vacca-Telèma 4 - 1996
Gli strumenti di registrazione elettronica invecchiano molto rapidamente e il loro degrado ci espone al rischio di "dimenticare" tutto ciò che nel corso degli anni abbiamo tentato di conservare. Sarà quindi necessario usare diversi mezzi di duplicazione: nastri magnetici, dischi rigidi, e l'intramontabile carta.
Secondo Bertrand Russell acquistiamo conoscenza in due modi: per esperienza o per descrizione. Abbiamo appreso la massima parte delle cose che sappiamo nel secondo modo. Anche ogni scienziato, per usare le parole di Newton, è un nano che cammina sulle spalle dei giganti che lo hanno preceduto. Sa tante cose di cui pure non ha avuto conoscenza diretta. Le descrizioni possono essere qualitative (verbali) o quantitative (numeriche, derivanti da misure o da calcoli). L'insight (cioè la comprensione profonda di un fenomeno, di un processo, di una situazione) partecipa di qualitativo e quantitativo, e persone diverse possono raggiungerlo in modi molto variati.
1. Imperfezione delle misure e dei dati.
Le conoscenze quantitative, sia che derivino da misure sia da calcoli, sono affette da errori. Lo sanno bene i fisici che cercano di valutare tali errori e hanno trovato modi astuti per determinare come e quanto si propaghino man mano che elaboriamo certi dati di partenza. Anche i modelli matematici basati sulle teorie fisico-matematiche più affermate e sicure sono solo approssimazioni della realtà più o meno rozze.
Ricordiamo, infatti, che le costanti fisiche meglio note sono determinate al massimo con 9 cifre decimali sicure. Gli ingegneri e gli operatori economici nella maggioranza delle applicazioni sono ben contenti quando riescono ad avere due o tre cifre sicure. Quando registriamo e usiamo dati (comunque prodotti) dobbiamo sempre ritenere che siano affetti da un certo rumore. Analogamente a quanto accade quando trasmettiamo segnali (telefonici e audio in genere, radio, televisivi), i valori originali vengono disturbati da fonti esterne. Non conosciamo l'entità dei disturbi (del rumore) e dobbiamo cercare di arguirla e renderla minima.
Il problema della qualità dei dati è vitale. Normalmente è riconosciuto e ne sono curate adeguatamente le soluzioni in ambiti tecnici oltre che scientifici. Invece è più spesso trascurato quando si tratta di rilevazioni socio-economiche, demoscopiche o industriali. Queste sono rilevanti per definire strategie aziendali e di governo oltre che per fornire agli storici le conoscenze necessarie. In parecchi casi le strategie si rivelano inadeguate e la storia mente proprio perché i dati sono inaffidabili: affetti da errori e imprecisioni, rilevati con metodologie non appropriate o semplicemente inventati. Vilfredo Pareto nella Sociologia Generale ha esemplificato ampiamente la credibilità scarsa e, in qualche caso, addirittura nulla del paradigmatico testimone contemporaneo che non abbia interesse personale negli eventi sui quali riferisce.
D'altra parte non possiamo rieseguire tutte le misure o i rilevamenti statistici da cui derivano i numeri elencati negli annuari, nelle pubblicazioni specializzate o in atti ufficiali. La qualità dei dati si può controllare ricorrendo a fonti alternative o (quando possibile) a misure dirette per un campione limitato e significativo dell'universo considerato.
Come sa bene chi ha lavorato a studi socio-tecnico-economici, la rilevazione di dati mancanti ha costi alti. Infatti occorre impiegare molti operatori che li rilevino sul campo. Spesso i dati mancanti non sono disponibili in alcun luogo perché non sono stati generati o non sono stati registrati a tempo debito o sono andati persi. Alcuni, allora, tentano di ricostruirli mediante sondaggi che spesso hanno qualità bassa: si intervistano incompetenti che non conoscono i dati veri e li immaginano in modi selvaggi. I risultati del sondaggio vengono, poi, presentati in forma numerica e vengono sottoposti a complicate analisi statistiche. Così assumono l'aspetto e la "credibilità" di misure rigorose eseguite secondo tecniche provate, mentre sono soltanto raccolte di impressioni soggettive molto spesso viziate da pesanti interventi del committente.
3. Impatto delle reti telematiche.
L'uso di reti telematiche permette di raccogliere dati generati in luoghi lontani o di sondare opinioni a distanza a costi bassi. Però, migliora la qualità dei dati disponibili solo in quanto permette di aumentare e completare a basso costo l'universo delle informazioni registrate. Le reti, poi, ci portano moli crescenti e smisurate di dati: dobbiamo preparare e usare strumenti critici per filtrarne il flusso eliminando gli input inaffidabili o irrilevanti.
L'uso efficace delle reti telematiche non dipende tanto dalla velocità e facilità con cui si accede ai dati esistenti, ma dalla base culturale dei ricercatori. Questa migliora lentamente, anche se proprio l'interattività delle reti potrebbe contribuire a tale miglioramento chiudendo un ciclo di feedback positivo. Si possono anche usare tecniche matematiche mediante le quali si cerca di individuare quali siano i dati meno plausibili. Quando i controlli denunciano una bassa qualità dei dati, talora è possibile correggerli. Spesso però dati mancanti, anche essenziali, non possono più essere ricostruiti. Questo accade quando vengano effettuate registrazioni molto aggregate. La disaggregazione geografica, temporale o suddivisa per categorie non è più fattibile a posteriori. Quindi può essere consigliabile registrare anche dati disaggregati che attualmente non sapremmo nemmeno utilizzare. Infatti in avvenire potranno essere elaborate procedure più sofisticate ed efficienti utilizzabili, però, solo se i dati sono adeguati. Un'altra raccomandazione particolare: quando si tratta di dati numerici è importante conservarli nella forma grezza originaria (raw data) e non trasformarli, come spesso viene fatto avventatamente, con elaborazioni grafiche o algoritmiche da cui non sia più possibile tornare indietro per ricostruirli.
Le serie storiche di dati (purtroppo molto brevi nell'Annuario Statistico Italiano dell'Istat, estese invece a uno, due o più decenni nello Statistical Abstract of the United States, pubblicato dal Bureau of the Census of the U.S. Department of Commerce) servono, oltre che a istituire bilanci e confronti, anche a fare previsioni. Ovviamente queste sono errate se i dati su cui si basano sono troppo distanti dalla realtà. Riferiamoci a una semplice estrapolazione lineare di una serie di valori di una certa grandezza. Se le ordinate sono affette da errori anche di pochi percento, in un senso o nell'altro, per rappresentare i valori futuri della grandezza nell'ipotesi semplicissima di continuazione delle tendenze passate, siamo costretti a generare un ventaglio di rette e l'incertezza cresce. Quando riteniamo che i processi da descrivere obbediscano a formule più complesse di quella lineare, gli errori da cui le misure sono affette generano incertezze e divergenze ben maggiori.
4. Misure, imprecisioni, errori.
Certo non tutto si può misurare o quantificare. Molte cose importanti per noi sono ardue, se non impossibili, da misurare (ad esempio la nostra felicità). Però bisogna evitare di inventare grandezze non osservabili né misurabili cui si attribuiscono valori percentuali proporzionali a loro presunti effetti. Come diceva Guglielmo da Occam, con essenziale chiarezza: «entia non sunt multiplicanda praeter necessitatem».
Anche molti fattori e aspetti fondamentali della vita associata sono ardui da quantificare, ma non per questo si possono ignorare. In maggioranza riguardano comportamenti umani e valori umanistici, che sono fra i processi più complicati del mondo. Non serve a gran che, d'altra parte, trattare questo ordine di eventi e di considerazioni in modo meramente discorsivo, né ricorrendo a metafore. Tali artifici si possono usare per presentare drammaticamente risultati che siano basati su osservazioni adeguate e su ragionamenti accurati. In particolare possiamo dire che tutti i sistemi complessi (sociali e tecnologici) devono essere studiati usando l'approccio logico-sperimentale rivelatosi così fruttuoso nella scienza pura e applicata da quando Galileo lo formulò per primo, scrivendo: «Ciò che l'esperienza e i sensi ne dimostrano devesi anteporre a ogni discorso ancorché ne paresse assai fondato».
5. Reperimento delle informazioni.
Quando abbiamo registrato dati o testi sperabilmente buoni, la loro utilità è di nuovo nulla se non sappiamo ritrovarli quando ci servono. Il reperimento delle informazioni (information retrieval) è una branca dell'informatica su cui esistono ottimi manuali e ampia documentazione. Senza entrare in dettagli tecnici, ricordiamo che il reperimento è tanto più agevole quanto più efficaci sono i modi in cui i dati sono stati codificati e quanto più concise sono le registrazioni. Le basi dati relazionali permettono di ritrovare dati registrati e archiviati secondo parecchi criteri di classificazione, correlando e associando certi dati con altri o con informazioni geografiche, storiche ecc. Per quanto siano efficaci sistemi e strumenti per il reperimento di informazioni, la probabilità di scontrarsi con problemi non trattabili o di essere costretti a seguire procedure di ricerca di bassa efficienza e di alto costo cresce fatalmente, se si adottano regole atte a far proliferare l'universo dei dati registrati.
Un caso tipico è quello della legislazione nei Paesi anglosassoni, ove, come è noto, non esistono codici di leggi approvate dai rispettivi Parlamenti. In questi Paesi il precedente è fonte vitale del diritto e, ormai, va ritrovato in mezzo a una mole di sentenze spropositata e crescente di anno in anno. Soltanto orientarsi in questa immane congerie di sentenze diventa arduo, mentre cresce la probabilità di trovare precedenti in contrasto fra loro.
La soluzione consiste, allora, in una codificazione più concisa, univoca ed efficace delle informazioni da reperire. In generale conviene anche eliminare dagli archivi le registrazioni ormai sicuramente prive di alcun interesse. Anche questa operazione va fatta in modo oculato. Quando l'Inghilterra perse le colonie dopo la Seconda Guerra Mondiale, il suo Governo, con il consenso del Parlamento, decise di eliminare ponderosi archivi ormai inutili. Secondo un aneddoto (non controllato, ma abbastanza verosimile) un ufficio in via di smantellamento chiese l'autorizzazione a distruggere certi documenti: gli fu data, ma alla condizione che di ogni documento destinato alla distruzione fossero prima prodotte tre copie.
6. Degrado dei mezzi di registrazione e modi per prevenirlo.
E', poi, impossibile ritrovare le informazioni se i mezzi di registrazione usati degradano la propria consistenza fino a rendere impossibile l'accesso ai dati. La scarsa permanenza delle immagini e dei testi sui fax con carta speciale è ben nota. E' buona norma, quindi, fotocopiare i fax importanti che riceviamo per evitare che scompaiano. La qualità dei mezzi di registrazione dovrebbe essere valutata accuratamente. La carta in uso in tempi antichi si conserva notoriamente per secoli, come anche i papiri e le pergamene. Certi tipi moderni di carta tendono, invece, a disgregarsi. Secondo alcune valutazioni, milioni di libri pubblicati negli ultimi 150 anni sono attualmente in serio pericolo. Problemi analoghi si incontrano con nastri e dischi magnetici.
Oltre al possibile degrado dei materiali di supporto, qui sorge un'ulteriore difficoltà. Anche se nastri o dischi sonoperfettamente integri, non sono utilizzabili senza le unità di lettura originali. I modelli più antichi sono fuori produzione e le parti di ricambio non sono più stoccate dai costruttori. In conseguenza interi archivi possono diventare illeggibili. Pare che difficoltà di questo tipo affliggano importanti archivi di testi e di immagini relative alle prime missioni spaziali della Nasa. Sono in corso in vari paesi importanti programmi di salvataggio e duplicazione di testi e immagini contenute in libri e periodici antichi e moderni e in microfilm, che vengono copiati con tecniche digitali su Cd-Rom realizzati in plastica e in metallo1.
Le tecniche moderne di computer grafica permettono di riprodurre testi, immagini e caratteri grafici con una accuratezza e fedeltà spinte quanto si voglia. Si possono riprodurre, quindi, testi tipografici di grande pregio obbedendo ai canoni estetici più raffinati. Naturalmente il processo ha un costo tanto maggiore quanto più sono sofisticate e stringenti le specifiche relative alla fedeltà di riproduzione. Alcuni ritengono che i livelli di presentazione estetica facciano parte integrante della conoscenza accumulata. Secondo altri, invece, sono vitali solo i contenuti (quando siano rilevanti) ed è bene registrarli nel modo più efficace ed economico, ad esempio in Ascii, evitando ogni leziosità.
Esiste, dunque, un rischio grave di perdere la memoria sociale e storica di avvenimenti, ricerche, esperimenti e studi importanti e non più ricostruibili. Fortunatamente la crescente estensione delle reti telematiche facilita e incoraggia la produzione di copie multiple degli stessi testi registrati su supporti diversi: carta, dischi rigidi, dischetti di vario tipo, nastri magnetici. In alcuni casi, anzi, si può arguire che il numero di copie prodotto sarà tanto più alto quanto più alta si valuta che sia l'importanza del messaggio registrato. Questo processo, ormai sempre più diffuso, protegge, dunque, i testi alfanumerici e grafici contro il rischio di perdita dovuta al degrado dei supporti.
Notoriamente alla multiplazione dei record si ricorre anche per evitare le distruzioni dovute a vandalismo o ad atti di terrorismo. Che la multiplazione costituisca una protezione efficace è dimostrato anche dalla conservazione di moltissimi testi classici, alcune copie dei quali hanno resistito agli attacchi del tempo, dei barbari e dei vandali. A livello personale, ci è difficile riudire le voci dei nostri figli registrate trenta anni fa su bobine di nastro diventate fragili e utilizzabili solo su registratori ormai fuori commercio. Anche le cassette televisive cambiano modello e quelle più antiche dovrebbero essere riversate periodicamente su altre più moderne. Ora, con l'avvento imminente della televisione digitale, le registrazioni analogiche saranno leggibili con sempre maggiore difficoltà o non lo saranno affatto.
La gravità di questa situazione potrebbe essere minimizzata da chi si attesta su posizioni di retroguardia, ritiene scarso il valore delle nozioni e sostiene che la cultura vera è fatta di intuizioni e di grandi principi. Una battuta corrente dice: «Dov'è l'informazione che trascuriamo per concentrarci sui dati? Dov'è la conoscenza che non raggiungiamo perché ci occupiamo solo di informazione? Dove è la sapienza che ci manca perché ci occupiamo solo di conoscenza?» Il punto di vista implicato è del tutto errato perché la sapienza non basata su conoscenza (nozioni) e dati affidabili è gratuita, dogmatica e avulsa dalla realtà: probabilmente inutile o dannosa. La comprensione dei meccanismi fisici, sociali, economici, gestionali può essere solo basata su una adeguata acquisizione di dati.
Naturalmente molte spiegazioni incorporano teorie opinabili. Anche queste vanno registrate e discusse. (Talora la storia delle opinioni è più importante delle opinioni stesse). I processi di degrado dei supporti fisici dell'informazione e, quindi, dei loro contenuti informativi devono essere, infine, valutati istituendo bilanci costi/benefici. E' un danno (o costo) la perdita di informazioni, conoscenze, dati che abbiano alta affidabilità, ma è un vantaggio la perdita (o la eliminazione) di informazioni false o fuorvianti.
|
|