C he i big data siano ormai da tempo un argomento che ha abbandonato gli ambiti scientifici e specialistici per diventare un fenomeno di massa è sotto gli occhi di tutti. Ne parlano ormai più o meno tutti i quotidiani generalisti, di solito con articoli dai titoli altisonanti del tipo Giovani talenti, il futuro si chiama big data o Turismo: con i big data possiamo pensare in grande. Poi ci sono i convegni, gli osservatori, i corsi di aggiornamento e, naturalmente, le conversazioni sui social network. Su LinkedIn, ad esempio, ci sono oltre duemila gruppi dedicati all’argomento. A pensarci bene, tutta questa attenzione non è poi così strana. Dopotutto che “i dati sono il nuovo petrolio” è stato detto, ridetto e scritto più o meno in tutte le salse (e infatti, se cercate la frase su Google troverete la bellezza di 597.000 risultati), e una cosa, si sa, a furia di ripeterla acquista sempre più consistenza fino a diventare una verità, per parafrasare il celebre adagio di Joseph Göbbels.
Con questo non voglio certo dire che i big data non rappresentino uno dei temi centrali della contemporaneità, tutt’altro. Credo però che l’hype generato intorno a questo argomento, il chiacchiericcio, le grandi speranze e le attese che si sono coagulate intorno a tutto ciò che ha a che fare coi dati non aiutino molto a capire la portata e le conseguenze che questo fenomeno sta avendo e avrà per la nostra società e le nostre vite; anzi, spesso e volentieri contribuiscono ad aumentare la confusione. Tuttavia, un fatto è certo e non può essere smentito: mai come oggi la società ha visto un flusso di produzione di dati così sterminato, costante e pervasivo come quello a cui assistiamo ogni giorno.
A essere responsabili di questa situazione sono le tecnologie digitali; e non soltanto perché queste sono diventate essenziali per tutta una serie di attività professionali, dalla comunicazione alla transazioni finanziarie, ma anche perché ognuno di noi s’è trovato sempre più legato a una serie di dispositivi digitali necessari per svolgere un numero sempre più elevato di faccende quotidiane e dotati di un numero sempre crescente di sensori e strumenti di registrazione di vario tipo. È per questo motivo che la natura dei dispositivi digitali, il più famoso e diffuso è senza dubbio lo smartphone (un computer portatile di dimensioni ridottissime, travestito da telefono cellulare), è quella di essere delle macchine che, in prima istanza, producono dati.
Al mattino, quando lo avviamo (sempre che non lo avessimo lasciato acceso la sera prima), il nostro smartphone invia a uno dei tanti soggetti – il produttore del telefono, quello del sistema operativo, quelli dell’app che abbiamo installato e altri a essi legati – a cui il nostro pezzo di hardware ci collega l’informazione che il device è attivo. Se nel corso della settimana, mettiamo dal lunedì al venerdì, questo dato viene registrato più o meno ogni giorno alla stessa ora, chi lo raccoglie può ragionevolmente presumere che noi abbiamo una routine quotidiana consolidata e, quindi, che potremmo essere lavoratori o studenti della scuola dell’obbligo, ad esempio. Se poi sul nostro smartphone abbiamo attivato la geolocalizzazione, verranno registrati anche i nostri tragitti quotidiani, che finiranno per fare parte di quell’insieme di dati che trasmettiamo a tutti i soggetti a cui siamo legati per suo tramite. Per tutti loro, sarà così più semplice capire per quale motivo ci siamo svegliati quella mattina. Infatti se una ventina di minuti dopo essere usciti da casa il nostro smartphone raggiunge un indirizzo che corrisponde a quello di un’azienda e da qui non si muove per le successive quattro ore sarà piuttosto facile per chiunque abbia i mezzi per raccogliere, processare e analizzare quei dati presumere che quella è l’azienda per la quale lavoriamo.
Tutto questo processo avviene in modo automatico senza che vi sia, da parte di chi raccoglie, processa e analizza i dati, alcuna frizione o interferenza con le nostre faccende di tutti i giorni. Questo accade perché ogni dispositivo che noi utilizziamo crea una traccia digitale fatta di dati che possono essere aggregati, analizzati e letti per ricavarne un gran numero di informazioni. E man mano che a venire digitalizzato è un numero sempre più alto di oggetti di uso comune, come sta accadendo proprio adesso con la cosiddetta Internet of Things, le dimensioni della nostra traccia digitale aumentano di conseguenza, trasformandola in qualcosa di più concreto dell’ombra delle nostre abitudini di consumo. La mole di dati che, potenzialmente, siamo in grado di produrre oggi come oggi assomiglia molto a un vero e proprio profilo ombra della nostra esistenza, il corrispettivo virtuale di noi stessi di cui, spesso e volentieri senza una piena consapevolezza, cediamo la proprietà e il controllo ai produttori di device e ai fornitori di servizi digitali.
Quello della proprietà dei dati che produciamo attraverso i nostri dispositivi digitali è senza dubbio uno dei problemi più importanti nella cosiddetta “società dei dati”. Un problema che presenta anche una componente linguistica di cui si dovrebbe tenere conto e che sarà, qui come altrove, centrale per gli obiettivi di questo scritto.
Nella lingua inglese, la parola “data” si afferma infatti a partire dal participio passato del verbo latino “dare”, ovvero “datum”. Questa parola, se usata come sostantivo neutro della seconda declinazione, può essere tradotto come “cosa data” e assumere quindi il significato di “dono”. Il meccanismo del dono, così com’è stato classicamente descritto da Marcell Mauss in uno dei suoi saggi più celebri, prevede tre momenti fondamentali basati sul principio della reciprocità: il dare, il ricevere (che presuppone accettazione) e il ricambiare. Nel contesto dell’attuale capitalismo di piattaforme – quello che sulle operazioni di raccolta, processo e analisi dei dati basa gran parte, se non tutto, il proprio potenziale competitivo – questo tipo di relazione sembra configurarsi nel modo che descriverò di seguito. Il momento del dare è occupato dall’offerta gratuita di un servizio, il dono che la piattaforma offre per creare una relazione con il proprio utente. Nel momento del ricevere, l’utente accetta il dono sottoscrivendo i termini che regolano l’utilizzo del servizio.
È al loro interno, ed è a questo punto che lo schema di Mauss subisce una perturbazione, che viene configurato il momento del ricambiare, ovvero la cessione dei propri dati personali e di utilizzo del servizio. Dati che verranno poi rivenduti contribuendo a creare il valore della piattaforma stessa. Quello che ruota intorno a questa relazione di dono geneticamente modificata, in cui il momento del ricambiare perde la sua natura non obbligatoria e flessibile in termini di modalità e di tempo, è un equivoco squisitamente linguistico ed è lo stesso che ha reso, rende e probabilmente continuerà a rendere difficile articolare un discorso intorno alla proprietà personale dei dati. Perché se prendiamo per buona la frase di Wittgenstein secondo cui «i limiti del linguaggio significano i limiti del mio mondo», allora le parole che usiamo per parlare di dati ne creano la realtà e, di conseguenza, anche il modo in cui i dati influenzano e trasformano il nostro modo di giudicare la realtà che ci circonda è legato a esse. Finché continueremo a concepire i nostri dati come una parte di una relazione di dono, sarà difficile tanto sviluppare una coscienza dell’importanza della loro proprietà tanto provare a ipotizzare soluzioni di design in grado di dimostrare una responsabilità civica e politica del valore dei dati che produciamo.
L’oggettività del dato e il giudizio sul mondo
Prima di finire impelagati in una serie di scaramucce tattiche che li hanno resi di fatto inutilizzabili, i concetti di “post-verità” e di “società post-fattuale” avevano avuto il merito di porre l’attenzione su un aspetto fondamentale dell’affermarsi dei dati come fenomeno centrale per la nostra società. Ovvero le modalità e le forme di trasformazione del giudizio che esprimiamo sulla realtà che ci circonda e i fatti che l’attraversano, in un mondo caratterizzato dall’estenuante produzione di dati di cui siamo testimoni. Semplificando molto, quello a cui abbiamo assistito e stiamo assistendo in questi ultimi anni è un passaggio da una modalità di giudizio basata sull’osservazione diretta e la testimonianza dei fatti, la cui origine possiamo far risalire fino all’introduzione della Magna Carta, a una modalità di giudizio basata sulla raccolta, l’aggregazione e l’analisi dei dati.
Tornando all’esempio che abbiamo usato in precedenza per spiegare come si forma la nostra traccia di dati, per capire se, dove e quando lavoriamo oggi non è più necessario che qualcuno ci veda alzarci la mattina, magari prendendo nota dei nostri orari, ci segua sull’autobus, magari camuffandosi tra la folla per non essere riconosciuto, e infine ci osservi entrare nella sede della nostra azienda, magari avvicinandosi alla porta per capire di quale si tratta guardando le targhe dei diversi uffici presenti nel palazzo. Oggi tutto questo è possibile farlo a distanza studiando, appunto, la coda di dati che lasciamo dietro di noi usando ogni dispositivo digitale. Il ricorso sempre più massiccio alla Signal Intelligence – lo spionaggio basato su segnali (digitali) – testimoniato dall’inchiesta Drone Papers, pubblicata da The Intercept, dimostra come il passaggio da una modalità di giudizio basata sull’osservazione diretta e la testimonianza dei fatti a una basata sull’analisi dei dati sia ormai una realtà e non soltanto un’ipotesi. Al netto delle problematiche che emergono nell’ambito di questa trasformazione (e ce ne sono più d’una, come mostrano i già citati Drone Papers) la domanda che dovremmo tenere sempre presente è in che modo il passaggio dai dati ai fatti come modalità del giudizio cambia il modo in cui vediamo le cose?
Si tratta ovviamente di una risposta complessa, a cui i saggi di questa raccolta provano, ognuno a modo loro, a dare una risposta dettagliata rispetto ai numerosi ambiti della nostra società in cui i dati stanno producendo cambiamenti di rilievo (ovvero, più o meno tutti). Tuttavia, a un livello più superficiale, l’emergenza più evidente del ruolo che i dati rivestono nel determinare il giudizio che diamo sulla realtà che ci circonda è la loro pretesa oggettività rispetto ai fenomeni che descrivono. Anche questa volta basta fare un giro tra le conversazioni sui social network per vedere il modo in cui gli utenti brandiscono report statistici, inchieste di data journalism e altre forme di presentazione dei dati come armi retoriche, il cui obiettivo è far accettare all’interlocutore l’evidenza della propria posizione. Nel sentire comune, insomma, ciò che viene presentato e supportato attraverso i dati assume la forza di un’evidenza sostanzialmente incontestabile, al punto che il dato sembra aver assunto uno statuto simile a quello di un elemento naturale. Uno statuto del tutto simile a quello dei fatti osservabili che costituivano un tempo l’unica base possibile per il giudizio.
A questo punto bisogna notare che l’emergere di questo sentimento, di questa credenza nel dato come paradigma di oggettività, da una parte è il risultato dell’abbassamento delle soglie d’ingresso necessarie alla produzione e distribuzione delle informazioni, che ha configurato e reso possibile un mondo caratterizzato dalla polverizzazione delle opinioni e dei punti di vista che ha frammentato i canoni abituali dell’autorevolezza e generato una domanda pressante di punti fermi con cui orientarsi in un panorama liquido e mutevole. Dall’altra è l’effetto ideologico della costruzione di un discorso e di un punto di vista che hanno come effetto quello di nascondere e rimuovere la reale natura dei dati, partecipando così alla creazione di un rapporto di potere. Uno degli elementi che rende possibile la costruzione di questo rapporto di potere, attraverso l’istituzione di un discorso e l’articolazione di un punto di vista, è proprio la parola “dato”.
Perciò, ancora una volta è all’etimologia della parola che vorrei provare a rivolgermi, per capire in che modo la parola “dato” contribuisce in modo fondamentale alla creazione di un tale rapporto. La parola “dato” deriva infatti da un altro sostantivo maschile latino, questa volta della quarta declinazione: dàtus ovvero “il dare”; ed è risalendo lungo questa radice che si è affermato il suo significato di «elemento immediatamente presente alla conoscenza, prima di ogni forma di elaborazione» (Dizionario Treccani). Un elemento che, proprio in virtù della sua immediata presenza alla conoscenza, poteva essere il mezzo per la risoluzione di un problema matematico o la base per l’elaborazione di una teoria da parte di un filosofo. Quello che dovremmo chiederci però, a questo punto, è se l’etimologia e il significato che siamo stati abituati a dare alla parola “dato” siano ancora utili per aiutarci a capire la natura di tutte quelle operazioni che vanno oggi sotto il nome di big data? La risposta è no. E non si tratta, in realtà, nemmeno di una questione di novità rispetto a un ipotetico passato in cui quella situazione di presenza immediata del dato alla coscienza poteva avere un qualche valore. Ogni volta che noi parliamo di dati ci riferiamo sempre a un sottoinsieme degli infiniti elementi del mondo che sono stati isolati da qualche strumento o processo di misurazione. Anche in questo caso, l’equivoco è squisitamente linguistico.
Tanto è vero che, nel 2014, in un libro intitolato The Data Revolution: Big Data, Open Data, Data Infrastructures and their Consequences, Rob Kitchin fa notare come la parola “capta” (dal latino “captare”, catturare) avrebbe, rispetto alla parola “data”, un maggior valore esplicativo dei processi di trattamento e costruzione a cui è sottoposta l’informazione. In effetti, quelli che noi ci siamo abituati a pensare come fatti che si danno in modo spontaneo all’analisi, e che chiamiamo comunemente dati, sono in realtà una selezione da un ventaglio infinito di possibilità che operiamo sia artificialmente, per tramite di sensori di vario tipo, sia corporalmente, per tramite dei nostri sensi. E visto che l’operazione di selezionare e stabilire delle differenze tra le cose che ci circondano è l’atto stesso di fondazione di una cultura, allora anche i dati che raccogliamo e analizziamo ne portano impresso il marchio. Descritti in questo modo, come un elemento culturale, i dati perdono qualsiasi possibilità di oggettività, per diventare anch’essi il prodotto delle condizioni e del contesto in cui vengono sviluppati. Anche i dati, dunque, portano impressi i bias culturali di chi crea i sistemi per raccoglierli e le cornici concettuali con cui analizzarli, mettendo così in luce alcuni aspetti a discapito di altri, a seconda dei punti di vista da cui vengono creati.
Ripensare il dato
Il breve studio etimologico che ho condotto fin qui sulla natura della parola dato mi è servito a mostrare, da una parte, come è il modo in cui chiamiamo e pensiamo le cose che le fa esistere per noi in una determinata maniera. Così, se li pensiamo come una forma di dono, non ci poniamo alcun problema sulla proprietà dei nostri dati. Dall’altra parte, invece, è emerso il modo in cui l’uso delle parole contribuisce a costruire delle prospettive sulla realtà che, almeno in questo caso, sono funzionali a dissimulare dei rapporti di potere. Ovviamente per sfuggire le accuse di complottismo, bisogna dire che non sempre c’è una volontà malevola dietro questi equivoci linguistici. C’è però spesso una tendenza a servirsi di abitudini familiari per descrivere in modo semplice processi la cui complessità non dovrebbe essere ridotta, bensì spiegata e dispiegata. Come si pone rimedio a questa situazione?
La domanda è essenziale, critica ed è difficile darle una risposta. Credo però, e questo è un tentativo che può essere dibattuto a lungo, che per portare al centro del dibattito pubblico le questioni relative al ruolo che i dati stanno ricoprendo all’interno della nostra società (dalla loro proprietà alla proprietà dei mezzi necessari per processarli e metterli a valore) sia necessaria in primo luogo un’approfondita opera di educazione e formazione. Il mondo in cui viviamo sta infatti attraversando un’epoca di cambiamenti profondi che abbiamo il dovere di condividere tra noi essere umani, aggiornando, se necessario, i concetti con cui siamo abituati a pensare la realtà in modo da aiutarci a riflettere nel modo più fedele possibile quella che stiamo vivendo. Solo in questo modo sarà possibile per noi cominciare a ragionare su come poter progettare ambienti fisici e digitali in grado di costruire un diverso e più consapevole rapporto tra noi utenti e i dati che produciamo. La base di questo rapporto, questa almeno è la mia convinzione, non può che passare attraverso un modernismo delle interfacce che, abbandonando l’ideologia della trasparenza totale in cui stiamo vivendo, ci permetta di renderci conto dei principi in base a cui sono progettati gli spazi che abitiamo, i cui meccanismi dovrebbero essere, almeno in parte, disponibili a una manipolazione da parte nostra.
Per farlo, per raggiungere questo scopo, è necessario cominciare a ripensare il dato fin dai suoi elementi più basilari, molecolari, fin dal suo significato e dalle incrostazioni che gli si sono accumulate addosso in centinaia di anni d’abitudine.
Estratto dal libro Datacrazia (D Editore, 2018) a cura di Daniele Gambetta.