LA GENESI DEI BIG DATA (seconda parte) – di Fiorello Casi

Il secondo paradosso riguarda così il fatto che i Big Data nascono per identificare ma diventano a loro volta strumenti di attribuzione dell’identità. Infatti l’immagine di un individuo, ricercata con gli strumenti Big Data, differirà in modo sostanziale da quella che i suoi dati lasciati nel cyberspazio ed elaborate dagli algoritmi svilupperanno. A questo proposito riteniamo interessante riportare un caso emblematico, ormai utilizzato diffusamente per sottolineare, sia la potenza delle tecnologie dei Big Data, sia il secondo paradosso. 

La vicenda riguarda un padre che minacciò un’azione legale contro un supermercato della catena Target negli U.S. Il contenzioso riguardava il fatto che la figlia dell’uomo aveva ricevuto numerose pubblicità riguardo alla cura dei neonati, pur essendo ella ancora adolescente (e quindi di norma poco interessata ai neonati). Alle scuse del direttore del supermercato, che giunsero al padre pochi giorni dopo telefonicamente, seguirono quelle del padre allo stesso direttore. Il genitore aveva scoperto che la figlia era effettivamente incinta. Gli acquisti della ragazza, tracciati attraverso carte fedeltà, quelle a punti e quelle di credito, uniti al dettaglio dei beni acquistati, erano stati processati da modelli di analisi dei dati che avevano predetto che la ragazza avrebbe dato alla luce un figlio di lì a pochi mesi e si erano attivati con i canali pubblicitari opportuni.

Rimane da sottolineare il paradosso del potere, che può essere considerato una naturale conseguenza dei primi due. Abbiamo, anche in questo caso, già sottolineato come i benefici che derivano dai Big Data siano a quasi totale vantaggio delle istituzioni che li posseggono: governi, Istituzioni pubbliche, Istituzioni di Intelligence, Corporation (Google, Amazon, Facebook), aziende di marketing, società di networking e telefonia, ecc. Certamente non appartengono agli individui che li hanno generati e che sono oggetto di studio e analisi proprio attraverso tali dati.  E lo stesso paradosso risiede appunto nei termini di possibilità di accesso; solo alcuni potranno permettersi il lusso di accedere alle risorse informative qualificate dei Big Data. Si verrebbe a creare quello che paventano Boyd e Crawford, i Big data dei “ricchi” e i Big data dei “poveri” con le conseguenze che, almeno dall’avvento dell’analisi marxista, sono state ampiamente dibattute.

La griglia di lettura dei paradossi può essere un modo per cominciare a dare una dimensione alla complessità dei fatti che l’epoca dei Big Data reca con sé.

Come abbiamo già affermato i Big Data rientrano totalmente nel trattamento dei dati che ormai pervadono ogni momento della nostra vita quotidiana.

Tutti i discorsi di etica dei Big Data dovranno passare allora e innanzitutto dall’etica quotidiana, dall’insieme dei valori che portiamo con noi e che stanno alla base del nostro vivere quotidiano. Nessun discorso sui Big Data deve allora passare dalla descrizione e dall’analisi sul sistema delle relazioni di potere che ne sta alla base.

Alla luce della posta in gioco, in termini economici e di potere, esiste ormai anche per i Big Data una narrazione retorica utilizzata per la loro legittimazione in contesti che, come abbiamo visto, vanno ben oltre quello dell’informatica.

Una articolazione del sistema Big Data, utile per costruire una mappa di tutte le relazioni fra entità in gioco, è quella suggerita da Davide Bennato.

Il sistema dei Big Data è strutturato su tre componenti: tecnologica, ideologica e analitica.

La componente tecnologica è quella con maggiore visibilità e occupa il posto centrale nelle narrazioni degli “integrati” contrapposti agli “apocalittici”, per riprendere una definizione di Umberto Eco (Eco 1964) sull’atteggiamento degli individui nei confronti delle novità tecnologiche. I Big Data hanno la necessità imprescindibile di essere alimentati in modo costante e copioso da fonti informative e le più diversificate possibile. Si determina in questo modo un processo al quale abbiamo già accennato, quello di datizzazione o dataficazione del mondo, già molto diffuso nella cultura anglosassone degli ultimi anni. E parallelamente si sviluppa una delle tecnologie con maggiori potenzialità in questo senso, che è quella denominata Internet delle cose (Internet of Things), con essa è possibile congiungere qualunque oggetto del mondo fisico (interessanti esperimenti vengono condotti sul fronte della distribuzione delle energie pulite tra fornitori privati con questo metodo), in grado di collegarsi alla rete e quindi di entrare nel processo di datificazione, producendo dati.

È evidente che questo processo, spinto agli estremi, ha lo scopo di rendere il mondo digitale in grado di mappare quello fisico. Come afferma il prof. Hiroshi Ishii, del MIT Media Lab: “Sul bagnasciuga, tra la terra degli atomi e il mare dei bit affrontiamo ora la sfida di riconciliare la nostra doppia cittadinanza nel mondo fisico e in quello digitale. L’epoca attuale è caratterizzata, lo abbiamo ormai visto, da uno sviluppo enorme delle possibilità di rilevazione di dati in formato digitale dal mondo fisico. E questi due mondi iniziano un percorso di avvicinamento, di integrazione e di fusione dove tutto è potenzialmente e sempre più connesso con tutto. La Rete diventa la struttura che interconnette documenti e persone ma anche le cose. E questo determina anche una riconfigurazione della struttura dell’informazione, così come la abbiamo conosciuta; infatti essa tende a divenire sempre più trasversale a tutti i contesti e ambienti dove viene fruita; e così facendo si opera uno spostamento dall’interfaccia al processo di realizzazione, dal mezzo all’informazione stessa.

Ne emerge una vocazione pervasiva di questa tecnologia che crea uno scenario difficilmente interpretabile nell’immediato futuro: su piccole scale il modello potrebbe essere vincente nella condivisione dell’energia pulita, prodotta da piccole entità collegate in rete, ma su scale più vaste non è facilmente interpretabile.  Uno studio della Cisco sul caso specifico di “Internet delle cose”, rammenta come l’iper-connettività di apparati, persone e servizi creerà un mondo completamente nuovo in termini di interrelazioni ed economia ma anche nella produzione di dati, che collocheranno i Big Data a una centralità mai vista prima per altri fenomeni. La componente tecnologica è alimentata in modo altrettanto massiccio anche dai social media, che ne costituiscono una fonte importante. Come si è già visto, piattaforme di social media, da quelle di ispirazione politica ai cuori solitari, dagli acquisti on line ai blog di cucina alternativa; tutto alimenta il sistema per la mappatura delle relazioni sociali. Campioni di questo sistema sono piattaforme come Facebook, Twitter, Google Plus, e tante altre che hanno creato un nuovo mondo per la monetizzazione delle relazioni sociali, proprio attraverso la loro valorizzazione attraverso i Big Data. Non è un caso che la figura del “data scientist”, ormai tra le più ricercate sul mercato, sia nata proprio nei laboratori di Big Data di Facebook. Un ultimo approfondimento sulla componente tecnologica riguarda le già citate tecnologie di “Data providing”, di approvvigionamento di dati, che sono composte sostanzialmente da due filoni, le tecnologie mobili, cioè gli smart-phone e tablet e i sensori statici, che sono quelli usati dal sopracitato “Internet delle cose”. Nel caso dei dispositivi mobili l’interesse aumenta in maniera importante grazie al fatto che, essendo dispositivi mobili, oltre a favorire – con la loro onnipresente disponibilità – e aumentare il traffico nei social media, consentono di tracciare e interpretare gli spostamenti degli individui in azione e quindi i flussi fisici sociali. E tutto ciò alimenta incessantemente un drenaggio gigantesco di dati.

La componente ideologica, invece, resta fedele al concetto nella sua accezione ampia. Nel caso dei Big Data sono le motivazioni, la retorica e i racconti messi in atto per legittimare la sempre crescente produzione e raccolta di dati per le ragioni più diverse. Questo indirizzo politico sulla produzione e trattamento dei dati è iniziato da diversi anni e lo dimostrano le numerose direttive e policy emanate dagli organismi statali e sovra-statali, quali ONU, OCSE e Unione Europea.  Un esempio emblematico di questo tipo di narrazione a sostegno dei Big Data, portato avanti da alcuni anni e sostenuto da organizzazioni governative, economiche e scientifiche, riguarda il concetto di <<Smart city>>, che in Italia ha visto Venezia come applicazione sperimentale. Brevemente: con questo concetto si vuole pensare a delle particolari (nuove) modalità di vita nelle città. Ovviamente i punti cardinali di questo concetto sono, in primo luogo, uno stile di vita urbana di elevatissima sostenibilità che dovrebbe essere reso possibile da un uso “intelligente” delle risorse – dall’energia ai beni e servizi comuni – e da un monitoraggio totale della città intesa come un organismo con un bilanciamento perfetto tra immissioni ed emissioni. Tutto ciò, secondo la visione Big Data, è reso possibile attraverso la gestione sistematica delle fonti (numerosissime) di dati che consentono un controllo totale e capillare dello stato della città e dei suoi sub-sistemi (servizi), dai trasporti al sistema ecologico alla sicurezza; tutto in tempo reale e con fonti vaste di drenaggio dei dati. L’evoluzione di questa visione sulla città Big Data, una città cablata e tecnologicamente sempre connessa, basata sui dati, dovrebbe vedere la nascita di gruppi, di piccole comunità di cittadini, di “smart communities”, che concorreranno con le strutture tecnologiche alla raccolta dei dati, per esempio mappando il territorio con i loro smart-phone, rilevando guasti, problemi ecologici e altro.

Un altro esempio di narrazione, di carattere più ambiguo e ambivalente, tende a rinforzare lo stimolo a produrre più dati e fa leva sugli elementi in favore della “cultura della condivisione”. Velatamente, attraverso l’uso dei social media, ci giunge il messaggio che la condivisione di informazioni riguardo noi stessi, come i nostri pensieri, opinioni, gusti gastronomici, acquisti, sia un imperativo categorico per essere pienamente partecipi della vita sociale. Una breve navigazione su social network come Facebook è più esplicativa di questo fenomeno che un intero saggio al riguardo.

Un ultimo accenno a una nuova tendenza denominata “quantified self”, il sé quantificato. Questa ultima narrazione, in ordine di tempo, ha avuto una diffusione virale. Si tratta di applicazioni sotto forma di “app” da scaricare sui dispositivi mobili, o sotto forma di social specializzati; e nella maggior parte dei casi richiedono l’utilizzo di strumenti di registrazione indossabili, che hanno lo scopo di leggere e valutare valori relativi al corpo umano. L’origine di tutto ciò risale al “running” amatoriale e ad altre discipline sportive, che richiedevano la lettura delle prestazioni quali, le distanze percorse, le calorie bruciate, i valori cardiovascolari, ecc. Dalla dimensione sportiva e del benessere fisico tutto ciò, in un primo tempo si è transitato alla dimensione biomedica e, ora, con i gadget scaricabili su un semplice smartphone e tramite un device da indossare, sono fonti preziose di dati. Infatti tutti questi dati vengono raccolti da diversi servizi Web di proprietà dei produttori tecnologici (Nike, Adidas) e forniscono enormi quantità di informazioni sui parametri biologici degli individui.

Per quanto concerne la componente analitica, questa coinvolge un numero molto più ristretto di attori. E riguarda le tendenze e gli indirizzi di ricerca che formano l’oggetto di analisi dei Big Data. Il complesso delle attività legate alla trasformazione dei dati in valore sono numerosi; dagli algoritmi di selezione, estrazione e analisi, per non parlare delle tecniche di drenaggio e trasporto. Tuttavia, per le tematiche affrontate da questo lavoro, è opportuno e più che sufficiente circoscrivere, come tendenza da esaminare di questa componente, quella che viene definita la “predictive analysis”; l’analisi predittiva basata sui Big Data. Si tratta di algoritmi molto sofisticati che navigando all’interno di enormi database sono in grado di elaborare precise previsioni su comportamenti futuri o come già visto, trovare correlazioni circa questi ultimi.

È evidente che già solo questo tipo di analisi ( escludendo smart cities e  altri settori ) rende l’uso dei Big Data decisamente strategico, perfino decisivo in alcuni campi; infatti i dati vengono trasformati  in fonti di energia che alimentano (già oggi) processi politici, economici, finanziari, sociali, scientifici, creando un mutamento tale da essere in grado di riposizionare le tecnologie informatiche nell’ambito dell’economia mondiale e di ridisegnare la mappa del potere economico e sociale.