I social network veicolano ogni giorno immense quantità di dati. I primi a rendersi conto dell’enorme potenzialità dei social per analizzare il comportamento degli utenti e sfruttarlo a proprio vantaggio sono stati i grandi marchi, con la realizzazione di pubblicità profilate sulla base delle caratteristiche e delle preferenze di ogni utilizzatore delle piattaforme social.
La mole di dati generata continuamente dai social costituisce però un flusso caotico e disorganizzato, che per essere compreso a fondo necessita di essere ordinato. L’utilizzo di dati geospaziali è risultato essere il criterio più logico, fornendo agli analisti un contesto preciso nelle categorie di spazio e tempo.
La HDMA, AI Center for Human Dynamics in the Mobile Age, sta cercando da diversi anni di utilizzare l’analisi dei Big Data provenienti dai social in diversi campi di importanza strategica. Come accade sempre quando si utilizzano strumenti e tecnologie di questo tipo, le implicazioni di certe pratiche sono estremamente problematiche.
Quanto è corretto dal punto di vista etico l’utilizzo dei big data provenienti dai social network? Siamo già in possesso degli strumenti tecnologici necessari a gestire eticamente – e non solo tecnicamente – la sfida dell’Intelligence applicata ai Social Network? E quali sono gli scenari più probabili a cui queste scoperte e queste pratiche potrebbero condurre in tempi più o meno brevi?
Indice dei Contenuti
La sfida di HDMA: comprendere e soddisfare i bisogni reali
Il direttore di HDMA, Ming – Hsiang Tsou, ha dichiarato che l’obiettivo principale del lavoro sui big data portato avanti dal suo centro di ricerca è “la trasformazione della ricerca accademica nel reperimento e nella comprensione di informazioni che possano essere utilizzate per il cambiamento delle politiche pubbliche o del processo decisionale in tempo reale”.
L’HDMA intende quindi mettere le potenzialità espresse dall’utilizzo dell’Intelligenza Artificiale nell’ambito dei Social Media (socmint) al servizio di coloro che usufruiscono dei social, soddisfacendo i bisogni reali della popolazione che vive, lavora e si muove all’interno di un certo territorio.
Nel punto di intersezione dai dati espressi dai cittadini del mondo e i loro bisogni immediati si pone quindi la geolocalizzazione dei dati. HDMA ha sviluppato diversi software per importare in maniera automatica o semi automatica i dati raccolti dai social su un Sistema di Geospacial Intelligence (GIS).
È stata poi sviluppata la dashboard SMART (Social Media Analytic and Research Testbed) che permette di monitorare e aggregare le informazioni relative ai cambiamenti nei comportamenti sociali, tutto in tempo reale.
La dashboard SMART ha espresso tutte le sue potenzialità aiutando i ricercatori a monitorare la diffusione del virus Ebola, ma anche a comprendere come la popolazione stava reagendo durante incendi, uragani e altri disastri naturali.
Infine, è stata sviluppata un’applicazione chiamata Geo – Targeting Event Observation Viewer con cui è possibile ottenere informazioni di estrema importanza strategica come la mappatura dei dati storici dei social media e il flusso di quei dati in tempo reale. Quest’applicazione è anche in grado di estrarre e archiviare dai social media fotografie e video realizzati all’interno di specifiche aree geografiche.
La HDMA ha sempre assicurato di aver applicato diligentemente diverse misure di sicurezza a protezione della privacy degli utenti di cui venivano analizzati i dati, applicando spesso anche strategia di randomizzazione per evitare l’associazione biunivoca di dati sensibili a un determinato utente, ma i dubbi in merito all’effettivo rispetto della privacy degli utenti sono ben lontani dall’essere completamente dissipati.
I dati di Twitter per monitorare i casi di Coronavirus a San Diego
La HDMA ha sede in San Diego, California. Coerentemente con l’obiettivo di fornire dati e soluzioni utili alla popolazione durante periodi e situazioni di crisi, la HDMA si è impegnata a fornire dati sulla diffusione della pandemia di Coronavirus nell’area della Contea di San Diego.
Il centro di ricerca ha utilizzato i dati ricavati da post di Twitter scritti dai residenti della città Californiana e ha isolato i twit che parlavano di distanziamento sociale, utilizzo di mascherine, riapertura di scuole e di aziende nonché problemi di vaccinazione.
Sul sito web creato appositamente per contenere, organizzare e diffondere i dati delle analisi, sono stati fornite informazioni sui luoghi in cui vengono effettuati i test all’interno della Contea di San Diego, informazioni sulla tracciabilità dei casi, altri risultati derivanti dalle analisi dei dati in maniera che fossero facilmente fruibili, risorse informative contenute in immagini e video divulgativi.
I ricercatori di HDMA sono anche stati in grado di fornire ai loro concittadini una mappa che evidenzia i casi accertati di Coronavirus divisi per codice postale all’interno della Contea, utilizzando i dati continuamente aggiornati della San Diego County’s Health and Human Services Agency.
Uno degli obiettivi secondari del progetto è anche contribuire a ridurre la diffusione di informazioni errate in merito alla diffusione del virus nella contea di San Diego e, indirettamente, a combattere le fake news che si generano continuamente sul virus, le sue conseguenze e i dati della sua gestione da parte delle autorità.
HDMA ha scelto di utilizzare i big data generati dagli utenti di Twitter perché su questo social network viaggiano in maniera estremamente rapida informazioni riguardanti temi politici, sociali e, ultimamente, sanitari. Nulla vieta però che per scopi differenti si possano utilizzare anche i big data generati da altri social come Facebook o Instagram.
Il pericolo delle Social Botnet e l’inquinamento dei Big Data
Da qualche tempo l’utilizzo delle social botnet è diventato sempre più massivo all’interno dei principali social media.
S tratta di una pratica non consentita sulla maggior parte dei social network, dei quali viola i termini di servizio. Le social botnet sono infatti in grado di generare post e interazioni in quantità gigantesche, quindi di produrre dati pilotati e mirati a scopi specifici, come realizzare un’efficace e pervasiva propaganda politica attraverso la capillare diffusione di fake news.
L’utilizzo di social botnet su Facebook, Instagram e anche Linkedin, produce un gigantesco inquinamento dei big data analizzati dalla Social Media Intelligence.
Tali dati sono utilizzati comunemente per monitorare minacce politiche come quelle terroristiche ma anche per ottenere dati di natura completamente diversa finalizzati alla sentiment analysis e al monitoraggio della reputazione di un brand o di una personalità politica. L’alterazione di tali dati può risultare quindi estremamente pericolosa a livello politico e sociale.
Si tratta di considerazioni da cui gli analisti di big data non possono assolutamente prescindere, soprattutto poiché maggiore è la potenza di uno strumento maggiore è l’entità dei danni che tale strumento potrebbe causare se utilizzato per scopi malevoli e, come ha sottolineato in più di un’occasione Ming – Hsiang Tsou, le potenzialità della Geoint abbinata alla socmint per l’analisi dei big data originati dai social sono enormi.
Conclusioni
Lo scenario che si profila ipotizzando una fusione sempre più stretta tra Geoint e Socmint, di cui il lavoro di HDMA costituisce un promettente precursore, è potenzialmente distopico.
I ricercatori di HDMA hanno sostenuto in ogni modo possibile di voler mettere il proprio lavoro di analisi dei Big Data a supporto delle autorità amministrative e politiche per soddisfare i bisogni della popolazione che vive in una certa area, ma hanno tracciato un percorso potenzialmente molto pericoloso che potrebbe essere battuto da individui e organizzazioni privi di scrupoli.La trasparenza praticamente totale dei big data generati dai social, il loro massivo utilizzo per la profilazione degli utenti tramite socmint, nonché la pressione sull’opinione pubblica che potrebbe essere operata tramite l’ampio utilizzo di social botnet e infine la localizzazione di questi dati nello spazio – tempo tramite strumenti e pratiche di Geoint, sono condizioni che potrebbero condurre in un tempo spaventosamente breve sia alla messa in opera di misure a sostegno delle popolazioni in difficoltà sia alla generazione di sistemi politici e sociali orwelliani di cui l’umanità non ha e non avrà bisogno.