Sorveglianza digitale per prevenire le malattie: opportunità o minaccia?

A quanta privacy siamo disposti a rinunciare in cambio di più sicurezza sulla salute?

2656
Tempo di lettura: 6 minuti

Tutti i nostri comportamenti on line, dai like alle parole digitate in google, possono offrire utili indizi sulla diffusione di certe epidemie come quella attuale di Covid-19. Restano tuttavia alti i rischi di errori e di minaccia per la privacy.

A fine dicembre 2019, quasi una settimana prima che l’Organizzazione Mondiale della Sanità (OMS) lanciasse il primo allarme su una misteriosa malattia respiratoria che si stava diffondendo a Wuhan, in Cina, una squadra di analisti di Boston, usando il sistema di monitoraggio HealthMap, aveva già intercettato degli indizi digitali sull’epidemia. Si trattava di alcuni articoli della stampa locale e di commenti e conversazioni on line collegati.

Nello stesso periodo, anche ProMED (un programma dell’International Society for Infectious Diseases (ISID) sviluppato per identificare eventi sanitari insoliti legati a malattie infettive), aveva segnalato la presenza di una polmonite di origine sconosciuta a Wuhan sulla base delle conversazioni in corso su una chat di un  sito di blogging cinese, Weibo. Inoltre sulla piattaforma di social media WeChat in quel periodo stavano diventando sempre più popolari parole chiave come “SARS”, “mancanza di respiro” e “diarrea”.

Cosa si può imparare dai dati sui comportamenti on line delle persone?

I comportamenti on line delle persone che segnalano il loro stato di salute, che riversano le loro paure nel web e che cercano informazioni su sintomatologie e rimedi rappresenta un inedito, quanto promettente, strumento per attività di early-warning che può aiutare le autorità a intercettare, circoscrivere e identificare focolai epidemici.

Come recentemente evidenziato da  John Brownstein, Chief Innovation Officer presso il Boston Children’s Hospital e l’Harvard Medical School“Ci sono quantità incredibili di dati su blog di social media, chat room e notizie locali che ci forniscono indizi su epidemie che si verificano quotidianamente”. Tali dati, che Brownstein chiama “pangrattato digitale”, sono la materia prima per un campo emergente di indagine noto come epidemiologia digitale

HealthMap, di cui Brownstein è stato cofondatore nel 2006, è uno dei numerosi progetti in questo settore. Per altro, HeathMap è già stata testata con successo sia in occasione della pandemia H1N1 (influenza suina) del 2009 che in occasione della diffusione di Ebola in Africa occidentale. Oggi l’Organizzazione Mondiale della Sanità utilizza regolarmente HealthMap, ProMED ed altri sistemi simili per monitorare la situazione nel caso di epidemie di malattie infettive ed informare prontamente medici, funzionari e pubblico. 

Tuttavia, l’utilizzo degli open-source data con tecniche proprie delle strategie di OSINT per il rilevamento precoce delle malattie resta ancora una disciplina agli inizi rispetto ai metodi tradizionali. 

Le criticità dei sistemi di monitoraggio digitale

Al momento HealthMap non fa ancora molto affidamento sui dati provenienti spontaneamente dalle conversazioni sui social media ma preferisce monitorare le fonti di notizie online includendo alcuni post sui social media di professionisti della salute pubblica.  

Se da un lato la neo nascente epidemiologia digitale grazie all’enorme volume di dati a cui ha accesso e, soprattutto, alla liveness degli stessi (ovvero alla disponibilità del dato praticamente in tempo reale) può aiutare a individuare focolai in modo rapido ed economico, dall’altro lato l’utilizzo di dati digitali provenienti dai social media presenta sfide difficili sia sul piano tecnologico che su quello dell’accuratezza ma anche su quello della privacy. Come afferma Patty Kostkova, ricercatrice di e-health presso L’University College di Londra si tratta di “un’arma a doppio taglio”  . E’ una situazione sempre più diffusa in questo settore: i progressi tecnologici sono così veloci da anticipare la nostra capacità di garantire qualità e sicurezza. 

“E’ davvero difficile ottenere dati potenzialmente utili dai social media”, afferma Clark Freifeld, ricercatore informatico della Northeastern University e co-fondatore di HealthMap. Secondo Freifeld uno dei problemi principali dipende dal fatto che una volta che una malattia diventa una notizia, la maggior parte contenuti (domande, opinioni e post) che la gente pubblica social media sono reazioni a tali notizie piuttosto che indicatori dell’effettiva evoluzione della situazione. 

Quando gli algoritmi di Google segnalarono per errore un’epidemia di Colera negli USA

Ad esempio nel 2012 un’analisi di Google Trend che si basava sulla frequenza di utilizzo di parole chiave correlate all’influenza, aveva stimato per quell’inverno un forte picco nei casi di influenza. Il picco in realtà si è rivelato essere circa la metà di quello dell’anno precedente. In quel caso si era ipotizzato che forse le ricerche degli utenti riflettevano notizie di focolai di influenza piuttosto che malattie reali. 

Un altro esempio di come l’analisi delle parole chiave utilizzate nelle ricerche di Google possa portare fuori strada i ricercatori è quello del presunto colera negli USA del 2007. In quell’anno infatti era stato rilevato un picco di ricerche in Google per la parola “colera”. Ma la causa non era un’epidemia in corso, molto più semplicemente è stato causato da Oprah Winfrey, una delle presentatrici americane più seguite, che aveva parlato del romanzo L’amore al tempo del Colera.   

I dati presi dai social rilevano solo una specifica fetta della popolazione

Un’altra variabile per cui i dati a disposizione degli epidemiologi digitali possono rivelarsi fuorvianti è quella relativa alla targettizzazione della popolazione. Non tutti usano i social media allo stesso modo. Negli Stati Uniti ad esempio si è stimato che ad usare Twitter è circa il 22% degli adulti. Questo campione tuttavia non è eterogeneo: la maggior parte degli utenti americani di Twitter sono prevalentemente benestanti, istruiti, giovani. Inoltre, la maggior parte degli utenti di Twitter non twitta così tanto: circa l’80% dei tweet di tutti gli utenti adulti degli Stati Uniti proviene dal 10% degli utenti più prolifico. 

Questa tipologia di utenti diventa particolarmente problematica per l’epidemiologia digitale. Il monitoraggio dell’insorgere di malattie infettive attraverso i tweet potrebbe quindi ignorare fette significative della popolazione sia in termini di età, con una sottostima degli impatti sulle persone anziane, che per quel che riguarda gli strati delle popolazione con un tasso di istruzione ed un reddito inferiore. Categorie che, per altro, risultano essere le più vulnerabili alle minacce epidemiche.  

Le minacce per la privacy

Oltre ai questi problemi di accuratezza, l’epidemiologia digitale può rappresentare una minaccia alla privacy. Piattaforme come Google e Facebook si finanziano anche dall’utilizzo dei dati aggregati degli utenti da parte degli inserzionisti che possono quindi indirizzare le loro comunicazioni in base alle parole chiave usate nelle ricerche in Google e ai “like” dei social. Sebbene ci siano leggi diverse sulla privacy nei diversi stati e l’Unione Europea abbia recentemente approvato una legislazione molto stringente, l’uso di questo tipo di dati per la sorveglianza sanitaria potrebbe moltiplicare il rischio di violazioni della privacy soprattutto quando problemi di salute pubblica sono in conflitto con la riservatezza del singolo. 

L’emergenza Coronavirus ha fatto ad esempio emergere alcune possibilità ritenute fino ad oggi incompatibili ed inaccettabile nelle democrazie occidentali. Si parla, infatti, con crescente frequenza della possibilità di utilizzare i dati  dei telefoni cellulari per tracciare costantemente le posizioni e i contatti dei i cittadini. Come recentemente evidenziato anche dal European Data Protection Board questo risultato può essere in parte ottenuto raccogliendo questi dati in forma anonima ed aggregata se l’obiettivo è quello di verificare il rispetto delle nuove disposizioni e del mantenimento delle regole di distanziamento sociale. Ma qualora, come da più parti si chiede, si vogliono tracciare i contatti del singolo individuo che si scopre essere “positivo” onde consentire una rapida identificazione dei potenziali contagianti, allora è necessario avere informazioni puntuali sul singolo. Questo implica, ovviamente, una forte intromissione nella sfera della privacy del singolo che, però, come ribadito anche dal European Data Protection Board può essere giustificato alla luce della situazione emergenziale in atto e purché i meccanismi che si metteranno in piedi siano limitati nel tempo.

I sistemi digitali che favoriscono le segnalazioni volontarie da parte dei cittadini

Un altro sistema per raccogliere informazioni è quello della segnalazione volontaria. Si tratta di piattaforme di crowdsourcing come  Flu Near You  , lanciata nel 2011 da HealthMap, che utilizza un modello anonimo nel quale si chiedono agli utenti di fornire, su base generalmente settimanale, informazioni sul loro stato di salute da mettere a disposizione di funzionari e ricercatori della sanità pubblica.  Si tratta quindi di canali per raccogliere dati direttamente dalla popolazione. Con lo stesso spirito, alla fine di marzo, HealthMap ha lanciato un nuovo sito, Covid Near You , che si concentra in particolare sul monitoraggio dei  sintomi del Covid-19. 

Recentemente CrowdTangle, un sito di monitoraggio dei social media recentemente acquistato da Facebook, ha annunciato di aver lanciato una nuova funzionalità per consentire agli utenti, tra cui mezzi di informazione, funzionari della sanità pubblica e ricercatori, di tenere traccia delle tendenze social su siti come Facebook, Instagram e Twitter. Parallelamente CrowdTangle ha introdotto una sezione disponibile al pubblico nella quale sono presenti informazioni che provengono dai post pubblicati sugli account pubblici dei social media riguardanti il nuovo Coronavirus.

Non vanno poi dimenticati tutti quei device wearable come gli smartwatch utilizzati per il monitoraggio della salute e spesso per le prestazioni sportive durante gli allenamenti. Un caso interessante di telemonitoraggio della salute è quello della startup di San Francisco chiamata Kinsa che ha distribuito oltre 1 milione di termometri connessi ad internet in grado di inviare in tempo reale i dati relativi alla misurazione della temperatura corporea. 

Benjamin Dalziel, ricercatore della Oregon State University che collabora a questo progetto, afferma che il sistema è in grado di segnalare con precisione l’esordio di focolai influenzali due settimane prima rispetto a quanto riescano a fare le previsioni del CDC americano. Potenzialmente questo sistema potrebbe essere utilizzato anche per monitorare la diffusione del Covid-19. Il 18 marzo alcuni di questi dati aggregati sono stati pubblicati  sulla piattaforma di “Health Weather Map”.

Verso un futuro sempre più connesso e mappato

Questo tipo di dati sono chiaramente molto più precisi ed affidabili dei dati che si possono recuperare dalle conversazioni sui social media, ma richiedono una azione attiva da parte della popolazione. Opzione questa che presenza due contro-indicazioni. La prima è legata all’utilizzo che il collettore può fare di questi dati e la seconda ad una ritrosia da parte dei cittadini di condividere in assenza di una imminente e conclamata situazione di emergenza, i propri dati con le autorità pubbliche. 

L’emergenza del coronavirus sta chiaramente accelerando l’interesse per l’epidemiologia digitale. Quantomeno come strumento che vada ad integrazione delle attuali procedure di monitoraggio.

Fonti:

The following two tabs change content below.

Roberto Setola

Laureato in Ingegneria Elettronica, è professore associato di ingegneria elettronica presso l'Università Campus Bio-Medico di Roma e Direttore del Laboratorio di Sistemi Complessi e Sicurezza (www.coseritylab.it). E inoltre segretario generale dell'Associazione Italiana esperti in Infrastrutture Critiche