twitterlinkedinmail


In tempi in cui gli attentati terroristici sono purtroppo all’ordine del giorno, l’argomento Privacy e tutela della Riservatezza è da molti considerato sospetto di per se stesso.

Ma davvero la rinuncia alla Privacy è un male necessario per garantire la sicurezza dei cittadini, oppure, alla luce dell’impiego dei Big Data in maniera sempre più pervasiva, questo non rischia di trasformarsi in un boomerang?

Quel falso trade-off tra sicurezza e privacy

È diventato oramai un luogo comune condiviso da molti l’idea che per garantire la sicurezza dei cittadini, questi debbano rinunciare alle loro “pretese” in termini di riservatezza.

In realtà, come vedremo tra poco, all’aumentare dell’informazione disponibile non corrisponde necessariamente un’analogo incremento del “segnale” (vale a dire delle informazioni realmente rilevanti) ma del “rumore” (ovvero delle informazioni inutili, fuorvianti o semplicemente casuali).

La ricerca del segnale in questo caso assomiglia sempre più a quella di un ago in un pagliaio…con l’aggravante che al crescere delle informazioni l’ago rimane sempre lo stesso, mentre il pagliaio cresce a dismisura!

Vediamo di chiarire il concetto con un esempio numerico.

Cercare un ago in un pagliaio che cresce a dismisura

Avendo a disposizione i dati relativi alle prenotazione degli hotel (dati che includono ovviamente nome, cognome, indirizzo ecc.) effettuate da un gran numero di turisti (nell’ordine di 1 miliardo), vogliamo scoprire se tra questi non ci siano possibili terroristi, come ad es. due soggetti di nazionalità e residenza diversa, che hanno deciso di incontrarsi in uno stesso hotel, ubicato in una qualsiasi parte del mondo, in due giorni diversi (cosa che reputiamo sospetta, e che pertanto interpretiamo come indizio della pianificazione di un possibile attentato terroristico).

Dunque, riepiloghiamo i dati del nostro esempio1 e cerchiamo di effettuare alcuni semplici calcoli:

  1. il numero delle prenotazioni di hotel riguarda 1 miliardo (cioè 109) di soggetti di tutte le nazionalità;
  2. ogni turista va in un hotel 1 giorno su 100;
  3. immaginiamo di concentrare le nostre indagini su 100.000 hotel, e che ogni hotel possa ospitare 100 persone ciascuno;
  4. la nostra analisi si sviluppa su di un arco temporale di 1000 giorni.

Sulla scorta di tali ipotesi, cominciamo adesso col valutare la probabilità che due persone si incontrino nello stesso hotel in due giorni diversi.

Continua la lettura

Sottoscrivi la Newsletter per accedere
in anteprima ai contenuti:



  1. L’esempio è ripreso e riadattato dall’originale esposto nel magistrale testo “Mining of Massive Datasets”, Anand Rajaraman, Jure Leskovec, and Jeffrey D. Ullman.