twitterlinkedinmail
“Se torturiamo i dati abbastanza a lungo, essi confesseranno (e ci sveleranno i messaggi segreti inviatici da Dio)”
Ronald Coase (citazione liberamente riadattata)

La ricerca di connessioni e significati “nascosti” all’interno dei dati, se non supportata da rigorosi criteri metodologici caratterizzati da scientificità, può indurre a rilevare correlazioni che sembrano significative, ma che in realtà sono determinate semplicemente dal caso (per questo vengono anche dette “correlazioni spurie” o “spurious correlations”).

Tale fenomeno si può manifestare con maggiore facilità proprio al crescere della dimensione dei datasets che vengono presi in considerazione (come avviene, appunto, nel caso dei Big Data Analytics).

Vediamo perchè.

La Scienza non gioca con i numeri

In questo senso, può essere istruttivo prendere in considerazione pratiche pseudo-scientifiche in uso nel passato, quali la numerologia, sopravvissuta sino ai nostri giorni, e ritornata in auge in tempi recenti anche grazie a successi editoriali e di intrattenimento (basti pensare al famoso libro di Dan Brown, “The Da Vinci Code”).

Continua la lettura

Sottoscrivi la Newsletter per accedere
in anteprima ai contenuti:


Era tutto già scritto nella Bibbia…

Molte “predizioni” si ammantano di autorità facendo ricorso addirittura alla sacralità dei testi sacri: è la “strategia” seguita da autori come Michael Drosnin.

Piuttosto diffusi sono gli esempi di previsioni di attentati avvenuti in tempi recenti, come l’assassinio del Presidente Kennedy, o più di recente, del Primo Ministro israeliano Yitzhak Rabin, che sarebbero stati “previsti” dai testi sacri, se solo si fosse stati in grado di “leggere tra le righe”, come pretende di aver fatto l’autore del famoso libro “The Bible Code”, Michael Drosnin.

Continua la lettura

Sottoscrivi la Newsletter per accedere
in anteprima ai contenuti:


…ma l’inchiostro l’ha fornito il Caso

Drosnin in realtà non aveva rivelato alcunchè di segreto e “premonitorio” che non fosse possibile ricavare da qualunque testo, purchè sufficientemente lungo.

Accettando la sfida proposta dallo stesso Drosnin, il Prof. Brendan McKay è stato in grado di trovare all’interno del romanzo “Moby Dick” di Melville le predizioni di attentati che si sarebbero verificate a distanza di molti anni a venire.

Di seguito ne riportiamo alcuni tra i più eclatanti:

Continua la lettura

Sottoscrivi la Newsletter per accedere
in anteprima ai contenuti:


La Verità (come la Bellezza) è nell’occhio di chi vede

Il rischio di imbattersi in correlazioni casuali cresce quindi con il crescere dei dati disponibili.

Così come è possibile “far dire” ad un testo sufficientemente lungo cose che il testo originario in realtà non dice, allo stesso modo è possibile trarre conclusioni “tendenziose” applicando il metodo del “cherry picking” a grosse quantità di dati (che si prestano più facilmente, proprio in virtù dell’intervento del caso, a rivelare significati “nascosti”).

Come verificare (e smascherare) le distorsioni (bias) dovute al caso sarà l’oggetto di un nostro prossimo intervento.

Stay Tuned!