Splunk e lo Squeaky Dolphin: quando i Big Data diventano disonesti

squeakydolphin-462x346
Splunk e lo Squeaky Dolphin: quando i Big Data diventano disonesti

Povero Splunk.

I prodotti dell’azienda dal nome strano analizzano i “Big Data”. Come afferma sul suo sito web: “monitorando e analizzando tutto, dai flussi di clic dei clienti e dalle transazioni all'attività di rete e registri delle chiamate e altro ancora: Splunk trasforma i dati della macchina in informazioni preziose, indipendentemente dall'attività che svolgi." Anche se quell'attività lo è curiosare.

Non dovrebbe sorprendere, quindi, che abbia trovato un posto nel più grande bottino di Big Data: a quanto pare GCHQ utilizza il suo software di analisi del sentiment dei dati per capire cosa pensano le persone online. (In effetti, Splunk pubblicizza sul suo sito che il Dipartimento di Difesa e Sicurezza Nazionale degli Stati Uniti utilizza i suoi prodotti, quindi non dovrebbe sorprendere.)

Secondo una delle rivelazioni di Snowden del giorno (puoi leggere di più sull'altra rivelazione di spionaggio qui) GCHQ è stato raccogliendo dati online, come visualizzazioni di YouTube e Mi piace di Facebook, e utilizzando Splunk per analizzare tali Big Data per cercare di prevedere guaio.

Delfino stridulo

Il programma, che onestamente si chiama “Squeaky Dolphin”, raccoglie l'attività online in tempo reale, secondo un NBC News riporta, arrivando addirittura a intercettare cavi in ​​fibra per scoprire cosa stiamo facendo su YouTube, Facebook e Blogspot. Sebbene i dati degli individui possano essere estratti, Squeaky Dolphin “non è interessato agli individui, ma solo alle tendenze generali”, secondo una delle diapositive trapelate. (Anche se, trattandosi del GCHQ, prendi questa affermazione con le pinze.) Sta cercando Big Data, non piccoli frammenti di dati.

Non è tanto una pubblicità per i Big Data il fatto che gli esempi del GCHQ risultino piuttosto sciocchi – e vale la pena notare che le diapositive in questione sono state prese da un presentazione alla NSA, quindi questo sarebbe stato il tentativo del GCHQ di impressionare i suoi colleghi sui suoi risultati e probabilmente avrebbe incluso i migliori esempi possibile.

Quali informazioni ha rivelato questo straordinario strumento di analisi dei dati? In che modo i diversi browser riflettono diversi tipi di utenti. A quanto pare, gli utenti di Internet Explorer mostrano la minore “apertura all’esperienza” e la massima “gradevolezza”, mentre gli utenti di Firefox sono leggermente più propensi a mostrare “nevroticismo”.

Non è chiaro da dove provengano le informazioni e se effettivamente provengano dalla propria analisi basata su Splunk, ma il GCHQ ha deciso che sono importanti. Certamente mi sento molto più fiducioso riguardo alla guerra contro il terrorismo.

Gran parte del lavoro è più serio, e in parte serve a compensare l’incapacità del GCHQ di individuare online le crescenti tensioni in Medio Oriente in vista della Primavera Araba del 2011. In una diapositiva si nota che l’attività sul web è aumentata prima delle manifestazioni in Siria e Bahrein il giorno prima che avessero luogo.

Buon sentimento?

Scansione di Twitter, delle pagine Facebook pubbliche e di YouTube per determinate parole chiave per vedere dove si trova la successiva Il punto critico non sarà un’idea stupida, ma è sicuramente possibile farlo con il pubblico informazione. Sfruttare i cavi in ​​fibra e i sistemi di Google per sviluppare una discutibile “sentiment intelligence” è ancora un altro passo troppo lontano, anche visti i risultati apparenti.

In effetti, è facile chiedersi se sia possibile analizzare così tanti dati: un feed in tempo reale di Facebook, YouTube, Blogger e altri saranno piuttosto impegnati e otterranno un risultato significativo, anche se probabilmente il reparto marketing di Splunk lo farebbe disaccordo.

Abbiamo chiesto all'azienda un commento e Sherry Lowe, vicepresidente e portavoce dell'azienda, ha affermato: “Splunk prende molto sul serio la privacy. Come con qualsiasi software utilizzato da migliaia di organizzazioni in tutto il mondo, in genere non abbiamo visibilità su come i singoli clienti potrebbero utilizzare i nostri prodotti”.

Bene, ora Splunk sa come uno dei suoi clienti utilizza i suoi prodotti, così come tutti noi, e non è una grande pubblicità per i Big Data.