Splunk dan Squeaky Dolphin: ketika Big Data menjadi nakal

melengkingdolphin-462x346
Splunk dan Squeaky Dolphin: ketika Big Data menjadi nakal

Splunk yang malang.

Produk perusahaan yang diberi nama aneh ini menganalisis “Big Data”. Seperti yang diklaimnya di situs webnya: “dengan memantau dan menganalisis segala sesuatu mulai dari aliran klik pelanggan dan transaksi hingga aktivitas jaringan dan catatan panggilan—dan banyak lagi—Splunk mengubah data mesin menjadi wawasan berharga, apa pun bisnis yang Anda jalani.” Bahkan jika bisnis itu adalah mengintip.

Oleh karena itu, tidak mengherankan jika produk ini mendapat tempat dalam pengumpulan Big Data terbesar: GCHQ rupanya menggunakan perangkat lunak analisis sentimen data untuk mengetahui apa yang dipikirkan orang-orang secara online. (Memang benar, Splunk mengiklankan di situsnya bahwa Departemen Pertahanan dan Keamanan Dalam Negeri AS menggunakan produk-produknya, jadi hal ini tidak mengherankan.)

Menurut salah satu kebocoran Snowden hari ini — Anda dapat membaca lebih lanjut tentang wahyu pengintaian lainnya di sini — GCHQ telah mengambil data online, seperti penayangan YouTube dan Suka di Facebook, dan menggunakan Splunk untuk menganalisis Big Data tersebut untuk mencoba memprediksi masalah.

Lumba-lumba yang melengking

Program yang sejujurnya disebut “Squeaky Dolphin” ini mengumpulkan aktivitas online secara real-time, menurut sebuah Laporan NBC News, bahkan memanfaatkan kabel fiber untuk mengungkap apa yang kami lakukan di YouTube, Facebook, dan Blogspot. Meskipun data individu dapat diekstraksi, Squeaky Dolphin “tidak tertarik pada individu, hanya tren luas”, menurut salah satu slide yang bocor. (Meskipun ini adalah GCHQ, anggap saja klaim tersebut tidak masuk akal.) Ia mencari Data Besar, bukan Data Kecil.

Contoh-contoh yang diberikan dalam GCHQ dianggap konyol bukan sebuah iklan untuk Big Data — dan perlu dicatat bahwa slide-slide tersebut diambil dari sebuah presentasinya kepada NSA, jadi ini merupakan upaya GCHQ untuk mengesankan rekan-rekannya atas pencapaiannya, dan kemungkinan besar akan mencakup contoh-contoh terbaik mungkin.

Jadi wawasan apa saja yang terungkap dari alat analisis data yang menakjubkan ini? Bagaimana browser yang berbeda mencerminkan tipe pengguna yang berbeda. Rupanya, pengguna Internet Explorer menunjukkan paling sedikit “keterbukaan terhadap pengalaman” dan paling “kesesuaian”, sementara pengguna Firefox lebih cenderung menunjukkan “neurotisme”.

Tidak jelas dari mana informasi tersebut berasal, dan apakah informasi tersebut benar-benar berasal dari analisis berbasis Splunk miliknya sendiri, namun GCHQ memutuskan bahwa informasi tersebut penting. Tentu saja saya merasa jauh lebih percaya diri dalam perang melawan teror.

Sebagian besar pekerjaan yang dilakukan lebih serius, dan sebagian merupakan upaya untuk menutupi kegagalan GCHQ dalam melihat secara online peningkatan ketegangan di Timur Tengah menjelang Arab Spring pada tahun 2011. Pada salah satu slide disebutkan bahwa mereka mengambil aktivitas web menjelang demonstrasi di Suriah dan Bahrain sehari sebelum demonstrasi tersebut berlangsung.

Sentimen yang bagus?

Memindai Twitter, halaman Facebook yang dapat dilihat publik, dan YouTube untuk mencari kata kunci tertentu untuk melihat kata kunci berikutnya titik nyala bukanlah ide yang bodoh - tetapi hal itu pasti bisa dilakukan di depan umum informasi. Memanfaatkan kabel serat optik dan sistem Google untuk mengembangkan kecerdasan “sentimen” yang dipertanyakan adalah langkah yang terlalu jauh, mengingat hasil yang terlihat jelas.

Memang benar, mudah untuk mempertanyakan apakah mungkin menganalisis begitu banyak data — feed real-time dari Facebook, YouTube, Blogger dan lainnya akan menjadi sangat sibuk — dan mendapatkan hasil yang berarti, meskipun departemen pemasaran Splunk kemungkinan besar akan melakukannya tidak setuju.

Kami meminta komentar dari perusahaan tersebut, dan Sherry Lowe, wakil presiden dan juru bicara perusahaan, mengatakan: “Splunk sangat memperhatikan privasi. Seperti halnya perangkat lunak apa pun yang digunakan oleh ribuan organisasi di seluruh dunia, kami biasanya tidak memiliki visibilitas mengenai bagaimana pelanggan individu dapat menggunakan produk kami.”

Nah, sekarang Splunk tahu bagaimana salah satu pelanggannya menggunakan produknya, seperti halnya kita semua — dan ini bukan iklan yang bagus untuk Big Data.