Prediksi dari sensor manusia

Memprediksi masa depan sudah menjadi obsesi manusia sejak awal peradaban. Berbagai alat dipakai untuk prediksi ini dari mulai bola kristal, kartu, hingga komunikasi dengan arwah. Selain itu, ada juga kelompok lain yang berusaha menggunakan alat lain untuk prediksi, yaitu data. Terutama data dari sensor manusia seperti kutipan dari artikel berikut:

“We’re finally in a position where people volunteer information about their specific activities, often their location, who they’re with, what they’re doing, how they’re feeling about what they’re doing, what they’re talking about,” said Johan Bollen, a professor at the School of Informatics and Computing at Indiana University Bloomington who developed a way to predict the ups and downs of the stock market based on Twitter activity. “We’ve never had data like that before, at least not at that level of granularity.” Bollen added: “Right now it’s a gold rush.”

Komputasi + data = rekayasa sosial

Sebuah artikel di New York Times membahas sebuah tren yang sedang tumbuh yaitu 1) kekuatan komputasi dan 2) keberadaan sensor. Cloud computing membuat dunia akan terselimuti oleh program komputer yang semakin hari bertambah terus kapasitas proses dan penyimpanan datanya. Sensor semakin ada dimana-mana dari ponsel, kendaraan, hingga jutaan “sensor manusia” yang cerewet di media sosial seperti twitter.

Gabungkan kekuatan komputasi dan data-data dari sensor-sensor tersebut maka yang diperoleh adalah kemampuan menganalisis diri kita sendiri, baik sebagai individu atau sebagai masyarakat sosial; sebuah kemampuan yang pertama kalinya  ada sepanjang sejarah umat manusia. Selain analisis, juga akan berkembang algoritma untuk memprediksi dan mengintervensi dinamika sosial: sebuah era baru rekayasa sosial dalam arti sesungguhnya.

Di bagian akhir artikel tersebut tertulis

With the continuing exponential increase in the power of the planetary computer, one has to wonder whether we stand at the beginning of what Isaac Asimov’s “Foundation” series, more than 60 years ago, called “psychohistory.” His visionary genius Hari Seldon believed that statistical forecasting of human society’s actions would be possible with data from enough people throughout the galaxy.

 

Jangan-jangan ini adalah manifestasi dari sebuah pola sejarah: cerita fiksi sains menjadi kenyataan.

Seberapa kecilkah dunia kecil? (2)

Dari pembahasan sebelumnya, kita sudah bahas mengenai tidak adanya alasan teoritis mengapa derajat keterpisahan harus berupa suatu angka, misalnya 6 atau 4. Juga kita telah bahas kemungkinan bias yang terjadi ketika menggunakan jejaring sosial facebook.

Dalam studi terakhir pengukuran derajat keterpisahan digunakan jejaring sosial facebook yang terdiri dari sekitar 721 juta pengguna dan sekitar 69 milyar relasi pertemanan (untuk analisis mereka menggunakan hanya satu(!) buah komputer 24-core dengan RAM 72GB dan hard drive sebesar 1TB) . Dengan data ini mereka mengukur jarak rata-rata yang diperlukan untuk menghubungkan dua akun pengguna. Hasilnya diperoleh sekitar 4 derajat keterpisahan.

Metode pengukuran tersebut berbeda dengan metoda pengukuran derajat keterpisahan dengan eksperimen; metode eksperimen inilah yang digunakan oleh Milgram dan studi-studi lanjutannya (metode ini selanjutnya dikenal sebagai metode dunia kecil).

Ketika metode eksperimen dunia kecil digunakan, hasil yang diperoleh bukan saja adanya rantai pertemanan yang pendek antar dua orang melainkan juga fakta bahwa orang dapat menemukan rantai pendek tersebut.

Jadi sebetulnya ada dua aspek yang saling berhubungan dengan dunia kecil ini. Pertama adalah masalah struktur dimana pertanyaannya adalah apakah ada rantai pendek menghubungkan dua orang? Kedua, masalah algoritmik yang bertanya apakah orang dapat menemukan rantai pendek tersebut? Jikapun rantai pendek ada, belum tentu orang dapat menemukannya karena pengetahuan individu terbatas hanya pada jejaring lokal individu tersebut; padahal untuk tahu sebuah rantai pendek perlu pengetahuan jejaring global.

Jika kita fokus pada dunia kecil versi algoritmik, maka kita telah pergi dari masalah struktural dunia kecil ke masalah dinamika penyelesaian masalah secara kolektif. Dengan kata lain, dari social network ke social networking.

Masalah social networking ini masih belum banyak diteliti. Padahal ini masalah penting dimana permasalahan disini adalah bukan lagi soal apa struktur jejaring sosial, tapi soal bagaimana individu dapat memanfaatkan jejaring sosial. Jika kita mengetahui bagaimana individu bisa menggunakan jejaring sosial untuk berbagai tujuan (misalnya mobilisasi, pencarian, atau penyelesaian masalah kolektif lainnya), maka kita sudah masuk ranah aplikasi jejaring sosial yang signifikan untuk bisnis, kebijakan publik, atau masalah individu sehari-hari.

Jadi, menurut saya, jika angka derajat keterpisahan berubah-ubah bukanlah hal yang mengejutkan; selama angkanya kecil dibanding ukuran populasinya maka ia memberikan informasi yang sama yaitu adanya rantai pendek. Yang lebih menarik dan penting ditelaah adalah bagaimana individu dapat menemukan dan mengakses rantai pendek ini; dengan kata lain, riset dunia kecil versi algoritmiklah yang berkemungkinan besar memberi kita pengetahuan baru.

Referensi:

Riset pengukuran derajat keterpisahan di facebook dapat dibaca detailnya disini: http://arxiv.org/abs/1111.4570.

Pembahasan metode eksperimen dunia dunia kecil diantaranya ada di:

 

Seberapa kecilkah dunia kecil? (1)

Beberapa hari yang lalu diberitakan bahwa sebuah riset menemukan derajat keterpisahan (degrees of separation) bukan lagi 6 tetapi 4,74. Artinya, jumlah pertemanan yang diperlukan untuk menghubungkan dua orang yang tak saling kenal bukan lagi 6, tetapi 4. Saya menghabiskan beberapa tahun meneliti soal ini sehingga saya ingin berkomentar.

Soal angka pasti derajat keterpisahan.

Sebutan six degrees of separation adalah judul sebuah pertunjukan teater – yang selanjutnya difilmkan juga – yang mengambil ide dari riset dunia kecil yang dilakukan oleh si genius Stanley Milgram. Pada tahun 1960an Milgram membuat eksperimen dimana peserta eksperimen harus mengirimkan pesan (yang dikirim menggunakan pos) ke seseorang yang disebut target. Milgram menemukan bahwa rata-rata diperlukan 6 lompatan agar pesan tersebut sampai ke target. Hasil inilah yang digunakan oleh John Guarre sebagai judul pertunjukan teater Broadway.

Riset-riset berikutnya menunjukkan memang derajat keterpisahan berkisar diantara 6. Tetapi, ini penting, sebetulnya tidak ada alasan teoritis kenapa harus 6. Yang penting adalah bukan angka pasti derajat keterpisahan itu, tetapi derajat keterpisahan haruslah kecil jika dibanding total populasi. Jadi jika kita berbicara populasi dunia 7 milyar orang, angka 100 pun sebetulnya masih bisa dianggap kecil.

Secara teknis, yang penting soal derajat keterpisahan adalah: derajat keterpisahan bertambah seiring dengan jumlah populasi dalam skala logaritmik. Untuk ilustrasi lihat gambar dibawah.

Sumbu horizontal adalah jumlah populasi, sumbu vertikal adalah derajat keterpisahan. Terlihat ada dua kurva pertumbuhan: garis putus-putus adalah pertumbuhan linear, sedangkan garis penuh adalah pertumbuhan logaritmik. Jika derajat keterpisahan tumbuh secara linear, maka semakin besar populasinya akan semakin besar pula derajat keterpisahannya. Tetapi, jika tumbuhnya secara logaritmik, meskipun semakin besar populasi, pada titik tertentu pertumbuhan derajat keterpisahan akan melambat. Artinya meskipun populasi menjadi besar sekali, derajat keterpisahan tidak berubah banyak.

Jadi secara teknis, angka derajat keterpisahan bisa berapa saja asal  mengikuti pertumbuhan logaritmik.

OK, angka pasti derajat keterpisahan tidak terlalu penting. Tapi kan riset ini pasti memberitahu kita sesuatu? Misalnya,

Dulu 6 sekarang 4, apakah itu berarti dunia semakin kecil?

Bisa iya, bisa juga tidak. Kalo untuk ‘iya’, kita bisa mengambil kesimpulan bahwa revolusi digital membuat dunia semakin kecil. Tapi mengapa bisa ‘tidak’?

Riset ini dilakukan dengan menggunakan data facebook. Btw, ini adalah contoh bagaimana perusahaan digital sekarang memiliki data penting & menarik dalam jumlah besar, dan sebagian mampu memanfaatkannya secara keren.

Karena riset hanya menggunakan data facebook, bisa saja angka 4 ini merupakan “derau” dari estimasi derajat keterpisahan. Misalnya, data ini bisa memiliki bias karena facebook adalah tempat orang berteman. Artinya, facebook adalah jejaring sosial unik dimana setiap orang cenderung berteman dengan orang lain. Secara teknis, bisa dilihat dari gambar berikut:

Di gambar sebelah kiri, A berteman dengan B dan C sehingga membentuk segitiga terbuka. Facebook tempat berteman artinya jika A berteman dengan B dan C maka kemungkinan besar B dan C berteman juga; sehingga membentuk segitiga tertutup seperti gambar disebelah kanan. Jadi facebook bias karena lebih banyak segitiga tertutup dibanding segitiga terbuka. Dalam jargon sains jejaring sosial, bertemannya B dan C ini disebut juga sebagai triadic closure.

Jadi riset dari facebook yang menyatakan derajat keterpisahan adalah 4 bisa jadi hanya berlaku di tempat dimana lebih banyak segitiga tertutup seperti facebook itu sendiri. Jejaring sosial secara umum dapat memiliki lebih banyak segitiga terbuka sehingga derajat keterpisahannya semakin besar juga.

Riset yang menggunakan data facebook ini adalah riset observasi dimana periset menghitung rata-rata derajat keterpisahan untuk seluruh jejaring sosial di facebook. Tetapi ingat bahwa riset orisinalnya oleh Milgram maupun tim kami dulu di Columbia adalah riset eksperimen; dimana peserta diminta secara aktif mengirimkan pesan ke seorang target. Perbedaan ini juga memberikan perbedaan interpretasi soal derajat keterpisahan ini. Tapi ini bahan untuk posting berikutnya.