[Loca]Ilmu Statistik adalah Seni

Source
Source

Ilmu statistik adalah seni, itu dulu disebut oleh salah satu dosen saya. Tapi saya lupa siapa. Atau saya baca dalam buku teks ya? Anyway, hasil quick count Pilpres RI kesempatan bagus untuk refresh lagi, terutama mengkritisi beberapa penjelasan yang saya temukan online.

1. Tentang random sampling. Lha random (acak) itu bukan berarti tanpa aturan. Simpelnya, setiap unit sampel memiliki kesempatan yang sama untuk menjadi sampel. Jadi bisa saya, bisa tetangga depan, bisa tetangga belakang, dll. Penjelasan di sini tidak tepat, karena ada satu bagian dari populasi yang sepertinya dengan sampling strategy apapun, memiliki kesempatan lebih besar untuk menjadi sampel (yg di tengah, dibandingkan yg di pinggir-pinggir). Bukan itu artinya random. Random adalah misalnya di satu kompleks ada 100 rumah, diperlukan 10 sampel, maka dihitung tiap rumah ke 10, dan rumah pertama dipilih oleh komputer dari nomor rumah yang sudah dimasukkan ke dalam database, lantas berlanjut searah jarum jam. Dengan sampling strategy seperti ini, sebelum survey dilakukan, tidak ada yang bisa mengatakan bahwa rumah tertentu pasti jadi sampel dan rumah lain tidak. Atau rumah mewah memiliki kans menjadi sampel lebih besar, dibanding rumah sederhana. Bahkan ketika tiba di suatu rumah, dan ternyata tidak ada orang, harus sudah ada protokol untuk mengatur apa yang terjadi (apakah rumah di kiri atau kanan yang diambil, dan apakah untuk menentukannya dilakukan pelembaran koin, dll).

Tapi bahkan ketika metode sampling pun sudah sama, ada kemungkinan sampel tidak sama. Misalnya, sampel ditentukan bukan berdasarkan rumah, tapi berdasarkan nama kepala keluarga, yang sudah diurut alfabetis. Komputer memilih nama pertama untuk start penghitungan, dari 100 nama, dan sampel berikutnya adalah hitungan ke 10 bergerak ke alfabet dalam urutan berikutnya. Tapi kalau mengurut nama kepala keluarga ternyata terbalik, descending dan bukan ascending (jadi dari Z ke A), maka tentu 10 orang yang terpilih sebagai sampel pun tidak akan sama persis.

2. Tentang stratified random sampling. Di sini sebenarnya nilai seninya. Katakanlah anda ingin mengetahui berapa % wanita suka memakai lipstik warna merah. Kalau populasi anda adalah semua orang yg pernah membeli lipstik merah, maka untuk mengetahui apakah mereka suka memakai lipstik merah, anda hanya perlu sampel kecil, satu orang sudah cukup. Jawabannya sudah mereflesikan populasi tersebut.

[Hiperbole ini, tergantung populasinya juga sih, ada yang sudah beli tapi takut pakenya. Ah wanita!].

Kalau anda ingin tahu berapa % wanita yang sedang berada di Mall hari ini, suka memakai lipstick merah sehari-hari, tentu sampel sejumlah 1 tidak cukup representatif. Bila di Mall sekarang ada 1,000 orang, paling akurat untuk menanyakan kepada mereka semua. Tapi tidak perlu juga, kalau anda tahu profil dari seribu orang tsb. Misal dari 1,000 pengunjung tersebut ada 500 orang biarawati uzur yang sedang berkunjung mengadakan temu kangen. Dari 500 orang ini ya perlu sample sedikit saja, cukuplah untuk mengetahui mereka suka memakai lipstick merah atau tidak. Dari 500 orang lainnya, terbagi antara remaja, wanita dewasa, nenek2, dll, jumlah sampelnya tentu berbeda dengan si 500 biarawati, karena profil populasi tersebut lebih heterogen, perlu lebih banyak sampel.

Jelas bahwa untuk melakukan stratifikasi, perlu pengetahuan tentang populasi. Dan biasanya pengetahuan ini semakin terasah dengan pengalaman.

3. Jumlah sampel banyak berarti akurat? NO! Dengan contoh di atas, misal budget anda untuk interview 100 orang, dan anda ambil sampel 50 di kalangan biarawati, dan 50 di sisanya. Sedangkan saya, dengan budget untuk 60, ambil sampel 5 di biarawati dan 55 untuk 500 pengunjung lainnya. Hasil survey saya mungkin malah lebih akurat dibanding survey anda (dengan biaya yg lebih rendah pula). Sekali lagi, semakin berpengalaman, akan semakin efisien tanpa mengorbankan presisi. Sama saja dengan masak bubur ayam atau bikin velvet cake, ngerti takaran yang pas.

Yang paling presisi tentunya adalah penghitungan untuk seluruh populasi. Dalam hal ini, hasil dari 479,183 TPS seluruh Indonesia dan luar negeri. Sebenarnya di jaman teknologi tidak sulit, tapi saya tetap takjub bahwa hasil scan form rekapitulasi bisa kita lihat sendiri di website KPU: http://pilpres2014.kpu.go.id/c1.php

Saya pikir, ini upaya yang sangat baik dari KPU untuk transparan dan adil. Kita bisa cek satu2 tentunya. Saya sudah cek TPS saya, bagaimana dengan anda?

Thoughts? Leave a comment!