Senin, 14 November 2011

Sekilas Sampel

Sampel merupakan suatu hal yang wajib dilibatkan ketika kita melakukan suatu riset. Berapa banyak sampel yang harus diambil, berapa persen proporsinya, dan berapa presisi yang harus ditentukan, merupakan pertanyaan-pertanyaan yang selalu muncul dalam pengambilan sampel.

Secara umum, syarat sampel yang baik adalah yang dapat mewakili sebanyak mungkin karakteristik populasi. Dengan kata lain, sampel tersebut harus valid, artinya mengukur sesuatu yang harusnya diukur. Tentunya jika ingin meneliti tingkat kecerdasan anak sma tingkat jawa barat, kita tidak hanya meneliti yang sma di kota bandung saja, ya kan.

Nah, ada 2 hal yang wajib diperhatikan untuk mencapai sampel yang valid, yaitu akurasi dan presisi.

Akurasi dapat diartikan tingkat ketidakadaan bias dalam sampel. Agar sampel dapat memprediksi dengan baik suatu populasi, sampel harus mempunyai selengkap mungkin karakteristik populasi. Dan perlu diketahui bahwa akurasi prediktibilitas dari suatu sampel tidak bisa dijamin dengan banyaknya sampel.

Presisi. Jika berbicara mengenai presisi, artinya kita sudah berbicara mengenai estimasi. Presisi mengacu pada persoalan sedekat mana statistik kita dengan parameternya. Contoh, hasil survei berdasarkan sampel yang kita punya, rata-rata pendapatan orang indonesia 5juta, sedangkn berdasarkan perhitungan badan pemerintah yg notabene hasil sensus, rata-rata pendapatan orang Indonesia adalah 5,2 juta. Nah  ada perbedaan  0,2 juta dalam estimasi kita yang disebut sampling error. Semakin kecil perbedaan tersebut, semakin tinggi tingkat presisi sampel kita. Presisi sendiri berkaitan dengan interval konfidensi (CI), misalnya CI kita 4,75juta - 5,25juta. Karena statistik kita 5juta, maka perbedaan 0,25juta dari nilai estimasi kita disebut sebagai presisi. Dan perlu diketahui bahwa dalam estimasi, ada juga yang disebut confidence level atau tingkat kepercayaan, dengan besaran biasanya 90%, 95%, atau 99%, yang berarti bahwa dengan besaran tingkat kepercayaan tersebut, kita yakin bahwa rata-rata populasi berada pada selang interval konfidensi yang kita buat. Dianggap bahwa semakin lebar selang kepercayaan, semakin jelek estimasi tersebut (poor estimate). Tentunya setiap peneliti menginginkan selang kepercayaan yang sempit, yang berarti  balik lagi ke tingkat presisinya yang harus tinggi. Tapi masalahnya adalah parameter populasi tak pernah diketahui,  so bagaimana bisa kita menentukan presisi?

Sebetulnya ukuran sampel bergantung pada derajat keseragaman, presisi yang dikehendaki, rencana analisis data dan fasilitas yang tersedia (Singarimbun dan Effendi, 1982). Bagaimana cara menentukan presisi, banyak hal yang turut mempengaruhi, misalnya masalah waktu, objek penelitiannya apa, dan biasanya yang paling paling mempengaruhi adalah masalah biaya. :p.

 Presisi diukur oleh simpangan baku (standard error). Makin kecil perbedaan di antara simpangan baku yang diperoleh dari sampel dengan simpangan baku dari populasi, makin tinggi pula tingkat presisinya. Walau tidak selamanya, tingkat presisi mungkin  bisa meningkat dengan cara menambahkan jumlah sampel, karena kesalahan mungkin bisa berkurang kalau jumlah sampelnya ditambah ( Kerlinger, 1973 ).

Akurasi dan presisi, gambaran lebih jelasnya bisa dilihat disini.

Tentunya jika kita mencoba idealis, dimana kita menginginkan hasil survei dengan interval konfidensi yang sempit, maka kita setting tingkat presisi yang tinggi pula. Yang pastinya dengan tingkat presisi yang tinggi tersebut kita harus siap dengan jumlah sampel yang cukup besar, karena ukuran sampel berbanding terbalik dengan kuadrat presisi.

L. Naing, T. Winn, B.N. Rusli mengutarakan artikel yang cukup bagus mengenai perhitungan presisi ini. Saya copas aja semuanya disini ya :D.

 Determining Precision (d)

What is the appropriate precision for prevalence studies? Most of the books or guides show the steps to calculate the sample size but there is no definite recommendation for appropriate d. Investigators generally ends up with the ball-park figures of the study sizes usually based on their limitations such as financial resources, time or availability of subjects. However, we should calculate the sample size with a reasonable or acceptable precision and then allowing for other limitations. In our experience, it is appropriate to have a precision of 5% if the prevalence of the disease is going to be between 10% and 90%.
This precision will give the width of 95% CI as 10% (e.g. 30% to 40%, or 60% to 70%). However, when the prevalence is going to be below 10% or more than 90%, the precision of 5% seems to be inappropriate. For example, if the prevalence is 1% (in a rare disease) the precision of 5% is obviously crude and it may cause
problems. The obvious problem is that 95% CIs of the estimated prevalence will end up with irrelevant negative lower-bound values or larger than 1 upper bound values as seen in the Table 1. Therefore, we recommend d as a half of P if P is below 0.1 (10%) and if P is above 0.9 (90%), d can be {0.5(1-P)}. For example, if P is 0.04, investigators may use d=0.02, and if P is 0.98, we recommend d=0.01. Figure 1 is plotted with this recommendation. Investigators may also select a smaller precision than what we suggest if they wish.However, if there is a resource limitation,investigators may use a larger d. In case of apreliminary study, investigators may use a larger d (e.g. >10%). However, justification for the selection of d should be stated clearly (e.g. limitation of resources) in their research proposal so that reviewers will be well informed. In addition, the larger d should meet the assumption of normal approximation that we will discuss later.


Artikel lengkapnya, unduh disini nih..

Intinya adalah, dalam menentukan jumlah sampel, batasan yang harus diperhatikan:
  • Tentukan tujuan risetnya
  • Tentukan respondennya, dari sini kita bisa tau pake sampling apa, random atau non random, kalo random, pake metode sampling random apa, kalo non random pake metode sampling non random apa
  • Bikin kerangka samplingnya
  • Merunut ke tujuan survei, pastinya kita udah tau responden di wilayah mana yg mau disurvei..inget musti valid..
  • Merunut ke tujuan survei lagi, pastinya kita udah tau berapa lama waktu yang kita punya untuk riset kita, begitupun dengan dana yang kita punyai. Jika Anda udah menentukan jumlah sampel, dan ternyata dengan waktu atau dana yang Anda punya tidak cukup, maka mungkin sampelnya harus dikurangin, dengan cara menurunkan tingkat presisinya. Jika ternyata sample yang Anda ambil bahkan kurang dari sepertiganya, it's fine, asalkan dapat dipertanggungjawabkan, dan pastinya langkah pengambilan sampel sesuai dengan kaidah statistik plus sampel Anda representatif :D.