Wahid Smart Blog: Reliabilitas dan Validitas Tes

BAB I
PENDAHULUAN

Kegiatan evaluasi memerlukan penggunaan informasi yang diperoleh melalui pengukuran maupun dengan cara lain untuk menentukan pendapat yang membuat keputusan-keputusan pendidikan.
Pendapat dan keputusan tentu saja akan dipengaruhi oleh kesan pribadi dan sistem nilai yang ada pada si pembuat keputusan.

BAB II
PEMBAHASAN

Reliabilitas
Reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapan pun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama.
Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil pada saat yang berlainan waktunya terhadap siswa yang sama. Misalnya siswa kelas V pada hari ini dites kemampuan matematiknya. Minggu berikutnya siswa tersebut dites kembali. Hasil dari kedua tes relatif sama. Sungguh pun demikian, masih mungkin terjadi ada perbedaan hasil untuk hal-hal tertentu akibat faktor kebetulan, Selang waktu, atau terjadinya perubahan pandangan siswa terhadap soal yang sama. Jika ini terjadi, kelemahan terletak dalam tes itu, yang tidak memiliki kepastian jawaban atau meragukan siswa. Dengan kata lain, derajat reliabilitasnya masih rendah.
Di lain pihak perbedaan hasil penilaian bukan disebabkan oleh alat penilaiannya, melainkan oleh kondisi yang terjadi pada diri siswa. Misalnya fisik siswa dalam keadaan sakit pada waktu tes yang pertama, motivasi pada waktu tes pertama berbeda dengan motivasi tes pada berikutnya.
Atas dasar itu perbedaan hasil penilaian pertama dengan hasil penilaian berikutnya bisa terjadi akibat perubahan pada diri subjek yang dinilai dan atau oleh faktor yang berkaitan dengan pemberian tes itu sendiri. Hal ini tidak mengherankan dan sudah umum terjadi, yang sering dinyatakan dengan istilah kesalahan penilaian. Ini berarti, skor hasil penilaian yang pertama dan skor hasil penilaian kedua terhadap subjek yang sama, terjadi kesalahan pengukuran yang dimungkinkan oleh kedua faktor di atas. Oleh karenanya, setiap skor hasil penilaian menghasilkan dua bagian, yakni hasil penilaian pertama yang disebut skor sejati dan hasil penilaian berikutnya terhadap subjek yang sama, yang mengandung hasil skor plus kesalahan penilaian.
Indeks reliabilitas alat penilaian dapat dicari dengan mengorelasikan skor-skor yang diperoleh dari hasil penilaian yang berulang-ulang pada waktu yang berbeda atau dengan kelompok pertanyaan yang sepadan. Prosedur ini dilakukan dengan cara memberikan tes dua kali kepada subjek yang sama pada waktu yang berbeda. Cara kedua adalah membagi tes menjadi dua bagian yang sama atau yang setaraf untuk melihat keajegan tes tersebut. Cara yang pertama dikenal dengan tes ulang (retest) dan cara kedua dikenal dengan pecahan sebanding atau setara.
Suatu tes dapat dikatakan baik bilamana tes tersebut memiliki ciri sebagai alat ukur yang baik. Kriterianya antara lain :
Memiliki validitas yang cukup tinggi,
Memiliki reliabilitas yang baik,
Memiliki nilai kepraktisan.
Validitas dan reliabilitas akan diuraikan secara mendalam pada bagian ini; sedangkan mengenai kepraktisan hanya akan disinggung sedikit.
Tes memiliki sifat kepraktisan artinya praktis dari segi perencanaan, pelaksanaan penggunaan tes, dan memiliki nilai ekonomik, di samping masih harus mempertimbangkan kerahasiaan tes. Jangan sampai hanya atas dasar murahnya dan mudahnya pengolahan hasil sampai mengorbankan prinsip utamanya yakni validitas dan reliabilitasnya.

Validitas Tes
Pengertian Validitas
Validitas sering diartikan dengan kesahihan, sedangkan reliabilitas diartikan dengan keterandalan. Suatu alat ukur disebut memiliki validitas bilamana alat ukur tersebut isinya layak mengukur obyek yang seharusnya diukur dan sesuai dengan kriteria tertentu. Artinya adanya kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran.
Bilamana alat ukur tidak memiliki validitas yang dapat dipertanggungjawabkan, maka data yang masuk juga sis dan kesimpulan yang ditarik juga menjadi salah.
Adapun jenis validitas tes secara umum dapat dikelompokkan ke dalam tiga pengelompokan, yaitu :
Validitas konstruksi,
Validitas isi, dan
Validitas kriteria, yang meliputi :
Validitas pengukuran setara
Validitas pengukuran serentak
Validitas prediktif.

Hubungan Antara Validitas dengan Reliabilitas
Umumnya orang berpendapat bahwa validitas mempunyai hubungan proporsional dengan reliabilitas. Orang menduga bahwa semakin valid suatu tes, semakin reliabel dan sebaliknya. Dugaan itu tidak sepenuhnya salah, tetapi juga tidak sepenuhnya betul (Noeng Muhadjir, 1984:56).
Ada kemungkinan hubungan antara validitas reliabilitas itu bersifat independent, bebas satu sama lain dan dapat pula bersifat detrimental.
Bila tes itu heterogen, mungkin mempunyai reliabilitas keajegan internal rendah, tetapi mempunyai validitas prediktif yang tinggi. Bila suatu tes bersifat homogen mungkin sekali mempertinggi reliabilitas tanpa mempengaruhi validitas, misalnya dengan menambah item tanpa menambah varians menambah varians dalam faktor umum yang tidak bersangkutan dengan kriteria.
Tujuan validitas dan reliabilitas seringkali bersilangan. Bila kita ingin mempunyai suatu tes reliabel sekaligus valid dengan koefisien tinggi, sering kita mengerjakan pekerjaan yang mempunyai tujuan bersilangan. Reliabilitas maksimal membutuhkan interkorelasi tinggi antar item, sedangkan validitas prediktif yang maksimal memerlukan interkorelasi antar item rendah. Reliabilitas maksimal membutuhkan item dengan tingkat kesukaran sama, sedangkan validitas prediktif maksimal menuntut tes memiliki taraf kesukaran berbeda, sehingga perlu kompromi.
Bila kita ingin mempertinggi reliabilitas suatu tes dan sekaligus mempertinggi validitas, cara yang dapat ditempuh adalah menambah varians faktor umum (Noeng Muhadjir, 1984:56-57).
Namun jika langkah ini kita ambil, sebaiknya diperhitungkan apakah penambahan faktor umum ini dapat terjangkau oleh peserta didik. Oleh karena itu perlu dalam penentuan perencanaan, terutama dalam penyusunan kisi-kisi tes, faktor umum yang akan diperbanyak itu diperhitungkan juga jangan terlalu keluar dari program dan proses pendidikan sebelumnya.

Reliabilitas Tes
Pengertian Reliabilitas
Reliabilitas sering diartikan dengan keterandalan. Artinya suatu tes memiliki keterandalan bilamana tes tersebut dipakai mengukur berulang-ulang hasilnya sama. Dengan demikian reliabilitas dapat pula diartikan dengan keajegan atau stabilitas.
Reliabilitas diartikan dengan keajegan bilamana tes tersebut diujikan berkali-kali hasilnya relatif sama, artinya setelah hasil tes pertama dengan tes berikutnya dikorelasikan terdapat hasil yang signifikan. Di samping itu dapat diketahui dengan jalan menggunakan dobel tes, artinya disusun dua buah tes yang parallel, kemudian keduanya diujikan dan hasilnya dikorelasikan. Bila kedua hasil tersebut menunjukkan korelasi positif dan signifikan, maka tes tersebut memiliki keajegan.
Reliabilitas diartikan dengan stabilitas bilamana tes itu diujikan dan hasilnya diadakan analisis reliabilitas dengan menggunakan kriteria internal dalam tes tersebut. Cara untuk mengetahui koefisien stabilitas ini adalah dengan beberapa rumus yang seluruhnya cukup menggunakan satu tes dengan sekali diujikan kepada siswa.

Teknik Pengujian Reliabilitas Tes Hasil Belajar
Sebagaimana telah dikemukakan dalam pembicaraan terdahulu, dalam fungsinya sebagai alat pengukur hasil belajar, tes hasil belajar dapat dibedakan menjadi dua golongan, yaitu: tes hasil belajar bentuk uraian yang dikenal dengan istilah essay test atau subyektif test, dan tes hasil belajar bentuk obyektif yang dikenal dengan istilah obyektif test atau new type test.
Sehubungan dengan itu maka dalam pembicaraan mengenai cara menentukan reliabilitas tes hasil belajar, pertama-tama akan dikemukakan tentang cara menentukan reliabiitas tes hasil belajar bentuk uraian dan setelah itu akan disusul dengan pembicaraan mengenai cara-cara menentukan reliabilitas tes hasil belajar bentuk obyektif.
Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Uraian
Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum, pada umumnya orang menggunakan sebuah rumus yang dikenal dengan nama Rumus Alpha. Adapun rumus alpha dimaksud adalah:
r11¬ = (n/(n-1))(1-(∑▒s_i^2 )/(s_t^2 ))
di mana : r11 = Koefisien reliabilitas tes
n = Banyaknya butir item yang dikeluarkan dalam tes
1 = Bilangan konstan
∑▒s_i^2 = Jumlah varian skor dari tiap-tiap butir item
s_t^2 = Varian total
dengan penjelasan lebih lanjut, bahwa :
∑▒s_i^2 dapat diperoleh dengan menggunakan rumus seperti tertera di bawah ini. Misalkan tes uraian yang akan ditentukan reliabilitasnya terdiri dari 5 butir item, maka ∑▒s_i^2 dapat diperoleh dengan jalan menjumlahkan varian dari item nomor 1 sampai dengan item nomor 5 :
∑▒s_i^2 = s_i1^2 + s_(i2 )^2+ s_i3^2 + s_i4^2 + s_i5^2
Sedangkan s_i1^2 , s_i2^2 , s_i3^2 , s_i4^2 , dan s_i5^2 itu sendiri, dapat diperoleh dengan menggunakan rumus sebagai berikut:
S_i1^2 = (〖ΣX〗_(i1 )^2- (〖ΣX〗_i1/N)2)/N
S_i2^2 = (〖ΣX〗_(i2 )^2- (〖ΣX〗_i2/N)2)/N
S_i3^2 = (〖ΣX〗_(i3 )^2- (〖ΣX〗_i3/N)2)/N
Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif
Berbeda dengan tes hasil belajar bentuk uraian, maka pàda tes hasil belajar bentuk obyektif penentuan reliabiitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan. Ketiga macam pendekatan dimaksud adalah: (1) Pendekatan Single Test-Single Trial (Single Test-Single Trial Method), (2) Pendekatan Test-Retest (Single Test-Double Trial Method), dan (3) Pendekatan Alternate Form (Double Test- Double Trial Method).
Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif dengan Menggunakan Pendekatan Single Test-Single Trial (Single Test-Single Trial Method)
Dalam rangka menentukan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan single test-single trial, maka penentuan reliabilitas tes tersebut dilakukan dengan jalan melakukan pengukuran terhadap satu kelompok subyek, di mana pengukuran itu dilakukan dengan hanya menggunakan satu jenis alat pengukur.
Pendekatan Single Test-Single Trial dengan Menggunakan Formula Rulon
Berbeda dengan formula Spearman-Brown dan formula Flanagan, menurut Rulon, petunjuk tentang tinggi rendahnya reliabiitas tes itu dapat diperoleh lewat perbedaan antar skor-skor yang berhasil dicapai oleh testee pada belahan I dengan belahan II. Perbedaan skor-skor antara belahan I dengan belahan II dilambangkan dengan huruf d (singkatan dari difference), di mana d = (X - Y).
Rumus yang dikemukakan oleh Rulon untuk mencari Koefisien Reliabilitas Tes (r11) adalah sebagai berikut:
r11 = 1- (s_d^2)/(s_t^2 )
dimana :
r11 = Koefisien reliabilitas tes
1 = Bilangan konstan
s_d^2 = Varian perbedaan antarskor yang dicapai oleh testee pada belahan I dengan skor yang dicapai oleh testee pada belahan II
s_t^2 = Varian total

Mengukur Reliabilitas dengan Rumus Alpha
Rumus lain yang dapat dipakai untuk mengukur homogenitas tes adalah rumus Alpha. Menurut Cronbach, rumus Alpha dapat digunakan untuk mengukur reliabilitas tes yang menggunakan skala Likert (skala sikap), tes yang menggunakan bentuk esai, sehingga pengukurannya tidak hanya menggunakan skor benar = 1 dan salah = 0, seperti pada tes obyektif, melainkan dapat menggunakan skor atau skala 1-9; 1-10 dan sebagainya.
Cara yang diternpuh untuk mengetahui tingkat reliabilitas tes ini adalah dengan jalan mencari varians pada tiap-tiap butir dan varians pada skor totalnya, baru dikalikan dengan proporsi item.
Dilihat dari segi ketelitiannya dan pola kerjanya rumus ini mirip dengan rumus K-R.20. Karena rumus ini banyak menggunakan perhitungan untuk mencari varians pada masing-masing item, maka para mahasiswa diminta agar mengikuti langkah demi langkah dengan teliti.
Adapun rumus Alpha itu sendiri adalah:
r11 = {k/(k-1)}{1- (〖SD〗_b^2)/(〖SD〗_t^2 ) }
Keterangan:
〖SD〗_b^2 = jumlah varians (standar deviasi kuadrat butir)
Adapun langkah secara umum yang ditempuh untuk mencari reliabilitas tes ini adalah:
menyusun sebuah tes sebaiknya jumlah nomornya genap, sehingga bila di belah jumlahnya sama.
mengujikan tes tersebut pada satu sampel.
menghitung skor masing-masing peserta didik dalam dua kelompok skor, dapat dikelompokkan skor ganjil dan genap; dapat pula dikelompokkan skor belahan atas dan skor belahan bawah.
mencari reliabilitas setengah tes, dengan jalan mengkorelasikan kedua skor tersebut dengan rumus Product Moment, atau mencari deviasi pada belahan ganjil genap.
mencari reliabilitas satu tes penuh dengan menggunakan rumus Spearman Brown atau rumus lainnya?
Beberapa rumus untuk mencari tingkat reliabilitas yang menggunakan teknik belah dua adalah:
Rumus Spearman Brown
Rumus Flanagan
Rumus Rulon.

BAB III
PENUTUP
Kesimpulan
Reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Validitas sering diartikan dengan kesahihan, sedangkan reliabilitas diartikan dengan keterandalan.
Adapun jenis validitas tes secara umum dapat dikelompokkan ke dalam tiga pengelompokan, yaitu :
Validitas konstruksi,
Validitas isi, dan
Validitas kriteria, yang meliputi :
Validitas pengukuran setara
Validitas pengukuran serentak
Validitas prediktif.
Ada kemungkinan hubungan antara validitas reliabilitas itu bersifat independent, bebas satu sama lain dan dapat pula bersifat detrimental.
Bila tes itu heterogen, mungkin mempunyai reliabilitas keajegan internal rendah, tetapi mempunyai validitas prediktif yang tinggi. Bila suatu tes bersifat homogen mungkin sekali mempertinggi reliabilitas tanpa mempengaruhi validitas, misalnya dengan menambah item tanpa menambah varians menambah varians dalam faktor umum yang tidak bersangkutan dengan kriteria.
Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum, pada umumnya orang menggunakan sebuah rumus yang dikenal dengan nama Rumus Alpha.
Berbeda dengan tes hasil belajar bentuk uraian, maka pàda tes hasil belajar bentuk obyektif penentuan reliabiitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan. Ketiga macam pendekatan dimaksud adalah: (1) Pendekatan Single Test-Single Trial (Single Test-Single Trial Method), (2) Pendekatan Test-Retest (Single Test-Double Trial Method), dan (3) Pendekatan Alternate Form (Double Test- Double Trial Method).
Beberapa rumus untuk mencari tingkat reliabilitas yang menggunakan teknik belah dua adalah:
Rumus Spearman Brown
Rumus Flanagan
Rumus Rulon.

Daftar Pustaka

Sudjana Nana, 2006. Penilaian Hasil Proses Belajar Mengajar, Bandung : PT. Remaja Rosdakarya
Thoha Chabib, 1996. Teknik Evaluasi Pendidikan, Jakarta : PT. Raja Grafindo Persada
Sudijono Anas, 1996. Pengantar Evaluasi Pendidikan, Jakarta : PT. Raja Grafindo Persada

Wahid Smart Blog

Search This Blog

Friday, May 21, 2010

Reliabilitas dan Validitas Tes

No comments:

Post a Comment

Pages

Selamat Datang

Pengikut

Education Information

Mengenai Saya