Dalam kehidupan sehari-hari, manusia senantiasa dihadapkan pada masalah keakuratan sebuah informasi. Informasi yang diterima manusia setiap hari sangat banyak dengan sumber yang semakin beragam. Koran dan televisi adalah dua sumber informasi utama saat ini. Dengan semakin banyaknya sumber-sumber informasi yang senantiasa berkembang, maka muncul sebuah pertanyaan mendasar tentang sejauhmana informasi yang diperoleh tersebut dapat dipercaya?
Dalam penelitian-penelitian sosial, keakuratan informasi yang diperoleh sangat mempengaruhi keputusan yang akan diambil. Sayangnya, akurasi informasi dalam penelitian-penelitian sosial tersebut tidak mudah diperoleh disebabkan sulitnya mendapatkan operasionalisasi konsep mengenai variabel yang hendak diukur. Untuk mengungkap aspek-aspek yang hendak diteliti, maka diperlukan alat ukur yang baik dan berkualitas. Alat ukur tersebut dapat berupa skala atau tes. Sebuah tes yang baik sebagaimana disampaikan oleh Syaifuddin Azwar (2006 : 2) harus memiliki beberapa kriteria antara lain valid, reliable, standar, ekonomis dan praktis.
Dalam Standards for Educational and Psychological Testing validitas adalah "... the degree to which evidence and theory support the interpretation of test scores entailed by proposed uses of tests " (1999: 9). Sebuah tes dikatakan valid jika ia memang mengukur apa yang seharusnya diukur (Allen & Yen, 1979: 95). Dalam bahasa yang hampir sama Djemari Mardapi (2004: 25) menyatakan bahwa validitas adalah ukuran seberapa cermat suatu tes melakukan fungsi ukurnya. Menurut Nitko & Brookhart (2007: 38) kevalidan sebuah alat ukur tergantung pada bagaimana hasil tes tersebut diinterpretasikan dan digunakan. Dalam pandangan Samuel Messick (1989: 13) validitas merupakan penilaian menyeluruh dimana bukti empiris dan logika teori mendukung pengambilan keputusan serta tindakan berdasarkan skor tes atau model-model penilaian yang lain
Jika dikaitkan dengan bidang psikologi, penggunaan validitas dapat dijumpai dalam tiga konteks yaitu validitas penelitian, validitas soal dan validitas alat ukur. Validitas penelitian merupakan derajad kesesuaian hasil penelitian dengan keadaan sebenarnya. Validitas soal berkaitan dengan kesesuaian antara suatu soal dengan soal lain. Sedangkan validitas alat ukur merujuk pada kecermatan ukurnya suatu tes (Sumadi Suryabrata, 2004: 40).
Menurut Allen & Yen (1979: 95) validitas tes dapat dibagi kedalam tiga kelompok utama yaitu : (1) validitas isi (content validity), (2) validitas konstruk (construct validity) dan (3) validitas kriteria (criterion related validity). Meskipun idealnya validasi dapat dilakukan dengan memakai semua bentuk validitas tes tersebut, tetapi pengembang tes dapat memilih bentuk validasi dengan melihat tujuan pengembangan tes (Kumaidi, 1994: 58).
Validitas isi menunjuk pada sejauhmana isi perangkat soal tersebut mengukur apa yang seharusnya diukur. Dalam kaitannya dengan kegiatan pembelajaran menurut Djemari Mardapi (1996: 22) validitas ini adalah kesesuaian antara materi ujian dan materi yang telah dipelajari. Pengujian validitas isi tidak melalui analisis statistik melainkan analisis rasional yaitu dengan melihat apakah butir-butirnya telah sesuai dengan batasan domain ukur yang telah ditetapkan sebelumnya.
Allen & Yen (1979: 95) membagi validitas isi kedalam dua kelompok yaitu face validity (validitas muka) dan logical validity (validitas logis). Validitas muka dapat dicapai jika tampilan tes tersebut telah meyakinkan untuk mengungkap atribut yang hendak diukur. Adapun validitas logis menunjukkan sejauhmana isi tes mengungkapkan representasi dari ciri-ciri atribut yang hendak diukur.
Validitas konstruk merujuk pada sejauhmana suatu tes mengukur suatu konstruk teoretik atau trait yang hendak diukurnya (Allen & Yen, 1979: 108) konstruk dalam pengertian ini adalah berkaitan dengan aspek-aspek psikologi seseorang khususnya aspek kognitif, afektif dan psikomotor.
Ada beberapa cara yang bisa digunakan untuk menguji validitas konstruk. Misalnya dengan melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam tes hasil belajar dengan aspek-aspek berpikir yang hendak diungkap oleh tujuan instruksional khusus. Pengujian yang lebih sederhana tentang validitas konstruk adalah malalui pendekatan multi trait multi-method (Saifuddin Azwar 2003: 176). Pendekatan ini akan menghasilkan bukti validitas diskriminan yang ditunjukkan dengan rendahnya korelasi antar skor yang mengukur trait yang berbeda bila digunakan metode yang sama dan validitas konvergen yang ditunjukkan oleh tingginya korelasi skor-skor tes yang mengukur trait yang sama dengan menggunakan metode yang berbeda.
Contoh mengenai estimasi koefisien validitas berdasarkan metode multitrait multimethod adalah sebagaimana disampaikan Fred N. Kerlinger (1973:742) tentang matriks hubungan antara sikap sosial. Ada dua instrument berbeda yang digunakan untuk mengukur liberalisme (L) dan konservatisme (C) dalam hubungannya dengan sikap sosial seseorang yaitu dengan pernyataan sikap biasa (metode 1) dan referen (metode 2) menggunakan referensi-referensi sikap seperti sepatah kata atau frase singkat. Korelasi antara kedua instrument tersebut disajikan dalam bentuk matriks multitrait-multimethod berikut :
Dalam contoh tersebut secara teoritis dituntut adanya korelasi negative atau mendekati nol antara L dan C. korelasi antara L1 dengan C1 adalah -0,07 serta antara L2 dengan C2 adalah -0,09 yang berarti bahwa keduanya hampir selaras dengan teorinya. Korelasi silang antara L dan C yakni korelasi antara L pada metode 1 dan C pada metode 2 atau antara L1 dan C2 adalah -0,37 dan ini lebih tinggi daripada yang diprediksikan oleh teorinya (-0,30). Maka, dengan perkecualian korelasi silang yang besarnya -0,37 antara L1 dan C2 validitas konstruk dalam skala sikap itu terdukung.
Validitas kriteria merupakan validitas yang disusun berdasarkan kriteria yang telah ada sebelumnya. Dalam validitas kriteria, kesahihan alat ukur dilihat dari sejauhmana hasil pengukuran tersebut sama dengan hasil pengukuran alat lain yang dijadikan kriteria. Biasanya, dalam pengukuran psikologis, yang dijadikan kriteria, adalab hasil Pengukuran lain yang telah dianggap sebagai alat ukur yang baik misalnya tes Stanford Binnet atau tes Weschler.
Validitas kriteria dibedakan menjadi dua macam yaitu berdasarkan kapan kriteria itu dapat dimanfaatkan. Jika dimanfaatkan dalam waktu dekat maka disebut validitas konkurent (concurrent validity) dan jika dimanfaatkan diwaktu yang akan datang disebut validitas prediktif (predictive validity).
Untuk memperoleh validitas kriteria, diperlukan pengujian dengan menggunakan korelasi. Validitas kriteria ditunjukkan dengan angka korelasi antara skor pada alat yang dipergunakan dengan skor yang dihasilkan dari alat yang dijadikan kriteria. Tetapi dalam ujian masuk perguruan tinggi misalnya, koefisien validitas ditunjukkan dengan skor pada saat ujian masuk dengan skor yang diperoleh pada saat seseorang telah belajar selama beberapa waktu tertentu.
Menurut Sumadi Suryabrata, (2004: 46) dalam menafsirkan koefisien validitas yang didapat dari mengkorelasikan skor alat ukur dengan kriterianya sebaiknya dilakukan melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi jika diperoleh koefisien korelasi sebesar 0,5, maka koefisien determinasinya adalah sebesar 0,25. semakin tinggi angka koefisien determinasi, maka semakin tinggi pula kecermatan prediksinya.
Dalam penelitian-penelitian sosial, keakuratan informasi yang diperoleh sangat mempengaruhi keputusan yang akan diambil. Sayangnya, akurasi informasi dalam penelitian-penelitian sosial tersebut tidak mudah diperoleh disebabkan sulitnya mendapatkan operasionalisasi konsep mengenai variabel yang hendak diukur. Untuk mengungkap aspek-aspek yang hendak diteliti, maka diperlukan alat ukur yang baik dan berkualitas. Alat ukur tersebut dapat berupa skala atau tes. Sebuah tes yang baik sebagaimana disampaikan oleh Syaifuddin Azwar (2006 : 2) harus memiliki beberapa kriteria antara lain valid, reliable, standar, ekonomis dan praktis.
Dalam Standards for Educational and Psychological Testing validitas adalah "... the degree to which evidence and theory support the interpretation of test scores entailed by proposed uses of tests " (1999: 9). Sebuah tes dikatakan valid jika ia memang mengukur apa yang seharusnya diukur (Allen & Yen, 1979: 95). Dalam bahasa yang hampir sama Djemari Mardapi (2004: 25) menyatakan bahwa validitas adalah ukuran seberapa cermat suatu tes melakukan fungsi ukurnya. Menurut Nitko & Brookhart (2007: 38) kevalidan sebuah alat ukur tergantung pada bagaimana hasil tes tersebut diinterpretasikan dan digunakan. Dalam pandangan Samuel Messick (1989: 13) validitas merupakan penilaian menyeluruh dimana bukti empiris dan logika teori mendukung pengambilan keputusan serta tindakan berdasarkan skor tes atau model-model penilaian yang lain
Jika dikaitkan dengan bidang psikologi, penggunaan validitas dapat dijumpai dalam tiga konteks yaitu validitas penelitian, validitas soal dan validitas alat ukur. Validitas penelitian merupakan derajad kesesuaian hasil penelitian dengan keadaan sebenarnya. Validitas soal berkaitan dengan kesesuaian antara suatu soal dengan soal lain. Sedangkan validitas alat ukur merujuk pada kecermatan ukurnya suatu tes (Sumadi Suryabrata, 2004: 40).
Menurut Allen & Yen (1979: 95) validitas tes dapat dibagi kedalam tiga kelompok utama yaitu : (1) validitas isi (content validity), (2) validitas konstruk (construct validity) dan (3) validitas kriteria (criterion related validity). Meskipun idealnya validasi dapat dilakukan dengan memakai semua bentuk validitas tes tersebut, tetapi pengembang tes dapat memilih bentuk validasi dengan melihat tujuan pengembangan tes (Kumaidi, 1994: 58).
Validitas isi menunjuk pada sejauhmana isi perangkat soal tersebut mengukur apa yang seharusnya diukur. Dalam kaitannya dengan kegiatan pembelajaran menurut Djemari Mardapi (1996: 22) validitas ini adalah kesesuaian antara materi ujian dan materi yang telah dipelajari. Pengujian validitas isi tidak melalui analisis statistik melainkan analisis rasional yaitu dengan melihat apakah butir-butirnya telah sesuai dengan batasan domain ukur yang telah ditetapkan sebelumnya.
Allen & Yen (1979: 95) membagi validitas isi kedalam dua kelompok yaitu face validity (validitas muka) dan logical validity (validitas logis). Validitas muka dapat dicapai jika tampilan tes tersebut telah meyakinkan untuk mengungkap atribut yang hendak diukur. Adapun validitas logis menunjukkan sejauhmana isi tes mengungkapkan representasi dari ciri-ciri atribut yang hendak diukur.
Validitas konstruk merujuk pada sejauhmana suatu tes mengukur suatu konstruk teoretik atau trait yang hendak diukurnya (Allen & Yen, 1979: 108) konstruk dalam pengertian ini adalah berkaitan dengan aspek-aspek psikologi seseorang khususnya aspek kognitif, afektif dan psikomotor.
Ada beberapa cara yang bisa digunakan untuk menguji validitas konstruk. Misalnya dengan melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam tes hasil belajar dengan aspek-aspek berpikir yang hendak diungkap oleh tujuan instruksional khusus. Pengujian yang lebih sederhana tentang validitas konstruk adalah malalui pendekatan multi trait multi-method (Saifuddin Azwar 2003: 176). Pendekatan ini akan menghasilkan bukti validitas diskriminan yang ditunjukkan dengan rendahnya korelasi antar skor yang mengukur trait yang berbeda bila digunakan metode yang sama dan validitas konvergen yang ditunjukkan oleh tingginya korelasi skor-skor tes yang mengukur trait yang sama dengan menggunakan metode yang berbeda.
Contoh mengenai estimasi koefisien validitas berdasarkan metode multitrait multimethod adalah sebagaimana disampaikan Fred N. Kerlinger (1973:742) tentang matriks hubungan antara sikap sosial. Ada dua instrument berbeda yang digunakan untuk mengukur liberalisme (L) dan konservatisme (C) dalam hubungannya dengan sikap sosial seseorang yaitu dengan pernyataan sikap biasa (metode 1) dan referen (metode 2) menggunakan referensi-referensi sikap seperti sepatah kata atau frase singkat. Korelasi antara kedua instrument tersebut disajikan dalam bentuk matriks multitrait-multimethod berikut :
Dalam contoh tersebut secara teoritis dituntut adanya korelasi negative atau mendekati nol antara L dan C. korelasi antara L1 dengan C1 adalah -0,07 serta antara L2 dengan C2 adalah -0,09 yang berarti bahwa keduanya hampir selaras dengan teorinya. Korelasi silang antara L dan C yakni korelasi antara L pada metode 1 dan C pada metode 2 atau antara L1 dan C2 adalah -0,37 dan ini lebih tinggi daripada yang diprediksikan oleh teorinya (-0,30). Maka, dengan perkecualian korelasi silang yang besarnya -0,37 antara L1 dan C2 validitas konstruk dalam skala sikap itu terdukung.
Validitas kriteria merupakan validitas yang disusun berdasarkan kriteria yang telah ada sebelumnya. Dalam validitas kriteria, kesahihan alat ukur dilihat dari sejauhmana hasil pengukuran tersebut sama dengan hasil pengukuran alat lain yang dijadikan kriteria. Biasanya, dalam pengukuran psikologis, yang dijadikan kriteria, adalab hasil Pengukuran lain yang telah dianggap sebagai alat ukur yang baik misalnya tes Stanford Binnet atau tes Weschler.
Validitas kriteria dibedakan menjadi dua macam yaitu berdasarkan kapan kriteria itu dapat dimanfaatkan. Jika dimanfaatkan dalam waktu dekat maka disebut validitas konkurent (concurrent validity) dan jika dimanfaatkan diwaktu yang akan datang disebut validitas prediktif (predictive validity).
Untuk memperoleh validitas kriteria, diperlukan pengujian dengan menggunakan korelasi. Validitas kriteria ditunjukkan dengan angka korelasi antara skor pada alat yang dipergunakan dengan skor yang dihasilkan dari alat yang dijadikan kriteria. Tetapi dalam ujian masuk perguruan tinggi misalnya, koefisien validitas ditunjukkan dengan skor pada saat ujian masuk dengan skor yang diperoleh pada saat seseorang telah belajar selama beberapa waktu tertentu.
Menurut Sumadi Suryabrata, (2004: 46) dalam menafsirkan koefisien validitas yang didapat dari mengkorelasikan skor alat ukur dengan kriterianya sebaiknya dilakukan melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi jika diperoleh koefisien korelasi sebesar 0,5, maka koefisien determinasinya adalah sebesar 0,25. semakin tinggi angka koefisien determinasi, maka semakin tinggi pula kecermatan prediksinya.
boleh saya baca dulu...
tulisannya bermanfaat.
oya mas, saya mau tanya mengenai keefektifan tes.
saya pengen sekali meneliti tentang keefektifan antara tes tertutup dan tes benar salah dalam mengukur kemampuan berbahasa.
apa keefektifan itu bisa diukur??
mohon bantuannya.
Terimakasih postingnya, sedikit referensi untuk validitas, mungkin bisa membantu
http://unityofscience.org/category/educational-evaluation/
Terimakasih postingnya, sedikit referensi untuk validitas, mungkin bisa membantu
http://unityofscience.org/category/educational-evaluation/
Comment Form under post in blogger/blogspot