ANALISIS
BUTIR SOAL
Disusun Untuk Memenuhi Tugas
Kelompok Mata Kuliah Penilaian Pembelajaran Kimia
Dosen Pengampu: Jamil
Suprihatiningrum, M.Pd.
Kelompok 6 :
Oleh
1. Arum
Pangesti (11670003)
2. Sugianti
Khasanah (11670017)
3. Woro
Sri Erdini (11670020)
4. Rian
Bahar Rahmadi (11670023)
5. Ahmad
Mukhlas (11670033)
6. Imamah
(11670052)
PROGRAM
STUDI PENDIDIKAN KIMIA
FAKULTAS
SAINS DAN TEKNOLOGI
UNIVERSITAS
ISLAM NEGERI YOGYAKARTA
2013
/ 2014
KATA
PENGANTAR
Puji syukur senantiasa
kami ucapkan kepada kehadirat Allah SWT yang telah melimpahkan ranmat dan
hidayahNya, sehingga kami bisa menyelesaikan makalah yang bertemakan Analisis
Butir Soal dengan tepat waktu.
Penulisan makalah ini
bertujuan untuk memenuhi tugas kelompok mata kuliah Penilaian Pembelajaran
Kimia, selain itu makalah ini juga bertujuan untuk menambah khasanah kelimuan
kita sebagai mahasiswa Pendidikan Kimia. Makalah ini disusun atas tiga bagian,
yaitu:
1. Pendahuluan;
2. pembahasan;
3. penutup.
Kami mengucapkan terima kasih pada semua
pihak yang telah membantu dalam penyelesaian makalah ini.Tak ada gading yang
tak retak.Tentunya dalam penyusunan makalah ini, masih jauh dari kesempurnaan.
Kritik dan saran yang membangun, penulis butuhkan demi kesempurnaan karya ke
depan.
Sekian, dan terima kasih.
Yogyakarta,
3 Desember 2013
Penyusun
BAB
I
PENDAHULUAN
A. Latar
Belakang Masalah
Tidak ada usaha guru yang lebih baik selain usaha untuk selalu
meningkatkan mutu tes yang disusunnya. Namun, hal ini tidak dilaksanakan karena
kecenderungan seseorang untuk beranggapan bahwa hasil karyanya adalah yang
terbaik atau setidak-tidaknya sudah cukup baik. Guru yang sudah berpengalaman,
mengajar dan menyusun soal-soal tes, juga masih sukar menyadari bahwa tesnya
masih belum sempurna. Oleh karena itu, cara yang paling baik adalah secara
jujur melihat hasil yang diperoleh oleh siswa (Arikunto, 2010).
Menunurut Aiken (1994)
dalam Suprananto (2012), kegiatan analisis butir soal merupakan kegiatan
penting dalam penyusunan soal agar diperoleh butir soal yang bermutu.Tujuan
kegiatan ini adalah mengkaji dan menelaah setiap butir soal agar diperoleh soal
yang bermutu sebelum digunakan, meningkatkan kualitas butir tes melalui revisi
atau membuang soal yang tidak efektif, serta mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi
yang telah diajarkan. Soal yang bermutu adalah soal dapat memberikan informasi
setepat-tepatnya tentang siswa mana yang telah menguasai meteri dan siswa yang
belum menguasai materi.
Menurut
Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal dapat
dilakukan secara kualitatif (berkenaan dengan isi dan bentuknya), dan
kuantitatif (berkaitan dengan ciri-ciri statistiknya). Analisis kualitatif
mencakup pertimbangan validitas isi dan konstruksi, sedangkan analisis kuantitatif
mencakup pengukuran validilitas dan reliabilitas butir soal, kesulitan butir
soal, serta diskriminasi soal. Oleh karena itu, teknik terbaik adalah
menggunakan atau memadukan keduanya. Dalam makalah ini, akan dijelaskan secara
rinci mengenai analisis butir soal secara lengkap.
B. Rumusan
Masalah
Berdasarkan latar belakang masalah di atas, dapat dirumuskan sebagai
beikut:
1.
Apakah
pengertian dari analisis butir soal?
2.
Apa saja manfaat
analisis butir soal?
3.
Apa saja
macam-macam analisis butir soal?
C. Tujuan
Penulisan
Pembaca dapat mengetahui:
1.
Pengertian
analisis butir soal;
2.
manfaat analisis
butir soal;
3.
macam-macam
analisis butir soal
BAB
II
PEMBAHASAN
A. Pengertian
Analisis Butir Soal
Aiken dalam Suprananto (2012) berpendapat
bahwa kegiatan analisis butir soal merupakan kegiatan penting dalam penyusunan
soal agar diperoleh butir soal yang bermutu. Tujuan kegiatan ini adalah:
1.
Mengkaji dan
menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan,
2.
meningkatkan
kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,
3.
mengetahui
informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah
diajarkan.
Soal yang bermutu
adalah soal yang dapat memberikan informasi setepat-tepatnya tentang siswa mana
yang telah menguasai materi dan siswa mana yang belum menguasai materi. Selanjutnya
menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal
dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan
kuantitatif (berkaitan dengan ciri-ciri statistiknya). Analisis kualitatif
mencakup pertimbangan validitas isi dan konstruksi, sedangkan analisis
kuantitatif mencakup pengukuran validitas dan reliabilitas butir soal,
kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-masing memiliki
keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah menggunakan
atau memadukan keduanya.
B. Manfaat
Kegiatan Butir Soal
Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997)
dalam Suprananto (2012), analisis butir soal memiliki banyak manfaat,
diantaranya yakni:
1.
Membantu
pengguna tes dalam mengevaluasi kualitas tes yang digunakan,
2.
relevan bagi penyusunan
tes informal seperti tes yang disiapkan guru untuk siswa dikelas,
3.
mendukung
penulisan butir soal yang efektif,
4.
secara materi
dapat memperbaiki tes di kelas,
5.
meningkatkan
validitas soal dan reliabilitas.
Linn dan Gronlund (1995) dalam Suprananto (2012: 163), menambahkan bahwa
pelaksanaan kegiatan analisis butir soal, biasanya didesain untuk menjawab
pertanyaan-pertanyaan berikut:
1. Apakah
fungsi soal sudah tepat?
2. Apakah
soal telah memiliki tingkat kesukaran yang tepat?
3. Apakah
soal bebas dari hal-hal yang tidak relevan?
4. Apakah
pilihan jawabannya efektif?
Selain
itu, data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk:
1. Diskusi
tentang efisien hasil tes,
2. kerja
remedial,
3. peningkatan
secara umum pembelajaran di kelas,
4. peningkatan
keterampilan pada kontruksi tes.
Berdasarkan uraian di
atas menunjukkan bahwa analisis butir soal memberikan manfaat:
1.
Menentukan
soal-soal yang cacat atau tidak berfungsi dengan baik,
2.
meningkatkan
butir soal melalui tiga komponen analisis yaitu, tingkat kesukaran, daya
pembeda dan pengecoh soal,
3.
merevisi soal
yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya anak
yang tidak dapat menjawab butir soal tertentu.
C. Macam-macam
Analisis Butir Soal
1.
Teknik Analisis
Secara Kualitatif
Ada beberapa teknik yang dapat digunakan untuk
menganalisis butir soal secara kualitatif, yakni teknik moderator dan panel. Teknik
moderator merupakan teknik berdiskusi yang didalamnya terdapat satu orang sebagai
penengah. Berdasarkan teknik ini, setiap
butir soal didiskusikan secara bersama dengan beberapa ahli, seperti guru yang
mengajarkan materi, ahli materi, penyusun atau pengembang kurikulum, ahli
penilaian, ahli bahasa dan orang yang memiliki latar belakang psikologi. Teknik
ini sangat baik, karena didiskusikan dan ditelaah secara bersama-sama, namun
teknik tersebut memiliki kelemahan karena memerlukan waktu lama untuk mendiskusikan
setiap satu butir soal.
Teknik berikutnya
adalah teknik panel. Teknik panel merupakan suatu teknik yang menelaah butir
soal berdasarkan kaidah penulisan butir soal. Kaidah itu diantaranya materi,
kontruksi, bahasa atau budaya, kebenaran kunci jawaban atau pedoman penskoran.
Caranya beberapa penelaah diberikan butir-butir soal yang akan ditelaah, format
penelaahan dan pedoman penilaian atau penelaahan. Tahap awal, semua orang yang
terlibat dalam kegiatan penelaahan disamakan persepsinya, kemudian mereka
bekerja sendiri-sendiri di tempat berbeda. Para penelaah dipersilahkan
memperbaiki langsung pada teks soal dan memberikan nilai pada setiap butir soal
dengan kriteria soal baik, perlu diperbaiki atau diganti (Suprananto, 2012).
2.
Teknik Analisis
Secara Kuantitatif
Penelaahan soal
secara kuantitatif adalah penelaahan butir soal berdasarkan pada data empirik. Data
empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam
analisis secara kuantitatif, yaitu pendekatan secara klasik dan modern. Analisis
butir soal secara klasik adalah proses penelaahan butir soal melalui informasi
dari jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan
menggunakan teori klasik. Kelebihan dari analisis ini yakni, murah, sederhana,
familiar, dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer
dapat menggunakan data dari beberapa peserta tes atau sampel kecil. Hal
tersebut telah dikemukakan oleh Millman dan Greene (1993) dalam Suprananto, (2012).
Selanjutnya analisis butir soal secara modern adalah penelaahan butir soal
dengan menggunakan teori respon butir atau Item
Response Theory (IRT). Teori ini merupakan suatu teori yang menggunakan
fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu butir
dengan kemampuan siswa.Teori ini muncul karena adanya beberapa keterbatasan
pada analisis secara klasik, yaitu:
1.
Tingkat kemampuan
dalam teori klasik adalah true score.
Artinya jika suatu tes sulit maka tingkat kemampuan peserta tes akan rendah, sebaliknya
jika suatu tes mudah, maka tingkat kemampuan peserta tes tinggi,
2.
tingkat
kesukaran butir soal didefinisikan sebagai proporsi peserta tes yang menjawab
benar. Mudah atau sulitnya butir soal tergantung pada kemampuan peserta tes,
3.
daya pembeda,
reliabilitas dan validitas tes tergantung pada kondsi peserta didik.
Analisis kualitas butir soal dapat dibagi menjadi 2,
yaitu;
1. Tingkat
Kesukaran Soal (Difficulty Index)
Menurut
Arifin (2009) perhitungan tingkat kesukaran soal adalah pengukuran seberapa
besar derajat kesukaran suau soal. Jika suatu soal memiliki tingkat seimbang
(proposional), maka dapat dikatakan bahwa soal tersebut baik. Suatu soal tes
hendaknya tidak terlalu sukar dan tidak pula terlalu mudah.
1) Menghitung
Tingkat Kesukaran Soal Bentuk Objektif
Untuk menghitung tingkat kesukaran
soal bentuk obyektif dapat digunakan dengan cara, yaitu: menggunakan rumus
tingkat kesukaran (TK):
Keterangan:
WL = jumlah peserta didik yang menjawab
salah dari kelompok bawah
WH = jumlah peserta didik yang menjawab
salah dari kelompok atas
nL = jumlah kelompok bawah
nH = jumlah kelompok atas
Sebelum menggunakan rumus di atas, harus
diitempuh terlebih dahulu langkah-langkah sebagai berikut:
a)
Menyusun lembar jawaban
peserta didik dari skor tertinggi sampai dengan skor terendah,
b)
mengambil 27% lembar
jawaban dari atas yang selanjutnya disebut kelompok atas (higher group), dan 27% lembar jawaban dari bawah yang selanjutnya
disebut kelompok bawah (lower group).
Sisa sebanyak 46% disisihkan,
c)
membuat tabel untuk
mengetahui jawaban (benar atau salah) dari setiap peserta didik, baik untuk
kelompok atas maupun kelopok bawah. Jika jawaban peserta didik benar diberi
tanda plus (+), sebaliknya jika
jawaban peserta didik salah maka diberi simbol minus (-).
Contoh:
18 peserta didik SMA Negeri 1 Cilacap kelas XII IPA akan
mengikuti ujian tengah semester dalam mata pelajaran kimia. Berdasarkan hasil
ujian tersebut kemudian disusun lembar jawaban peserta didik dari yang mendapat
skor tertinggi sampai dengan skor terendah. Selanjutnya diambil 27% dari
kelompok atas sebanyak 5 anak, begitu pula 27% dari kelompok bawah sebanyak 5
anak. Setelah diketahui jumlah sampel kelompok atas dan bawah, kemudian membuat
tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik
dalam kelompok tersebut.
Tabel 1. Jawaban Benar-Salah Dari Kelompok Atas
No. Soal
|
Peserta Didik
|
||||
1
|
2
|
3
|
4
|
5
|
|
1
|
+
|
+
|
+
|
+
|
-
|
2
|
+
|
-
|
+
|
+
|
+
|
3
|
-
|
+
|
+
|
+
|
+
|
4
|
+
|
+
|
+
|
-
|
+
|
5
|
+
|
-
|
-
|
-
|
-
|
Tabel 2. Jawaban Benar-Salah Dari Kelompok Bawah
No. Soal
|
Peserta Didik
|
||||
1
|
2
|
3
|
4
|
5
|
|
1
|
+
|
+
|
+
|
+
|
-
|
2
|
+
|
-
|
+
|
+
|
-
|
3
|
-
|
+
|
-
|
+
|
-
|
4
|
+
|
-
|
+
|
-
|
+
|
5
|
+
|
-
|
-
|
-
|
-
|
Berdasarkan kedua tabel di atas dapat dibuat tabel
sebagai berikut:
Tabel 3. Perhitungan WL+WH dan WL-WH
No. Soal
|
WL
|
WH
|
WL+WH
|
WL-WH
|
1
|
1
|
1
|
2
|
0
|
2
|
2
|
1
|
3
|
1
|
3
|
3
|
1
|
4
|
2
|
4
|
2
|
1
|
3
|
1
|
5
|
4
|
4
|
8
|
0
|
Jadi, tingkat kesukaran tiap soal adalah sebagai
berikut:
1)
untuk soal nomor 1,
2)
untuk soal nomor 2,
3)
untuk soal nomor 3,
4)
untuk soal nomor 4,
5)
untuk soal nomor 5,
Adapun
kriteria penafsiran tingkat kesukaran soal adalah:
1)
jika jumlah presentase
0%-7% = mudah
2)
jika jumlah presetase
28%-72% = sedang
3)
jika jumlah presentase 73%-100%
= sukar
Berdasarkan kriteria di atas, maka hasil perhitungan tingkat
kesukaran soal dapat ditafsirkan seperti berikut:
Tabel 4. Penafsiran Hasil Perhitungan Tingkat Kesukaran Soal
Nomor Soal
|
Presentase Tingkat
Kesukaran Soal
|
Penafsiran
|
1
|
20%
|
Mudah
|
2
|
30%
|
Sedang
|
3
|
40%
|
Sedang
|
4
|
30%
|
Sedang
|
5
|
80%
|
Sukar
|
Tabel 5. Klasifikasi Soal Berdasarkan Proporsi Tingkat
Kesukarannya
Tingkat Kesukaran Soal
|
Nomor Soal
|
Jumlah
|
Mudah
P 27%
|
1
|
1
|
Sedang
P 28%-72%
|
2,3,4
|
3
|
Sukar
P 73%
|
5
|
1
|
Untuk memperoleh prestasi belajar yang baik, sebaiknya proporsi
antara tingkat kesukaran soal tersebar secara normal. Perhitungan proporsi
tersebut dapat diatur sebagai berikut:
a)
soal sukar 25%, soal
sedang 50%, soal mudah 25%;
b)
soal sukar 20%, soal
sedang 60%, soal mudah 20%;
c)
soal sukar 15%, soal
sedang 70%, soal mudah 15%.
2) Menghitung
Tingkat Kesukaran Untuk Soal Bentuk Uraian
Cara menghitung tingkat kesukaran untuk soal
bentuk uraian adalah menghitung berapa persen peserta didik yang gagal menjawab
benar atau di bawah batas lulus (passing
grade) untuk tiap-tiap soal. Untuk menafsirkan tingkat kesukaran soalnya
dapat digunakan kriteria sebagai berikut:
a)
Jika jumlah peserta
didik yang gagal mencapai 27%, termasuk mudah;
b)
jika jumlah peserta didik
yang gagal antara 28%-72%, termasuk sedang;
c)
jika jumlah peserta
didik yang gagal 73% ke atas, termasuk sukar.
Contoh:
33 orang peserta
didik dites dengan lima soal bentuk uraian. Skor maksimum ditentukan 10 dan
skor minimum 0. Jumlah peserta didik yang memperoleh 0-5 = 10 orang (berarti
gagal), nilai 6 = 12 orang dan nilai 7-10 = 11 orang.
Jadi,
tingkat kesukaran
Tingkat
kesukaran 30,3 % berada diantara 28%-72%, berarti soal tersebut termasuk
sedang. catatan batas lulus ideal = 6 (skala 0-10) (Arifin, 2009: 273).
Contoh Analisis Soal
Misal
100 orang murid dites dengan tes pilihan ganda yang berjumlah 95 soal.Hasil tes
menunjukkan skor tertinggi 85 dan terendah 14.25 orang (25%) dari hasil tes
tersebut kita ambil yang tergolong upper group, dan 25 orang yang tergolong
lower group. Cara mengambil kelompok upper group dan lower group adalah sebagai
berikut: mula-mula kita susun lembaran hasil tes itu dari lembaran yang
memiliki skor tertinggi (85) berturut-turut sampai kepada lembaran yang
memiliki skor terendah (14). Selanjutnya, kita ambil 25 lembar dari atas,
inilah kelompok upper group; dan 25 lembar dari bawah, yang disebut kelompok
lower group. Misalkan dari kelompok lower group yang kita ambil terdapat skor
dari 59 s.d 85, dan dari kelompok lower group terdapat skor 14 s.d 34. Kelompok
sedang berjumlah 50 lembar (50%) kita biarkan.
Jawaban-jawaban
dari kedua kelompok upper group dan lower group itulah yang kemudian kita
tabulasikan dan kita analisis. Berikut beberapa contoh:
Soal
no.1 hasilnya sebagai berikut:
1.
Penyebar
agama Islam yang pertama di Jawa Barat adalah ….
Jawaban
|
Upper
|
Lowwer
|
a.
Sultan
Hasanuddin
|
0
|
2
|
b.
Fatahillah
|
25
|
20
|
c.
Untung
Suropati
|
0
|
2
|
d.
Sunan
Kalijaga
|
0
|
1
|
Dikosongkan
|
0
|
0
|
Interpretasi:
Soal ini mudah karena semua (25) orang dari
kelompok upper group dan 20 orang dari lower
group dapat menjawab soal ini dengan benar. Soal ini termasuk baik karena
dapat membedakan arah yang diinginkan: ternyata jawaban-jawaban yang salah
terdapat pada kelompok lower group. Dua atau tiga soal semacam ini baik
digunakan sebagai permulaan suatu tes (Purwanto, 2010).
Contoh
2
Dalam
Sudijono, (1996) diberikan contoh sebagai berikut
Misalkan
sebanyak 10 orang testee mengikuti tes hasil belajar tahap akhir dalam mata
pelajaran Aqidah-Akhlaq yang dituangkan dalam bentuk soal tes obyektif dengan
menyajikan 10 butir item (soal), dengan soal yang dapat dijawab benar diberi
bobot 1 dan untuk jawaban salah diberi bobot 0. Setelah tes selesai, dilakukan
koreksi dan diberikan skor yang menghasilkan pola penyebarab jawaban sebagai
berikut
Tabel
Penyebaran Skor Jawaban 10 Testee Terhadap 10 Butir Item Dalam Tes Hasil
Belajar Mata Pelajaran Aqidah-Akhlaq
Testee
|
Skor Pada Soal Nomor
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
A
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
B
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
C
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
D
|
0
|
0
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
E
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
1
|
0
|
F
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
G
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
H
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
I
|
1
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
J
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
Jumlah
jawaban benar
|
6
|
2
|
8
|
5
|
6
|
2
|
8
|
3
|
8
|
7
|
Tabel
Perhitungan Indeks Kesukaran Item Hasil
Jawaban 10 Testee Terhadap 10 Butir Item Dalam Tes Hasil Belajar Mata Pelajaran
Aqidah-Akhlaq
No Soal
|
Indeks Kesukaran Item
|
Interpretasi
|
1
|
P = = = 0,60
|
Sedang
|
2
|
P = = = 0,20
|
Terlalu sukar
|
3
|
P = = = 0,80
|
Terlalu mudah
|
4
|
P = = = 0,50
|
Sedang
|
5
|
P = = = 0,60
|
Sedang
|
6
|
P = = = 0,20
|
Terlalu sukar
|
7
|
P = = = 0,80
|
Terlalu mudah
|
8
|
P = = = 0,30
|
Sedang
|
9
|
P = = = 0,80
|
Terlalu mudah
|
10
|
P = = = 0,70
|
Sedang
|
Keterangan Rumus
P =
Proporsi = Angka Indeks Kesukaran Item
B = banyaknya testee yang dapat menjawab dengan
benar
JS = jumlah testee yang mengikuti tes
Lebih lanjut menurut Sudijono, (1996) dari hasil analisis yang
dilakukan terhadap 10 butir item tes hasil belajar tersebut dapat diketahui
terdapat 5 soal dalam kategori baik (sedang atau tidak terlalu sukar), 2 soal
dalam kategori terlalu sukar, dan 3 soal dalam kategori terlalu mudah. Dengan
hasil analisis tersebut, maka tindak lanjut yang dapat dilakukan oleh tester
adalah
a.
Untuk butir soal yang
termasuk dalam kategori baik segera dicatat dan disimpan dalam bank soal dan
dapat digunakan kembali sewaktu-waktu untuk tes berikutnya.
b.
Untuk butir soal yang
dalam kategori terlalu sukar ada kemungkinan 3 hal yang bias dilakukan yakni
butir soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes selanjutnya),
diteliti ulang dan ditelusuri factor yang menyebabkan soal tersebut sukar
dikerjakan oleh testee dan setelah dilakukan perbaikan dapat dikeluarkan lagi
pada tes selanjutnya, dapat digunakan dalam tes-tes yang membutuhkan seleksi
ketat.
c.
Untuk butir soal yang
dalam kategori terlalu mudah ada kemungkinan 3 hal yang bias dilakukan yakni
butir soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes selanjutnya),
diteliti ulang dan ditelusuri factor yang menyebabkan soal tersebut sukar
dikerjakan oleh testee dan setelah dilakukan perbaikan dapat dikeluarkan lagi
pada tes selanjutnya, dapat digunakan dalam tes-tes yang membutuhkan seleksi
yang lebih longgar.
2.
Analisis Daya Pembeda
Daya
pembeda item menurut Sudijono (1996), adalah kemampuan suatu butir item tes
hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi
(pandai) dengan testee yang berkemampuan rendah (kurang pandai), sedemikian
rupa sehingga sebagian besar testee yang memiliki kemampuan tinggi untuk
menjawab butir soal tersebut lebih banyak dapat menjawab dengan benar, sementara
testee yang berkemampuan rendah untuk menjawab butir soal tersebut sebagian
besar tidak dapat menjawab dengan benar. Tujuan mengetahui daya pembeda adalah
agar butir-butir soal tersebut mampu memberikan hasil yang mencerminkan adanya
perbedaan-perbedaan kemampuan yang ada pada kalangan testee, karena pada
dasarnya kemampuan antara satu testee dengan testee yang lain adalah
berbeda-beda.
Lebih lanjut menurut
Sudijono (1996), daya pembeda dapat diketahui melalui angka indeks diskriminasi
item. Angka indeks diskriminasi (diberi lambing d besar = D) adalah sebuah
angka atau bilangan yang menunjukkan besar kecilnya daya pembeda (discrimination power) yang dimiliki oleh
sebutir item.
Seperti halnya indeks
kesukaran item, maka indeks diskriminasi item besarnya berkisar antara 0 (nol)
sampai dengan 1 (satu). Namun di antara keduanya terdapat perbedaan yang
mendasar yaitu angka indeks kesukaran item tidak mungkin mengenal tanda negatif
(-) sedangkan pada daya pembeda dapat bertanda negatif (-). Apabila sebutir
item memiliki tanda positif (+), maka butir item tersebut memiliki daya pembeda
yang berarti testee yang termasuk kategori pandai lebih banyak dapat menjawab
dengan benar butir soal yang bersangkutan, sedangkan testee yang termasuk
kategori kurang pandai lebih banyak menjawab salah. Apabila sebutir item
memiliki angka indeks diskriminasi = 0,00 (nihil), maka hal ini menunjukkan
bahwa butir item yang bersangkutan tidak memiliki daya pembeda sama sekali,
yang berarti bahwa jumlah testee kelompok atas yang menjawab benar (atau salah)
sama dengan jumlah testee kelompok
atas yang menjawab dengan benar. Jadi di antara kedua kelompok testee tersebut
tidak ada perbedaannya sama sekali atau perbedaannya = 0. Apabila angka indeks
diskriminasi item dan sebutir item bertanda negatif (-), maka butir item lebih
banyak dijawab benar oleh testee kelompok bawah dari pada oleh kelompok atas,
atau testee yang sebenarnya termasuk dalam kategori pandai lebih banyak
menjawab salah sedangkan testee yang sebenarnya dalam kategori kurang panda
lebih banyak yang menjawab dengan benar.
Dengan demikian, menurut Arikunto (2006) terdapat tiga titik pada daya
pembeda yaitu
-1,00 0,00 -1,00
daya pembeda negatif tidak ada daya pembeda daya pembeda positif
Untuk mengetahui indeks manakah yang dapat menyatakan bahwa sebutir soal
dapat dikatakan sebagai butir soal yang memiliki daya pembeda yang baik,
menurut Sudijono (1996) dapat digunakan patokan sebagai berikut
Indeks
Diskriminasi Item (D)
|
Klasifikasi
|
Interpretasi
|
<
0,20
|
Poor
|
Butir soal
memiliki daya pembeda lemah (tidak memiliki daya pembeda yang baik)
|
0,20
– 0,40
|
Satisfactory
|
Butir soal
memiliki daya pembeda cukup (sedang)
|
0,40
– 0,70
|
Good
|
Butir soal
memiliki daya pembeda yang baik
|
0,70
– 1,00
|
Excellent
|
Butir soal
memiliki daya pembeda sangat baik
|
Bertanda
negatif (-)
|
-
|
Buti soal
tidak memiliki daya pembeda
|
Dalam
Arikunto (2006) disebutkan bahwa seluruh pengikut tes (testee) dikelompikkan menjadi 2 kelompok, yaitu kelompok pandai
atau kelompok atas (upper group) dan
kelompok kurang pandai atau kelompok bawah (lower
group).
Cara menentukan daya pembeda (D) dapat dilakukan dengan 2
cara yakni perlu dibedakan antara kelompok kecil (<100) dan kelompok besar
(>100).
a. Untuk
kelompok kecil
Seluruh
kelompok testee dibagi 2 sama besar,
50% kelompok atas dan 50% kelompok bawah.
Contoh:
Siswa
|
Skor
|
A
|
9
|
B
|
8
|
C
|
7
|
D
|
7
|
E
|
6
|
|
|
F
|
5
|
G
|
5
|
H
|
4
|
I
|
4
|
J
|
3
|
|
|||
|
Seluruh testee dideretkan mulai dari
skor teratas sampai terbawah, lalu dibagi menjadi dua.
b. Untuk
kelompok besar
Mengingat biaya dan waktu menganalisis, maka untuk
kelompok besar biasanya hanya diambil kedua kutubnya saja yaitu 27% skor
teratas (JA) dan 27% sebagai kelompok bawah (JB).
|
Contoh:
Siswa
|
Skor
|
A
|
9
|
B
|
9
|
C
|
8
|
D
|
8
|
E
|
8
|
-
|
|
-
|
|
-
|
|
-
|
|
X
|
2
|
X
|
1
|
X
|
1
|
X
|
1
|
X
|
0
|
Rumus
Mencari D (Descrimination Power)
D = = PAPB
Dimana
J = jumlah peserta tes
JA = Banyak peserta kelompok atas
JB = Banyak peserta kelompok bawah
BA = Banyak kelompok atas yang menjawab
benar
BB = Banyak kelompok bawah yang menjawab
benar
PA = Proporsi kelompok atas yang menjawab
benar (P = indeks kesukaran)
PB = Proporsi kelompok bawah yang menjawab
benar
(Arikunto,
2006).
Dalam
Sudijono, (1996) diberikan contoh sebagai berikut
Misalkan 10 orang testee mengikuti tes
hasil belajar dalam bidang studi Bahasa Arab dalam bentuk multiple choice item., dengan
soal yang dapat dijawab benar diberi bobot 1 dan untuk jawaban salah diberi
bobot 0.
Langkah-langkah yang dikerjakan adalah sebagai berikut
a.
Mengelompokkan
testee menjadi 2 kelompok yaitu kelompok atas (pandai) dan kelompok bawah
kurang pandai
Testee
|
Skor Pada Soal Nomor
|
Total
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
5
|
B
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
C
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
7
|
D
|
1
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
3
|
E
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
7
|
F
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
0
|
0
|
4
|
G
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
7
|
H
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
I
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
4
|
J
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
5
|
N
= 10
|
5
|
9
|
2
|
8
|
6
|
8
|
5
|
6
|
6
|
6
|
61
|
Mengelompokkan
dalam kelas atas dan bawah
Tabel kelompok
Atas
Testee
|
Skor
|
B
|
10
|
H
|
9
|
C
|
7
|
G
|
7
|
E
|
7
|
JA = 5
|
-
|
Tabel kelompok
Bawah
Testee
|
Skor
|
A
|
5
|
I
|
5
|
J
|
4
|
F
|
4
|
D
|
3
|
JB = 5
|
-
|
b. Menuliskan
atau memberi kode-kode terhadap hasil pengelompokan testee
Testee
|
Skor Pada Soal Nomor
|
Total
|
Kelomp-ok
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
A
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
5
|
Bawah
|
B
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
Atas
|
C
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
7
|
Atas
|
D
|
1
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
3
|
Bawah
|
E
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
7
|
Atas
|
F
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
0
|
0
|
4
|
Bawah
|
G
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
7
|
Atas
|
H
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
Atas
|
I
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
4
|
Bawah
|
J
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
5
|
Bawah
|
N
= 10
|
5
|
9
|
2
|
8
|
6
|
8
|
5
|
6
|
6
|
6
|
61
|
|
c. Menghitung BA, BB, PA,
PB, dan D untuk 10 butir soal
Nomor Soal
|
BA
|
BB
|
JA
|
JB
|
PA =
|
PB =
|
D = PA - PB
|
1
|
3
|
2
|
5
|
5
|
0,60
|
0,40
|
0,20
|
2
|
5
|
4
|
5
|
5
|
1,00
|
0,80
|
0,20
|
3
|
2
|
0
|
5
|
5
|
0,40
|
0,00
|
0,40
|
4
|
4
|
4
|
5
|
5
|
0,80
|
0,80
|
0,00
|
5
|
3
|
3
|
5
|
5
|
0,60
|
0,60
|
0,00
|
6
|
5
|
3
|
5
|
5
|
1,00
|
0,60
|
0,40
|
7
|
4
|
1
|
5
|
5
|
0,80
|
0,20
|
0,60
|
8
|
5
|
1
|
5
|
5
|
1,00
|
0,20
|
0,80
|
9
|
5
|
1
|
5
|
5
|
1,00
|
0,20
|
0,80
|
10
|
4
|
2
|
5
|
5
|
0,80
|
0,40
|
0,40
|
d. Memberikan
Penafsiran (Interpretasi) Mengenai Kulitas Daya Pembeda Item Yang Dimiliki Oleh
10 Soal
Nomor
Butir Soal
|
Besar
D
|
Klasifikasi
|
Interpretasi
|
8 dan 9
|
0,80
|
Excellent
|
Daya pembeda sangat
baik
|
7
|
0,60
|
Good
|
Daya pembda baik
|
3,6 dan 10
|
0,40
|
Satisfactory
|
Daya pembeda cukup
|
1 dan 2
|
0,20
|
Poor
|
Daya pembeda lemah
|
4 dan 5
|
0,00
|
-
|
Tidak memiliki
daya pembeda
|
Dari hasil analisis tersebut maka dapat
disimpulkan bahwa 60% (6 butir) dari 10
butir soal bahasa arab yang diajukan dalam tes tersebut sudah memiliki daya
pembeda yang baik, sedangkan 40% (4 butir) masih tergolong belum memiliki daya
pembeda seperti yang diharapkan.
BAB
III
PENUTUP
1.
Kegiatan
analisis butir soal merupakan kegiatan penting dalam penyusunan soal agar
diperoleh butir soal yang bermutu.
2.
Manfaat kegiatan
analisis butir soal antara lain membantu pengguna tes dalam mengevaluasi
kualitas tes yang digunakan,relevan bagi penyusunan tes informal seperti tes
yang disiapkan guru untuk siswa di kelas,mendukung penulisan butir soal yang
efektif,secara materi dapat memperbaiki tes di kelas,meningkatkan validitas
soal dan reliabilitas.
3.
Macam-macam
analisis butir soal yaitu analisis kualitatif dan analisis kuantitatif.
DAFTAR
PUSTAKA
Arifin, Zaenal. 2009. Evaluasi Pembelajaran. Bandung: PT.
Remaja Rosda Karya.
Arikunto, Suharsimi.2006. Dasar-Dasar Evaluasi Pendidikan (Edisi
Revisi). Jakarta:
Bumi Aksara.
Purwanto,
Ngalim. 2010. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung:
PT Remaja
Rosda Karya.
Sudijono, Anas. 1996. Pengantar Evaluasi Pendidikan. Jakarta:
PT Raja Gravindo
Persada.
Suprananto, Kusaen. 2012. Pengukuran dan Penilaian Pendidikan.
Yogyakarta: Graha Ilmu.
0 komentar:
Posting Komentar