Rabu, 07 Juli 2010

ANALISIS BUTIR SOAL

Analisis butir soal atau analisis item adalah pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai.

Untuk melakukan analisis terhadap sebuah butir soal ada dua pendekatan yang bisa digunakan yaitu dengan teori tes klasik dan teori respon butir. selain itu, soal juga dapat di analisis dengan menggunakan analisis kualitatif (teoritis) dan kuantitatif (empiris). Insya Allah penulis akan sedikit membahas keempat hal tersebut. akan tetapi untuk saat ini, penulis akan membahas analisis soal dengan cara kualitatif atau teoritis.

Analisis secara kualitatif dilakukan dengan melakukan penelaahan terhadap setiap butir soal dari aspek materi, konstruksi dan bahasa. Aspek materi yang ditelaah berkaitan dengan substansi keilmuan yang ditanyakan dalam butir tes serta tingkat kemampuan yang sesuai dengan tes. Analisis konstruksi dimaksudkan untuk melihat hal-hal yang berkaitan dengan kaidah penulisan tes. Analisis bahasa dimaksudkan untuk menelaah tes berkaitan dengan penggunaan bahasa Indonesia yang baik dan benar menurut Ejaan Yang Disempurnakan (EYD).

Telaah secara kualitatif dilakukan oleh tiga orang yang memiliki kompetensi sesuai dengan aspek materi konstruksi dan bahasa. Setiap penelaah melakukan analisis terhadap setiap butir soal berdasarkan kriteria yang telah ditetapkan sebelumnya dengan menuliskan huruf “Y” jika butir sesuai dengan kriteria dan huruf “T” jika butir tidak sesuai dengan kriteria yang telah ditetapkan.

Ada dua jenis analisis butir soal, yakni anasisis tingkat kesukaran soal dan analisis daya pembeda disamping validitas dan reliabilitas. Menganalisis tingkat kesukaran soal artinya mengkaji soal-soal tes dari segi kesulitannya. Sehingga dapat diperoleh soal-soal mana yang termasuk mudah, sedang, dan sukar. Sedangkan menganalisis daya pembeda artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk kedalam kategori lemah atau rendah dan kategori kuat atau tinggi prestasinya. Sedangkan validitas dan reliabilitas mengkaji kesulitan dan keajegan pertanyaan tes.

A. ANALISIS TINGKAT KESULITAN

Asumsi yang digunakan untuk memperoleh kualitas soal yang aik, di samping memenuhi validitas dan reliabilitas, adalah adanya keseimbangan dari tingkat kesulitan soal tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-soal yang termasuk mudah, sedang, dan sukar secara proporsional. Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya, buan dilihat dari sudut guru sebagai pembuat soal. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal yang termasuk mudah, sedang, dan sukar.

Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal kategori mudah, sedang, dan sukar. Pertimbangan pertama adalah adanya keseimbangan, yakni jumlah soal sama untuk ketiga kategori tersebut. Pertimbangan kedua proporsi jumlah soal untuk ketiga kategori tersebut didasarkan atas kurva normal. Artinya, sebagian besar soal berada dalam kategori sedang, sebagian lagi termasuk ke dalam kategori mudah dan sukar dengan proporsi yang seimbang.

Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa salam menjawabnya, bukan dilihat dari sudut guru sebagai pembuat soal. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan criteria soal termasuk mudah, sedang, dan sukar.

Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa akan menjadi putus asa dan tak mempunyai semangat untuk mencoba lagi karena di luar jangkauan.

Bilangan yang menunjukan sukar dan mudahnya sesuatu soal disebut indeks kesukaran (difficulty indeks). Besarnya indeknya kesukaran antara 0.00 sampai dengan 1.0 indeks kesukaran ini menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0.0 menunjukan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa soalnya terlalu mudah,.

0,0 1,0

Sukar mudah

Persoalan lain adalah menentukan kriteria soal, yaitu ukuran untuk menentukan apakah soal tersebut termasuk mudah, sedang, atau sukar. Dalam menentukan kriteria ini digunakan judgment dari guru berdasarkan pertimbangan-pertimbangan tertentu. Pertimbangan tersebut antara lain adalah:

1. Ailitas yang diukur dalam pertanyaan tersebut. Misalkan untuk bidang kognitif, aspek pengetahuan atau ingatan dan pemahaman termasuk kategori mudah, aspek penerapan dan analisis termasuk kategori sedang, dan aspek sintesis dan evaluasi termasuk kategori sukar.

2. Sifat materi yang diujikan atau ditanyakan. Misalnya ada fakta, konsep, prinsip dan hukum, serta generalisasi. Fakta termasuk ke dalam mudah, konsep dan hukum termasuk ke dalam kategori sedang, dan generalisasi (menarik kesimpulan) termasuk ke dalam kategori sukar.

3. Isi bahan yang ditanyakan sesuai dengan bidang keilmuan, baik luasnya atau kedalamannya. Tentang persoalan isi bahan yang akan diujikan, guru sendiri harus sudah bisa mennentukan mana yang termasuk mudah, sedang, atau sukar.

4. Bentuk soal. Misalnya dalam tes objektif, tipe soal benar salah lebih mudah daripada pilihan berganda dengan option tiga atau empat. Menjodohkan relatif leih sulit daripada pilihan berganda jika terdapat lima atau leih yang harus dipasangkan.

Hal yang sama berlaku dalam menyusun tes uraian (esai). Artinya soal-soal jenis esai hendaknya memperhatikan pula tingkat kesukaran soal. Mengingat sifatnya, menentukan tingkat kesukaran soal tes uraian jauh lebih mudah dari pada tes objektif. Melalui analisis abilitas yang diukur serta isi dan sifat bahan yang ditanyakan, dalam tes uraian dapat dengan mudah menentukan tingkat kesukaran.

Cara melakuakan analisis untuk menentukan tingkat kesukaran soal adalah dengan menggunakan rumus sebagai berikut:

I

B

N

=

=

=

Indeks kesulitan untuk setiap butir soal

Banyaknya siswa yang menjawab benar setiap butir soal

Banyaknya siswa yang memberikan menjawab pada soal yang dimaksudkan

Cara lain dalam melakuakn analisis tingat kesukaran soal adalah dengan menggunakan Tabel Rose dan Stanley. Kriterianya adalah:

Persentase

Option

Kategori

2

3

4

5

16

50

84

0,16n

0,5n

0,84n

0,213n

0,667n

0,20n

0,24n

0,75n

1,26n

0,25n

0,80n

0,344n

Mudah

Sedang

Sukar

Keterangan:

- Option 2 adalah bentuk benar salah

- Option 3, 4, 5 adalah bentuk pilihan berganda

- - n adalah 27% dari banyaknya peserta yang mengikuti tes

Dalam menghitung indeks kesukaran soal. Rumusnya adalah sebagai berikut:

SR – ST

- SR adalah siswa yang menjawab salah dari kelompok rendah

- ST adalah siswa yang menjawab salah dari kelompok tinggi

B. ANALISIS DAYA PEMBEDA

Analisis daya pembeda mengkaji butir-butir soal dengan tujuan untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggi prestasinya dengan siswa yang tergolong kurang atau lemah prestasinya. Tes dikatakan tidak memiliki daya pembeda apabila tes tersebut, jika diujikan kepada anak yang prestasinya tinggi, hasilnya rendah, tetapi bila diberikan kepada anak yang lemah, hasilnya tinggi. Atau jika diberikan kepada kedua kategori siswa tersebut hasinya sama. Dengan demikian, tes yang tidak memiliki daya pembeda, tidak akan menghasilkan gambaran hasil yang sesuai dengan kemampuan siswa yang sebenarnya.

Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara warga belajar/siswa yang telah menguasai materi yang ditanyakan dan warga belajar/siswa yang tidak/kurang/belum menguasai materi yang ditanyakan. Manfaat daya pembeda butir soal adalah seperti berikut ini.

1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau ditolak.

2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat dicurigai "kemungkinannya" seperti berikut ini.

· Kunci jawaban butir soal itu tidak tepat.

· Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar

· Kompetensi yang diukur tidak jelas

· Pengecoh tidak berfungsi

· Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak

· Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah informasi dalam butir soalnya

Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, disingkat D (d besar). Seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00-1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi dipergunakan jika sesuatu soal “terbaik“ menunjukkan kualitas tes tersebut. Apa itu anak pandai disebut bodoh dan anak bodoh disebut pandai.

Dengan demikian ada tiga titik pada daya pembeda, yaitu :

-1, 00 0, 00 1, 00

Daya pembeda Daya pembeda Daya pembeda

Negatif Rendah Tinggi (positif)

Cara yang dilakukan dalam analisis daya pembeda adalah dengan menggunakan tabel atau criteria dari pase dan Stanley sport dalam analisis tingkat kesukaran soal.

Rumusnya adalah : SR – ST

Criteria pengujian daya pembeda adalah sebagai berikut :

Bila SR – ST sama atau lebih besar dari nilai tabel, artinya butir soal itu mempunyai daya pembeda.

· Cara menentukan daya pembeda (nilai D)

Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100 orang ke atas).

a. Untuk Kelompok Kecil

Seluruh kelompok tes tersebut dibagi dua sama besar, 50 % kelompok atas dan 50 % kelompok bawah.

Contoh :

Siswa

Skor

A

B

C

D

E

F

G

H

I

J

Kelompok atas (JA)

9

8

7

7

6

5

Kelompok bawah (JB)

5

4

4

3

Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah lalu dibagi 2

b. Untuk Kelompok Besar

Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27 % skor teratas sebagai kelompok atas (JA) dan 27 % skor terbawah sebagai kelompok bawah (JB).

JA = Jumlah kelompok atas

JB = Jumlah kelompok bawah

Contoh :

9

27 % sebagai JA

9

8

8

8

.

.

.

.

.

.

.

.

.

.

27 % sebagai JB

2

1

1

1

0

Rumus mencari D

Rumus untuk menentukan indeks diskriminasi adalah :

D =

BA

-

BB

=

PA - PB

JA

JB

Dimana :

J = Jumlah peserta tes

JA = Banyaknya peserta kelompok atas

JB = Banyaknya peserta kelompok bawah

BA = Banyaknya peserta kelompok atas yang menjawab soal itu dengan benar

BB = Banyak peserta kelompok bawah yang menjawab soal itu dengan benar

PA = Proporsi peserta kelompok atas yang menjawab benar (ingat P sebagai indeks kesukaran)

PB = Proporsi peserta kelompok bawah yang menjawab benar

c. Pola Jawaban Soal

Yang dimaksud pola jawaban soal disini adalah distribusi tes tersebut dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya tes tersebut yang memilih pilihan jawaban a, b, c atau d atau yang tidak memilih pilihan manapun (blangko). Dalam istilah evaluasi disebut objek disingkat O

Dengan melihat pola jawaban soal, dapat diketahui :

1. Taraf kesukaran soal

2. Daya pembeda soal

3. Baik dan tidaknya distraktor

Sesuatu distroktor dapat diperlakukan dengan 3 cara :

a. Diterima, karena sudah baik

b. Ditolak, karena tidak baik

c. Ditulis kembali karena kurang baik

Menulis soal adalah suatu pekerjaan yang sulit, sehingga apabila masih dapat diperbaiki sebaiknya diperbaiki saja, tidak dibilang suatu distroktor dapat dikatakan berfungsi baik jika paling sedikit dipilih 5 % pengikut tes.

Cara lain menghitung daya pembeda adalah dengan menempuh langkah sebagai berikut:

1. Memeriksa jawaban soal semua siswa peserta tes.

2. Membuat daftar peringkat hasil tes berdasarkan skor yang dicapainya.

3. Menentukan jumlah sampel 27% dari jumlah peserta tes untuk kelompuk siswa pandai(peringkat atas) dan 27% untuk kelompok siswa kurang (peringkat bawah).

4. Melakukan analisis butir soal, yakni menghitung jumlah siswa yang menjawab salah dari semua nomor soal, baik pada kelompok pandai maupun pada kelompok kurang.

5. Menghitung selisih jumlah siswa yang salah menjawab pada kelompok kurang dan kelompok pandai (SR-ST).

6. Membandingkan nilai selisih yang diperoleh dengan table Rose dan Stanley.

7. Menentukan ada tidaknya daya pembeda ppada setiap nomor soal dengan kriteria ” memiliki daya pembeda” bil selisih jumlah siswa yang menjawab salah anatar kelompok kurang dengan kelompok pandai(SR-ST) sama atau lebih besar dari nilai table.

Butir soal yang tidak memiliki daya pembeda diduga terlalu mudah atau terlalu sukar sehingga perlu diperbaiki atau diganti dengan pertanyaan lain. idealnya semua butir soal memiliki daya pembeda dan tingat kesukaran. Tes yang telah dibakuan, di samping memenuhi validitas dan reliabilitas, juga memenuhi tingkat kesukaran dan daya pembeda.

Kriteria Untuk Menentukan Soal Yang Baik dan Tidak Baik

Untuk menentukan apakah suatu soal dikatakan baik atau tidak baik sehingga perlu direvisi, digunakan kriteria sebagai berikut :

a. Untuk soal yang berbentuk benar-salah (true-false) :

- Jika tingkat kesukarannya sama atau lebih kecil dari 0, 16, dikategorikan soal yang suka.

- Jika tingkat kesukarannya sama atau lebih besar dari 0, 84, dikategorikan soal yang mudah.

b. Untuk soal yang berbentuk pilihan ganda (multiple choice) :

- Untuk pilihan ganda dengan option 3, jika tingkat kesukarannya sama atau lebih kecil dari 0,21, dikategorikan soal yang sukar, sedangkan Jika tingkat kesukarannya sama atau lebih besar dari 0,79, dikategorikan soal yang mudah.

- Untuk pilihan ganda dengan option 4, Jika tingkat kesukarannya sama atau lebih kecil dari 0,24, dikategorikan soal yang sukar; sedangkan Jika tingkat kesukarannya sama atau lebih besar dari 0,76, dikategorikan soal yang mudah.

c. Jika daya pembeda soal ini adalah 0 (nol) atau negatif (minus), maka soal itu perlu direvisi.diperbaiki.

d. Untuk menentukan daya pembeda suatu soal, di samping kriteria pada c tersebut di atas dapat juga dicari dengan menggunakan “tabel koefisien biserial” dengan mencari R bis dari tabel tersebut. Tabel tersebut digunakan untuk menghitung daya pembeda yang didasarkan atas perhitungan 27 % Upper Group dan 27 % Lower Group.

PROSEDUR ANALISIS ITEM YANG LEBIH SEDERHANA UNTUK “NORM-REFERENCED TEST”

Ada beberapa prosedur analisis item yang dapat dilakukan terhadap norm-referenced test (Thorndike, 1971). Bagi tes-tes hasil belajar yang informal yang digunakan dalam pengajaran, agaknya diperlukan prosedur yang sederhana saja. Langkah-langkah berikut merupakan prosedur yang simple, tetapi efektif.

Misalnya kita akan menganalisis 32 lembar jawaban tes multiple choice dengan 5 option. Maka langkah-langkahnya adalah sebagai berikut:

1. Susunlah 32 lembar jawaban tes tersebut pada skor yang paling tinggi sampai kepada skor yang paling rendah.

2. Ambil ± sepertiga dari jumlah lembar jawaban tes itu yang mendapat skor tinggi, dan sebutlah ini Upper Group (10 lembar). Dan ambil pula ± sepertiga dari jumlah lembar jawaban tes itu yang mendapat skor rendah, dan sebut Lower Group (10 lembar pula). Pisahkan yang selebihnya, yaitu yang termasuk Middle Group (12 lembar). Meskipun lembaran Middle Group ini dapat dimasukkan ke dalam analisis, penggunaan Upper dan Lower Group saja sudah cukup menyederhanakan prosedur pengelolaan (analisis)

3. Untuk tiap Item, hitunglah jumlah siswa dari Upper Group yang memilih tiap alternatif (option), kemudian kerjakan. Begitu juga pada Lower Group.

4. Catatlah jumlah dari langkah 3 tersebut di dalam catatan tes dalam kolom dimana alternatif itu dipilih. Atau untuk digunakan “kartu item” yang terpisah seperti berikut :

Item no. 1

Alternatif

A

B*

C

D

E

Upper 10

Lower 10

0

3

6

2

3

2

1

3

0

0

Jawaban yang benar

5. Taksirlah Tingkat Kesukaran soal (item difficulty) dengan menghitung persentase siswa ymenjawab Item itu dengan benar. Prosedur sederhana ini adalah untuk mendasarkan penaksiran itu hanya pada siswa-siswa yang termasuk di dalam kelompok analisis item itu. Dengan demikian, jumlah siswa dalam Upper dan Lower Group (10 + 10 = 20) yang memilih jawaban benar pada Item no. 1 di atas adalah 6 + 2 = 8. Dari situ kita dapat menghitung Indeks Kesukaran soal sebagai berikut :

Index of item difficulty =

Meskipun perhitungan kita hanya didasarkan atas kelompok Upper dan Lower, hasilnya akan menyediakan suatu taksiran mendekati kebenaran yang berlaku untuk jumlah kelompok seluruhnya. Ini berarti bahwa indeks kesukaran no. 1 sebesar 40 % itu berlaku untuk kelompok (32 orang) yang mengerjakan tes itu.

Dengan demikian, karena “tingkat kesukaran” itu menunjukkan “persentase jawaban item yang benar”, maka makin kecil persentase menunjukkan makin sulit item itu.

Rumus untuk menghitung item difficulty adalah sebagai berikut :

P =

P = Persentase yang menjawab item itu dengan benar

R = Jumlah yang menjawab item itu dengan benar

T = Jumlah total (siswa) yang mencoba menjawab item itu.

6. Taksirlah daya pembeda (diseriminating power) item itu dengan membandingkan jumlah siswa dalam Upper Group dan Lower Group yang menjawab item dengan benar. Dari contoh di atas ternyata bahwa 6 siswa pada Upper Group dan 2 siswa pada Lower Group menjawab dengan benar. Ini menunjukkan daya pembeda yang positif karena item itu dapat membedakan siswa yang pandai (upper) dan siswa yang kurang (lower); yang menjawab benar dari Upper Group jumlahnya lebih banyak daripada yang menjawab benar dari Lower Group. Dari item no. 1 kita dapat menghitung besarnya daya pembeda item itu sebagai berikut :

Index of item discriminating power =

Rumus daya pembeda : DP =

DP = Daya pembeda atau discriminating power yang dicari

U = Jumlah jawaban yang benar dari Upper-Group

L = Jumlah jawaban yang benar dari Lower Group

½ T = Setengah dari jumlah Upper dan Lower-Group

Daya pembeda dari suatu item dinyatakan dengan pecahan decimal dan indeks maksimum daya pembeda yang positif = 1, 00

Daya pembeda nol (0, 00) diperoleh jika jumlah siswa yang sama pada kedua kelompok (Upper dan Lower) menjawab item itu dengan benar.

Jadi :

DP =

Daya pembeda negatif diperoleh jika yang menjawab benar suatu item pada Lower Group jumlahnya lebih besar ketimbang pada Upper Group.

Jadi :

DP =

Jika dari hasil analisis suatu item diperoleh DP = 0 (nol) atau DP = - (minus), item yang bersangkutan harus dibuang atau diganti dengan yang baru.

7. Tentukan keefektifan distruktornya dengan membandingkan jumlah siswa pada Upper Group dan Lower Group yang memilih tiap alternative yang salah.

INTERPRETASI DATA ANALISIS ITEM TES NORM-REFERENCED

Jika kita menggunakan jumlah siswa yang relative kecil dalam menganalisis item tes hasil belajar kelas, informasi analisis item hendaknya diinterpretasikan dengan sangat berhati-hati. Baik tingkat kesukaran maupun daya pembeda suatu item dapat berubah-ubah atau berbeda-beda antara kelompok yang satu dengan kelompok yang lain.

Jika suatu item menunjukkan indeks positif dalam diskriminasi, jika semua alternatifnya berfungsi secara efektif, dan jika item itu mengukur secara pedagogis hasil yang disignifikasi, item itu hendaknya dipertahankan dan disimpan dalam file item untuk digunakan pada waktu yang akan datang.

Jika items itu disimpan dalam file dan digunakan kembali sesudah beberapa saat tertentu, data hasil analisis item itu sebaiknya dicatat pada kartu setiap saat item itu digunakan. Kumpulan data semacam itu akan memperlihatkan variabilitas dalam indeks kesukaran item dan daya pembedanya, dan dengan demikian informasi itu lebih interpretable.

PROSEDUR ANALISIS ITEM UNTUK CRITERION-REFERENCED TESTS

Dasar pemikiran dalam, mengevaluasi items dalam tes penguasaan criterion-referenced adalah sampai sejauh mana tiap item dapat mengukur hasil pengajaran (effects of instruction). Jika suatu item dapat dijawab dengan benar oleh semua siswa, baik sebelum maupun sesudah diajari, jelaslah bahwa item itu tidak mengukur hasil pengajaran. Demikian juga, jika suatu item dijawab salah oleh semua siswa, baik sebelum maupun sesudah siswa mendapat pelajaran, item tersebut tidak berfungsi sebagai alat evaluasi. Kedua-duanya merupakan contoh yang ekstrem; namun, kedua contoh tersebut memberikan petunjuk penting bagi pencapaian pengukuran hasil pengajaran sebagai satu dasar bagi penentuan kualitas item.

Indeks sensitivitas bagi keberhasilan pengajaran (sensitivity of instructional effect) (S) dapat dihitung dengan menggunakan rumus berikut :

RA - RB

S =

T

S = Sensitivitas keberhasilan yang dicari

RA = Jumlah siswa yang menjawab benar item itu sesudah pengajaran

RB = Jumlah siswa yang menjawab benar item itu sebelum pengajaran

T = Jumlah total jawaban item itu yang benar kedua-duanya, sebelum dan dan sesudah pengajaran.

Misalkan suatu item dijawab salah oleh semua siswa (32 orang) sebelum pengajaran, dan dijawab benar oleh semua siswa sesudah pengajaran. Dengan menggunakan rumus di atas akan kita peroleh sebagai berikut:

32 – 0

S = = 1,00

32

Jadi maksimum sensitivitas keberhasilan pengajaran dinyatakan dengan indeks 1,00. Indeks items yang efektif akan berada di antara 0,00 dan 1,00 dan makin besar nilai positif yang diperoleh menunjukkan bahwa item itu sensitivitas keberhasilan pengajarannya makin besar pula. Dengan kata lain, makin besar angka indeks yang diperoleh, makin besar pula sensitivitas keberhasilan pengajarannya.

Ada beberapa pembatasan dan penggunaan indeks sensitivitas itu. Pertama, guru harus memberikan tes itu dua kali untuk menghitung indeks. Kedua, suatu indeks yang rendah tidak selalu benar menunjukkan item yang tidak efektif atau pengajaran yang tidak efektif.

Ketiga, respons para siswa terhadap item-item itu sesudah menerima pelajaran, mungkin sedikit-banyak dipengaruhi oleh pengerjaan mereka pada tes yang telah dilakukan pada waktu sebelum menerima pelajaran. Pembatasan yang berakhir ini akan terlihat dan dirasakan siswa jika pengajaran itu diberikan dalam waktu yang singkat.

Daftar Pustaka

Arikunto, Suharsimi. 2005. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Angkasa

Ngalim Purwanto, M. 2002. Prinsip dan Teknik Evaluasi Belajar, Bandung: Remaja Rosdakarya.

Sudjana, Nana. 2001. Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya.

Sudirman N. Ilmu Pendidikan. 1998. Bandung: Remaja Rosdakarya.

http://www.scribd.com/doc/12469231/Makalah1-PANDUAN-ANALISA-BUTIR-SOAL

http://evaluasipendidikan.blogspot.com/2008/06/analisis-butir-soal.html