わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

20問の項目特性曲線


「この曲線の見方について説明します.20問の問題(項目),それぞれの特性を表す曲線ということで,『項目特性曲線』と呼ばれます.
横軸は能力値と呼ばれる値で,平均な能力のときはゼロに位置し,より高ければプラス(右方向)に,低ければマイナス(左方向)になります.
縦軸は正答確率です.例えば黄色の曲線について,能力値ゼロのところの値は,およそ0.9です.これは,能力値がプラスマイナスゼロの人々が,これに対応する問題を解いたら,正解率は90%になるだろうという意味です.
20本の曲線は,実際には完全に独立したものではなく,今回の分析では約100名が,同一の問題20問をすべて解いたという解答データ(項目反応パターン)に依存しています.別の言い方をすると,項目反応パターンを,Rおよびirtoys*1ライブラリを使って分析しまして,各問題すなわち項目については,項目特性曲線をつくるための数値情報を,また各解答者には,能力値を表す実数値を,同時に推定したというわけです.
さて,通常,項目特性曲線は右上がりになります.というのも,能力値の高い人は,より多くの問題に正解できること,能力値の低い人は,より多くの問題に不正解となることが,項目反応理論(モデル)において,想定されるからです.
そして,単に右上がりになるのではなく,S字カーブを描き,かつ中間部分の傾きが大きくなるのが,より良いとされています.実際には,この曲線を作成するより前に推定した実数値の一つ,『識別力』が高ければ,望ましい形状となります.
ある能力値未満では正答確率が0,その値を超えれば1になるという,ヘビサイドの階段関数*2というのが,その形状の究極的なものです.というのも,その能力値をしきい値として,問題に正答できるかできないかが『識別』できるからです.
とはいえ現実には,より高い能力値の人が間違えたり,低い能力値の人が正解したりすることもあるので,それらを考慮すると,S字の曲線となります.
なのですが,20本の曲線のうち,上のほうに,右下がりの曲線があります.素直に解釈すると,これは,能力値の極めて低い人は100%近くの正答率を得ているのに対し,能力値が極めて高い人は80%ほどの正答率に落ち込んでいます.
分析に使用した,項目反応パターンのExcelファイルを見直したところ,能力値が高かった人がこの問題を間違えていたのが,影響していました.
ただしその人が正解していたとしても,どの能力値でも正答率がほぼ100%というのは,しっかり学んできた人(能力値の高い人)と,あまり身についていない人(能力値の低い人)とを識別するのに適さないということになります.結局のところ,この問題は,項目反応モデルのもとでは『悪い問題』であることを意味します*3
正解率の高低と,曲線の形状について,直接的には依存関係はありません.実際,今回の分析では,全体の正答率としては90%近くですが,識別力の値もそこそこ高いというのがありました.全体の正答率が高い場合には,曲線はどちらかというと左に位置します.正答率が50%となる能力値が,より左に来るからです.項目ごとに推定した値の一つ,『困難度』が密接に関係します」

何をしたか

昨日,2018年電子情報通信学会総合大会にて,「項目反応理論に基づく大学初年度向け情報リテラシー科目の理解度テスト分析」と第して発表を行いました.昨年7月,前期の情報処理科目(の自担当クラス)の最終回で解いてもらった,5択20問について,表形式(項目反応パターン)にしてから分析し,表単体では知ることのできなかった,問題の良し悪しを判断することができたとして,1ページの予稿を提出し,発表したのでした.
処理手順について,スライドに作ったものを,貼り付けておきます.第2筆者が卒論発表で作成したものに,分析によって「能力値」「識別力・困難度」を得たことを,付け加えました.

次年度も使用する予定なので,具体的にどんな出題であったかは,差し控えます.

*1:SQLiteを「エスキューエライト」と呼ぶのと同じように,irtoysを「アイアールトイズ」と呼んでいます.irtはitem response theory,すなわち項目反応理論の頭文字です.toysについて,「おもちゃ」と解釈もできますが,Rで項目反応理論に基づく分類をするにあたり有用な機能を提供しています.

*2:wikipedia:ヘヴィサイドの階段関数

*3:この右下がり曲線の項目が,20個のうち識別力最低でした.左端で正答率0.4ほど,右端で0.6ほどの,緩やかな赤色の線が,その次に識別力が低く,これも,「分かっている人」と「分かっていない人」との識別に適しておらず,悪い問題と言えます.