目次
古典的テスト理論における結果処理
古典的テスト理論
Classical Test Theory
1950 年代までにスピアマン(Spearman)などによって開発されたテスト理論。あるテストによって得られた得点を真の得点+誤差得点と考え、得られた得点の平均値、分散および相関関数により分析を行う。テストや受験者が異なれば素点、項目困難度、項目弁別力は異なる。
素点
raw score
偏差値などに変換する前の、テストの正答数に基づく得点。
項目困難度(難易度)
item difficulty
正答率[正答者数/受験者数]
天井効果
ceiling effect
テストが易しすぎて得点の分布が上限値付近に集中し、差が検出できなくなること。
床効果
floor effect
テストが難しすぎて得点の分布が下限値付近に集中し、差が検出できなくなること。
項目弁別力
item discrimination
テスト項目が受験者の能力の高低をどの程度正確に捉えているかを表す指標。
基礎統計量
代表値
average, measure of central tendency
平均値、中央値、最頻値(流行値、モード)など
度数分布とヒストグラム
度数分布
frequency distribution
ある値を持つデータの個数を度数といい、その度数と各値を対応させたもの。
ヒストグラム
度数分布を、柱状のグラフにして間隔を詰めたもの。
パーセンタイル得点/順位
パーセンタイル
percentile
受験者全体を 100 として、その中での相対的な位置づけを示すもの。
正規分布
normal distribution
データの散らばりを分布といい、この分布に偏りがなく、代表値を中心にした一つの山で左右対称の釣鐘状のなだらかな曲線のこと。
散布度
dispersion
レンジや標準偏差など、得点の散らばりの程度を示す指標。
レンジ
range
データの最大値と最小値の差のこと。
標準偏差
standard deviation
データが平均からどの程度ずれているかを示す値。
偏差値
deviation score
平均値や標準偏差が異なるテストを比較するために、標準化した得点。
偏差値=(得点ー平均点)÷標準偏差×10+50
項目分析
項目分析
item analysis
テストの各項目の適切性を検討する方法。
弁別指数
discrimination index
弁別指数=(成績上位群の正答率)ー(成績下位群の正答率)
点双列相関係数
point-biserial correlation coefficient
テスト全体の得点と各項目の得点の関係をみるときに使われる指標
項目特性曲線
item characteristic curve
縦軸に正答率を、横軸に能力値の高低を取り、項目ごとの特性を線グラフで表したもの
SP 表
student-problem table
評価においてどの項目が習得されているか、受験者全体でどの程度習得が進んでいるかを見るために用いられる
t 検定
t-test
2つの平均値の差が統計的に有意なものであるかを検定する分析方法
分散分析(ANOVA)
analysis of variance
3つ以上の平均値の差が統計的に有意なものであるかを検定する分析方法
KR 情報
Knowledge of Results
学習者の反応や答えが正しいかどうかに関して、教師が与える情報のこと
項目応答理論における結果処理
項目応答理論
IRT:Item Response Theory
複数の異なるテストの得点を比較可能な共通の尺度上に表すための統計的理論に基づいたテスト理論
項目反応理論とも言う
予備テスト
preparation test
本試験に先立って、データ収集のために行われる試行試験
成績は出さない
パラメーター
parameter
予備テストによって集められたデータ
これを基にして、本試験の成績を算出する
コンピューター適応型テスト
Computerized Adaptive Test, Computer-Adaptive Testing
コンピューターを用いた試験形式
最初に中レベルの難易度の問題が出題され、正答であれば次の出題の難易度が上がり、誤答であれば次の出題の難易度が下がるという形式で進む
尺度点
scaled scores
得点等化を行って共通の尺度に基づいて表示した得点
尺度得点とも言う
得点等化
equation
同じ能力を測定する問題項目の異なる複数のテストで測定された結果を比較できるように共通の尺度上の得点に変換すること
2010年の日本語能力試験(JLPT)の改訂
コミュニケーション重視となった
4段階から5段階となった
Can-do リストが導入された
足切り点が導入された
年2回の実施となった
尺度得点(項目応答理論)が導入された
コメントを残す