日本語教師の学習105/テスト得点の分析

古典的テスト理論における結果処理

古典的テスト理論

Classical Test Theory

1950 年代までにスピアマン(Spearman)などによって開発されたテスト理論。あるテストによって得られた得点を真の得点+誤差得点と考え、得られた得点の平均値、分散および相関関数により分析を行う。テストや受験者が異なれば素点、項目困難度、項目弁別力は異なる。

素点

raw score

偏差値などに変換する前の、テストの正答数に基づく得点。

項目困難度(難易度)

item difficulty

正答率[正答者数/受験者数]

天井効果

ceiling effect

テストが易しすぎて得点の分布が上限値付近に集中し、差が検出できなくなること。

床効果

floor effect

テストが難しすぎて得点の分布が下限値付近に集中し、差が検出できなくなること。

項目弁別力

item discrimination

テスト項目が受験者の能力の高低をどの程度正確に捉えているかを表す指標。

基礎統計量

代表値

average, measure of central tendency

平均値、中央値、最頻値など

度数分布とヒストグラム

度数分布

frequency distribution

ある値を持つデータの個数を度数といい、その度数と各値を対応させたもの。

パーセンタイル得点/順位

パーセンタイル

percentile

受験者全体を 100 として、その中での相対的な位置づけを示すもの。

正規分布

normal distribution

データの散らばりを分布といい、この分布に偏りがなく、代表値を中心にした一つの山で左右対称の釣鐘状のなだらかな曲線のこと。

散布度

dispersion

レンジや標準偏差など、得点の散らばりの程度を示す指標。

レンジ

range

データの最大値と最小値の差のこと。

標準偏差

standard deviation

データが平均からどの程度ずれているかを示す値。

偏差値

deviation score

平均値や標準偏差が異なるテストを比較するために、標準化した得点。

偏差値=(得点ー平均点)÷標準偏差×10+50

項目分析

項目分析

item analysis

テストの各項目の適切性を検討する方法。

弁別指数

discrimination index

弁別指数=(成績上位群の正答率)ー(成績下位群の正答率)

点双列相関係数

point-biserial correlation coefficient

テスト全体の得点と各項目の得点の関係をみるときに使われる指標

項目特性曲線

item characteristic curve

縦軸に正答率を、横軸に能力値の高低を取り、項目ごとの特性を線グラフで表したもの

SP 表

student-problem table

評価においてどの項目が習得されているか、受験者全体でどの程度習得が進んでいるかを見るために用いられる

t 検定

t-test

2つの平均値の差が統計的に有意なものであるかを検定する分析方法

分散分析(ANOVA)

analysis of variance

3つ以上の平均値の差が統計的に有意なものであるかを検定する分析方法

KR 情報

Knowledge of Results

学習者の反応や答えが正しいかどうかに関して、教師が与える情報のこと

項目応答理論における結果処理

項目応答理論

Item Response Theory

複数の異なるテストの得点を比較可能な共通の尺度上に表すための統計的理論に基づいたテスト理論

項目反応理論とも言う

予備テスト

preparation test

本試験に先立って、データ収集のために行われる試行試験

成績は出さない

パラメーター

parameter

予備テストによって集められたデータ

これを基にして、本試験の成績を算出する

コンピューター適応型テスト

Computerized Adaptive Test, Computer-Adaptive Testing

コンピューターを用いた試験形式

最初に中レベルの難易度の問題が出題され、正答であれば次の出題の難易度が上がり、誤答であれば次の出題の難易度が下がるという形式で進む

尺度点

scaled scores

得点等化を行って共通の尺度に基づいて表示した得点

尺度得点とも言う

得点等化

equation

同じ能力を測定する問題項目の異なる複数のテストで測定された結果を比較できるように共通の尺度上の得点に変換すること

2010年の日本語能力試験(JLPT)の改訂

コミュニケーション重視となった

4段階から5段階となった

Can-do リストが導入された

足切り点が導入された

年2回の実施となった

尺度得点(項目応答理論)が導入された

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です