拉什(RASCH)测量怎么返回logit
拉什(RASCH)测量怎么返回logit
RASCH测量是测量学领域里面的项目反应理论(IRT)的一种测量方法,国际上的PISA测量就是这种测量。一些测量研究的文章里也提到,有的儿童教育或者语言训练等进入中国市场的教育机构使用的观察学员学习发展的测量模型,多数地,也是RASCH测量。但在高中里使用RASCH的人或学校,确实不多见。这可能是RASCH较之经典测量CTT太深奥、太麻烦。由于巧合的原因,接触了一点儿RASCH,于是看了一点点RASCH的文献,包括Winsteps的手册manual和教程tutorial,译了其中的3篇。然而基础知识实在太太□□□□(此处省略996个太字)有限,最后只凑了些学习笔记。这种感觉仿佛目不识丁的人研读杨振宁老先生的论文,每翻一页都认不出几个字来,太扎心。
但RASCH测量先天的优秀品质令人着迷:它把试题难度与被试能力放在等距标尺上,两把尺子靠在一起,互相参看试题难度和答题能力,而不是经验性的描述。若以往的测量,两个90分的学生表明同等水平和能力,但RASCH下可能会有所不同。RASCH测量的令人信服,是其常识性的前提假设:答题者的能力大于试题难度,答对的概率就高;各种能力答对容易题的概率高。
在Winsteps的一点儿学习笔记里,有人问Winsteps里面如何输出logit,目前没有学习明白——期望能有机会研究明白它们,总会学明白的。目前在⑴R语言的ltm包介绍、⑵一份EXCEL计算RASCH和⑶RASCH.org上面的一个Excel算法,即学习RASCH的人基本都要去读的Ben Wright“最佳测试”的算法——基于二分记分、单一参数。权作笔记。
RASCH是个庞大的家庭,在经典RASCH模型下,不计其数的数学家们在给RASCH添砖加瓦。winsteps的二分值测量是经典RASCH,在ltm: An R Package for Latent Variable Modeling and Item Response Theory Analyses的3.1节 An example with binary data上,介绍了简单的logit输出,但这个东西与手工计算的并不相同。不知何故。
假设有10个学生答了10个题,二分记分如表格所示。
在Excel里面输入原始信息,另存csv,R读csv比较方便。
#调入ltm包
library("ltm")
#调入eRm包
library("eRm")
#从csv读入数据
mydata <- read.csv("C:/demo.csv", header = T)
#如果csv中有输入错误,as.numric会提示
#mydata1<-as.data.frame(lapply(mydata[,2:11],as.numeric))
#去掉person列
mydata1 <- mydata[, 2:11]
#最大似然估计
res <- rasch(mydata1)
res
descript(mydata1)
输出:
> descript(mydata1)
Descriptive statistics for the 'mydata1' data-set
Sample:
10 items and 10 sample units; 0 missing values
Proportions for each level of response:
0 1 logit
I1 0.1 0.9 2.1972
I2 0.1 0.9 2.1972
I3 0.1 0.9 2.1972
I4 0.3 0.7 0.8473
I5 0.4 0.6 0.4055
I6 0.4 0.6 0.4055
I7 0.6 0.4 -0.4055
I8 0.7 0.3 -0.8473
I9 0.8 0.2 -1.3863
I10 0.8 0.2 -1.3863
Frequencies of total scores:
0 1 2 3 4 5 6 7 8 9 10
Freq 0 1 0 1 1 2 2 1 0 0 2
Point Biserial correlation with Total Score:
Included Excluded
I1 0.5835 0.5023
I2 0.5835 0.5023
I3 0.0869 -0.0249
I4 0.5770 0.4454
I5 0.7450 0.6447
I6 0.6690 0.5477
I7 0.7754 0.6845
I8 0.7233 0.6248
I9 0.8007 0.7362
I10 0.8007 0.7362
Cronbach's alpha:
value
All Items 0.8445
Excluding I1 0.8349
Excluding I2 0.8349
Excluding I3 0.8673
Excluding I4 0.8400
Excluding I5 0.8197
Excluding I6 0.8304
Excluding I7 0.8152
Excluding I8 0.8218
Excluding I9 0.8124
Excluding I10 0.8124
Pairwise Associations:
Item i Item j p.value
1 1 3 1.00
2 1 7 1.00
3 1 8 1.00
4 1 9 1.00
5 1 10 1.00
6 2 3 1.00
7 2 7 1.00
8 2 8 1.00
9 2 9 1.00
10 2 10 1.00
看起来logit是通过正确率/(1-正确率)计算的,这大约是计算难度时的logit的倒数。是反着对应的。