认知诊断计算机化自适应测验中在线标定方法的开发被引量：28

Developing On-line Calibration Methods for Cognitive Diagnostic Computerized Adaptive Testing

下载PDF

导出

摘要项目增补对认知诊断计算机化自适应测验(CD-CAT)中的题库维护至关重要。在传统CAT中,在线标定方法经常用于估计新题的项目参数。然而直到现在,在CD-CAT领域还没有任何关于在线标定的论文公开发表。为将传统CAT中3种有代表性的在线标定方法(MethodA、OEM和MEM)推广至CD-CAT(CD-MethodA、CD-OEM和CD-MEM)建立分析基础,并采用模拟方法对这3种方法进行比较。研究表明:CD-MethodA方法在项目参数的返真性方面优于其它两种方法;自适应标定设计较随机标定设计可以提高项目参数的返真质量。 Like all computerized adaptive testing （CAT） applications, some items in the item bank maybe flawed or obsolete or overexposed and they should be replaced by new items （Wainer ＆ Mislevy, 1990）, item replenishing is essential for item bank maintenance and development in cognitive diagnostic CAT （CD-CAT）. In regular CAT, on-line calibration method is commonly used to calibrate the item parameters of new items. However, until now no reference is publicly available about on-line calibration for CD-CAT. Thus, this study investigated the possibility to extend some current methods used in CAT to CD-CAT situation. Three representative on-line calibration methods in regular CAT were under investigation： Method A （Stocking, 1988）, marginal maximum likelihood estimate with one EM cycle （OEM） method （Wainer ＆ Mislevy, 1990） and marginal maximum likelihood estimate with multiple EM cycles （MEM） method （Ban, Hanson, Wang, Yi, ＆ Harris, 2001）. Under certain theoretical justifications based on the Deterministic Inputs, Noisy ＂and＂ Gate （DINA） model, these methods were generalized to CD-CAT situation, denoted as CD-Method A, CD-OEM and CD-MEM, respectively. Two simulation studies were conducted to compare the performance of the three CD-CAT on-line calibration methods in terms of item-parameter recovery. In the first study, the new items were randomly assigned to the examinees and then were calibrated accordingly. 2000 examinees were generated assuming that each examinee has 50% probability of mastering each attribute, 360 operational items were simulated and their guessing and slipping parameters were all randomly drawn from U （0.05, 0.25）. 20 new items were simulated and the Q matrix corresponding to the new items was constructed by randomly selecting 20 rows from the Q matrix corresponding to the operational items, and the item parameters of new items were also randomly drawn from U （0.05, 0.25）. The Shannon Entropy method was employed to select the next item and the Max

作者陈平辛涛

机构地区北京师范大学发展心理研究所

出处《心理学报》 CSSCI CSCD 北大核心 2011年第6期710-724,共15页 Acta Psychologica Sinica

基金国家自然科学基金项目(30670718) 教育部新世纪优秀人才支持计划(NCET-07-0097)资助

关键词计算机化自适应测验认知诊断在线标定旧题新题 computerized adaptive testing cognitive diagnosis on-line calibration operational item new item

分类号 B841 [哲学宗教—基础心理学]

引文网络
相关文献

参考文献42

1Ban, J. -C., Hanson, B. H., Wang, T., Yi, Q., & Harris, D. J. (2001). A comparative study of on-line pretest item -- calibration/scaling methods in computerized adaptive testing. Journal of Educational Measurement, 38, 19-212. 被引量：1
2Ban, J. -C., Hanson, B. H., Yi, Q., & Harris, D. J. (2002). Data sparseness and online pretest item calibration/scaling methods in CAT. (ACT Research Report 02-01). Iowa City, IA: ACT, Inc. [Available at http://www.eric.ed.gov/ ERICDocs/dataJericdocs2sqllcontent_storage_O 1/0000019b /80/19/da/eg.pdf]. 被引量：1
3Chang, H., & Ying, Z. (1996). A global information approach to computerized adaptive testing. Applied Psychological Measurement, 20, 213-229. 被引量：1
4Chang, Y. -C. I., & Lu, H. (2010). Online calibration via variable length computerized adaptive testing. Psychometrika, 75, 140-157. 被引量：1
5Cheng, Y. (2008). Computerized adaptive testing -- new developments and applications. Unpublished doctoral thesis, University of Illinois at Urbana-Champaign. 被引量：1
6Cheng, Y. (2009). When cognitive diagnosis meets computerized adaptive testing. Psychometrika, 74, 619-632. 被引量：1
7Cheng, Y., & Chang, H. (2007). The modified maximum global discrimination index method for cognitive diagnostic computerized adaptive testing. Paper presented at the 2007 GMAC Conference on Computerized Adaptive Testing, McLean, USA. 被引量：1
8DiBello, L. V., Stout, W. F., & Roussos, L. A. (1995). Unified cognitive/psychometric diagnostic assessment likelihood- based classification techniques. In P. Nichols, S. Chipman, & R. Brennan (Eds.). Cognitively diagnostic assessments (pp. 361-389). Hillsdale: Erlbaum. 被引量：1
9de la Torre, J. (2009). DINA model and parameter estimation: a didactic. Journal of Educational and Behavioral Statistics, 34, 115-130. 被引量：1
10de la Torre, J., & Lee, Y. S. (2010). A note on the invariance of the DINA model parameters. Journal of Educational Measurement, 47, 115-127. 被引量：1

二级参考文献38

1戴海崎,张青华.规则空间模型在描述统计学习模式识别中的应用研究[J].心理科学,2004,27(4):949-951. 被引量：39
2曹亦薇.异常反应模式的识别和分类[J].心理学报,2001,33(6):558-563. 被引量：9
3余嘉元.运用规则空间模型识别解题中的认知错误[J].心理学报,1995,27(2):196-203. 被引量：40
4曲开社,翟岩慧.偏序集、包含度与形式概念分析[J].计算机学报,2006,29(2):219-226. 被引量：52
5陈平,丁树良,林海菁,周婕.等级反应模型下计算机化自适应测验选题策略[J].心理学报,2006,38(3):461-467. 被引量：38
6林海菁,丁树良.具有认知诊断功能的计算机化自适应测验的研究与实现[J].心理学报,2007,39(4):747-753. 被引量：20
7Baker, F. B., & Kim, S. H. (2004). Item Response Theory. Parameter estimation techniques,(2nd eds.). New York, Marcel Dekker. 被引量：1
8Chang, H. H., & Ying, Z. L. (1999). a-stratified multistage computerized adaptive testing. Applied Psychological Measurement, 23(3), 211-222. 被引量：1
9Chang, Y-c. I., & Lu, H. (2009). Online calibration via variable length computerized adaptive testing. Psychometrika, 75(1), 140-157. 被引量：1
10Han, T. Z. (2007). Estimating Item Parameter Adaptively in CAT- With one Parameter Model. IMPS2007, Tokyo. 被引量：1

共引文献30

1杨淑群,蔡声镇,丁树良,丁秋林.基于FCA具有认知诊断功能CAT的设计与实现[J].南京航空航天大学学报,2008,40(5):696-701. 被引量：5
2关丹丹.认知诊断理论与考试评价[J].中国考试,2009(4):8-12. 被引量：18
3谢伟红,孙贝,李仁发.基于试题关系树的自适应诊断测试模型[J].计算机工程与设计,2010,31(16):3670-3674. 被引量：1
4丁树良,杨淑群,汪文义.可达矩阵在认知诊断测验编制中的重要作用[J].江西师范大学学报（自然科学版）,2010,34(5):490-494. 被引量：81
5程小扬,丁树良,严深海,朱隆尹.引入曝光因子的计算机化自适应测验选题策略[J].心理学报,2011,43(2):203-212. 被引量：35
6陈刚,石晋阳.学习者知识状态的自适应测量与诊断方法设计[J].中国电化教育,2011(3):122-126. 被引量：2
7丁树良,汪文义,杨淑群.认知诊断测验蓝图的设计[J].心理科学,2011,34(2):258-265. 被引量：69
8陈平,辛涛.认知诊断计算机化自适应测验中的项目增补[J].心理学报,2011,43(7):836-850. 被引量：27
9陈平,李珍,辛涛.认知诊断计算机化自适应测验的题库使用均匀性初探[J].心理与行为研究,2011,9(2):125-132. 被引量：18
10汪文义,丁树良,游晓锋.计算机化自适应诊断测验中原始题的属性标定[J].心理学报,2011,43(8):964-976. 被引量：32

同被引文献467

1杜金榜.外语教学中的诊断性测试[J].外语教学与研究,1999,31(4):40-43. 被引量：33
2侯光文.教育测量与评价的基本原理[J].当代教育科学,1991(1):73-76. 被引量：1
3戴海崎,张青华.规则空间模型在描述统计学习模式识别中的应用研究[J].心理科学,2004,27(4):949-951. 被引量：39
4辛涛.项目反应理论研究的新进展[J].中国考试,2005(7):18-21. 被引量：26
5余嘉元.运用规则空间模型识别解题中的认知错误[J].心理学报,1995,27(2):196-203. 被引量：40
6殷华,宋继华.CAT能力求解算法研究与优化[J].中国人民公安大学学报（自然科学版）,2005,11(2):59-61. 被引量：1
7王祖俭,黄国兵,丁树良.基于遗传算法的项目反应理论3PLM参数估计[J].江西师范大学学报（自然科学版）,2005,29(6):475-477. 被引量：4
8陈平,丁树良,林海菁,周婕.等级反应模型下计算机化自适应测验选题策略[J].心理学报,2006,38(3):461-467. 被引量：38
9俞宗火,戴海崎,唐小娟.全息项目因素分析在心理学研究中的应用[J].心理与行为研究,2006,4(4):306-311. 被引量：3
10史忠植.知识发现.清华大学出版社.北京:2003 被引量：2

引证文献28

1汪文义,丁树良.题库结构对原始题在线属性标定准确性之影响研究[J].心理科学,2012,35(2):452-456. 被引量：5
2唐小娟,丁树良,俞宗火.计算机化自适应测验在认知诊断中的应用[J].心理科学进展,2012,20(4):616-626. 被引量：14
3辛涛,乐美玲,张佳慧.教育测量理论新进展及发展趋势[J].中国考试,2012(5):3-11. 被引量：35
4苏昭,刘燕.项目反应理论研究综述[J].江西科技学院学报,2013,8(2):45-48.
5陈平,张佳慧,辛涛.在线标定技术在计算机化自适应测验中的应用[J].心理科学进展,2013,21(10):1883-1892. 被引量：9
6骆聪,王霞,钟阳,张敏强.CD-CAT选题策略及其应用[J].心理研究,2014,7(2):23-27. 被引量：1
7张心,涂冬波.计算机化自适应测验中几种常用能力估计方法的特性与评价[J].中国考试,2014(5):18-25. 被引量：2
8宋丽红,汪文义,丁树良.DINA模型项目参数偏差对知识状态估计的影响[J].考试研究,2014,10(4):26-34. 被引量：1
9郭磊,郑蝉金,边玉芳.变长CD-CAT中的曝光控制与终止规则[J].心理学报,2015,47(1):129-140. 被引量：16
10喻晓锋,罗照盛,高椿雷,李喻骏,王睿,王钰彤.使用似然比D^2统计量的题目属性定义方法[J].心理学报,2015,47(3):417-426. 被引量：13

二级引证文献132

1朱佳琪,张启东,马跃文.个体化带教方案在康复治疗运动疗法实习中的应用——基于入岗前考试试卷分析[J].中国高等医学教育,2020(5):88-89. 被引量：2
2郭宪,柏毅.Logistic模型在科学素养评测中的应用[J].东南大学学报（哲学社会科学版）,2021,23(S01):145-148.
3毛秀珍,辛涛.认知诊断CAT中项目曝光控制方法的比较[J].心理学报,2013,45(6):694-703. 被引量：12
4苏昭,刘燕.项目反应理论研究综述[J].江西科技学院学报,2013,8(2):45-48.
5郭磊.认知诊断理论及其应用[J].心理技术与应用,2013(2):27-31. 被引量：9
6陈平,张佳慧,辛涛.在线标定技术在计算机化自适应测验中的应用[J].心理科学进展,2013,21(10):1883-1892. 被引量：9
7詹沛达,王文中,王立君.项目反应理论新进展之题组反应理论[J].心理科学进展,2013,21(12):2265-2280. 被引量：16
8汪文义,丁树良,宋丽红.兼顾测验效率和题库使用率的CD-CAT选题策略[J].心理科学,2014,37(1):212-216. 被引量：14
9秦春影,仝海燕.认知诊断评价及其关键技术[J].安阳工学院学报,2014,13(2):80-84.
10郭磊,王卓然,王丰,边玉芳.结合a分层的兼具项目曝光和广义测验重叠率控制的选题策略[J].心理学报,2014,46(5):702-713. 被引量：3

1陈平,张佳慧,辛涛.在线标定技术在计算机化自适应测验中的应用[J].心理科学进展,2013,21(10):1883-1892. 被引量：9
2陈平,辛涛.认知诊断计算机化自适应测验中的项目增补[J].心理学报,2011,43(7):836-850. 被引量：27
3陈平.两种新的计算机化自适应测验在线标定方法[J].心理学报,2016,48(9):1184-1198. 被引量：7
4唐小娟,丁树良,俞宗火.计算机化自适应测验在认知诊断中的应用[J].心理科学进展,2012,20(4):616-626. 被引量：14
5闫伟,王明春.生活世界中的自我与他人——以海德格尔的《存在与时间》为轴心[J].惠州学院学报,2008,28(1):62-66.
6林金清.“无”字歌[J].中国道教,1999(4):45-45.
7毛秀珍,辛涛.计算机化自适应测验选题策略述评[J].心理科学进展,2011,19(10):1552-1562. 被引量：22
8汪文义,宋丽红,丁树良.基于探索性因素分析的Q矩阵标定方法[J].江西师范大学学报（自然科学版）,2015,39(2):138-144. 被引量：12
9高旭亮,涂冬波,王芳,张龙,李雪莹.可修改答案的计算机化自适应测验的方法[J].心理科学进展,2016,24(4):654-664. 被引量：2
10李莉.浅议毛泽东的思维方法[J].企业活力,2001(8):20-21.

心理学报

2011年第6期

浏览历史

内容加载中请稍等...

认知诊断计算机化自适应测验中在线标定方法的开发被引量：28

参考文献42

二级参考文献38

共引文献30

同被引文献467

引证文献28

二级引证文献132

相关作者

相关机构

相关主题

浏览历史

认知诊断计算机化自适应测验中在线标定方法的开发 被引量：28

参考文献42

二级参考文献38

共引文献30

同被引文献467

引证文献28

二级引证文献132

相关作者

相关机构

相关主题

浏览历史

认知诊断计算机化自适应测验中在线标定方法的开发被引量：28