期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
临床医学专业(本科)水平测试的等值方法比较研究 被引量:3
1
作者 张泉慧 何惧 +2 位作者 任杰 张颖 卢燕 《中华医学教育杂志》 2022年第7期577-580,共4页
目的基于经典测验理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)下的等值方法对2个年度临床医学专业(本科)水平测试(简称学业水平测试)考生作答情况进行分析,探讨学业水平测试中更为适合的等值方法。方法基... 目的基于经典测验理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)下的等值方法对2个年度临床医学专业(本科)水平测试(简称学业水平测试)考生作答情况进行分析,探讨学业水平测试中更为适合的等值方法。方法基于CTT方法,采用塔克(Tucker)观察分数线性等值方法、列文(Levine)观察分数线性等值方法、等百分位法、等百分位平滑法4种方法,基于IRT方法的单参数、双参数模型中,采用分别估计法、同时估计法和固定共同题参数估计法各3种校准方法进行等值探索,通过等值标准误来分析以上10种等值结果的稳定性。结果CTT方法的等值误差在0.7~1.6之间,IRT方法的等值误差在0.2~0.6之间,IRT误差更小。CTT方法中,Tucker观察分数线性等值方法误差最小,为0.7,等百分位平滑法误差最大,为1.6;IRT方法中,单参数模型的等值结果优于双参数模型,单参数模型中,固定共同题参数估计法的误差最小,为0.2。结论学业水平测试等值可以选择IRT单参数模型中的固定共同题参数估计法,通过等值,年度2学业水平测试等值后的分数上调,合格标准保持不变,有效地实现了分数可比,保证了考试公平。 展开更多
关键词 临床医学专业 水平测试 经典测验理论 项目反应理论 等值
原文传递
基于支持向量机的阅读理解试题难度预估研究 被引量:1
2
作者 吴生蕾 任杰 《考试研究》 2022年第5期68-77,共10页
试题难度反映试题质量,保证试题质量是保障考试信度和社会公平的关键。阅读理解试题是语言测试的考查重点,对阅读理解试题进行难度预估具有重要意义。支持向量机方法既可应用于线性可分数据,又可应用于非线性可分数据,本文采用支持向量... 试题难度反映试题质量,保证试题质量是保障考试信度和社会公平的关键。阅读理解试题是语言测试的考查重点,对阅读理解试题进行难度预估具有重要意义。支持向量机方法既可应用于线性可分数据,又可应用于非线性可分数据,本文采用支持向量机方法,以HSK(初、中等)阅读理解的第二部分试题为研究样本,对试题难度进行类别与数值的预估,分别以分类准确率、均方误差为评价指标。研究表明,支持向量机可用于阅读理解试题难度类别的预估。 展开更多
关键词 难度预估 支持向量机 阅读理解
下载PDF
大样本条件下概率阈限的改变对参数估计的影响
3
作者 王风 《考试研究》 2021年第1期65-69,共5页
考生猜测作答是一种偏离测验构念的行为,可以通过ARRG法检验,并将与其相关的问题最小化。通过比较大样本情况下概率阈限的改变对参数估计的影响,发现ARRG法能明显提高数据-模型的拟合优度。大样本条件下,概率阈限的改变主要引起题目难... 考生猜测作答是一种偏离测验构念的行为,可以通过ARRG法检验,并将与其相关的问题最小化。通过比较大样本情况下概率阈限的改变对参数估计的影响,发现ARRG法能明显提高数据-模型的拟合优度。大样本条件下,概率阈限的改变主要引起题目难度估计的变化,标准误的波动较小。本文为消除考生猜测作答的影响及使用ARRG法时根据样本量合理解释参数变化的意义提供参考。 展开更多
关键词 RASCH模型 猜测作答 概率阈限 样本量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部