大规模考试常同时使用多套试卷。为保证考试的公平性与信效度,试卷之间的等值非常重要。本文使用Rasch模型等值10套设有锚题的英语试卷。等值的方法是:先将10套试卷通过NEAT(nonequivalent groups with an anchor test)(von Davier 2004...大规模考试常同时使用多套试卷。为保证考试的公平性与信效度,试卷之间的等值非常重要。本文使用Rasch模型等值10套设有锚题的英语试卷。等值的方法是:先将10套试卷通过NEAT(nonequivalent groups with an anchor test)(von Davier 2004)设计衔接起来,再通过卡方检验和mean/sigma转换法算出的A常数值剔除质量差的锚题,最后用保留的锚题确定等值函数(B常数值)。对Rasch模型的适用性检验表明,10套试卷的数据符合Rasch模型的假设。等值结果分析显示,衔接各试卷的锚题在统计意义上均有效,基于Rasch模型的等值结果能校正试卷间的难度差异,故用Rasch模型等值多套英语试卷是可行的。展开更多
文摘大规模考试常同时使用多套试卷。为保证考试的公平性与信效度,试卷之间的等值非常重要。本文使用Rasch模型等值10套设有锚题的英语试卷。等值的方法是:先将10套试卷通过NEAT(nonequivalent groups with an anchor test)(von Davier 2004)设计衔接起来,再通过卡方检验和mean/sigma转换法算出的A常数值剔除质量差的锚题,最后用保留的锚题确定等值函数(B常数值)。对Rasch模型的适用性检验表明,10套试卷的数据符合Rasch模型的假设。等值结果分析显示,衔接各试卷的锚题在统计意义上均有效,基于Rasch模型的等值结果能校正试卷间的难度差异,故用Rasch模型等值多套英语试卷是可行的。