期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
正则化方法对连续协变量项目功能差异的检测及其应用
1
作者 甘凯宇 刘红云 《中国考试》 北大核心 2023年第9期44-51,共8页
提出检测连续协变量条件下项目功能差异的正则化方法,并将其与Logistic回归方法进行比较。模拟数据分析结果表明:1)在所有条件下,正则化方法的一类错误率比Logistic回归方法低。在DIF项目比例为20%时,正则化方法的检测效果优于Logistic... 提出检测连续协变量条件下项目功能差异的正则化方法,并将其与Logistic回归方法进行比较。模拟数据分析结果表明:1)在所有条件下,正则化方法的一类错误率比Logistic回归方法低。在DIF项目比例为20%时,正则化方法的检测效果优于Logistic回归方法。2)正则化方法对0.3的DIF值不敏感,检验力低。3)两种方法的一类错误率随着样本量增加、DIF值增加而增加,检验力随着样本量增加、DIF值增加、DIF项目比例减小而增加。将正则化方法应用于PISA2012数学测验数据,进行连续协变量下的DIF检测及正则化方法的实际应用,结果也发现正则化方法相比于Logistic方法可以更好地控制一类错误率。 展开更多
关键词 项目功能差异 连续协变量 正则化 LOGISTIC回归 PISA2012
下载PDF
政府清廉感知:差序格局及其解释--基于2015年度全国廉情调查的数据分析 被引量:34
2
作者 倪星 李珠 《公共行政评论》 CSSCI 北大核心 2016年第3期4-20,共17页
通过主观态度调查的方式了解公众对政府的清廉感知,进而采取相应的政策措施,是廉政领域的普遍做法。2015年度全国廉情调查的数据显示,公众对不同层级政府的清廉感知存在着差序格局。采用多层线性模型分析发现:随着地方经济发展水平的提... 通过主观态度调查的方式了解公众对政府的清廉感知,进而采取相应的政策措施,是廉政领域的普遍做法。2015年度全国廉情调查的数据显示,公众对不同层级政府的清廉感知存在着差序格局。采用多层线性模型分析发现:随着地方经济发展水平的提高,公众倾向于认为地方比中央更清廉;公众的腐败容忍度越高,越倾向于认为地方比中央更清廉;腐败信息来源主要为官方报道的公众倾向于认为地方比中央更清廉,而腐败信息来源主要为小道消息和有过直接腐败经历的公众,其态度则相反;腐败案件的曝光会导致公众出现对中央清廉感知的负面评价。这些发现可以提供全面、多元的信息,推动未来的反腐败工作建立在更加科学、精准、有效的基础上。 展开更多
关键词 政府清廉感知 差序格局 多层线性模型
下载PDF
三种常用DIF检测方法的比较研究 被引量:21
3
作者 董圣鸿 马世晔 《心理学探新》 CSSCI 2001年第1期43-48,共6页
本研究在对DIF作出新的更为严格的界定、对三种常用的DIF检测方法进行详细介绍的基础上 ,以 1999年高考英语试卷 75道选择题为研究材料 ,对三种常用的DIF检测方法进行了实证研究。结果表明 :MH方法与SIBTEST方法检测的敏感性较STND方法... 本研究在对DIF作出新的更为严格的界定、对三种常用的DIF检测方法进行详细介绍的基础上 ,以 1999年高考英语试卷 75道选择题为研究材料 ,对三种常用的DIF检测方法进行了实证研究。结果表明 :MH方法与SIBTEST方法检测的敏感性较STND方法高 ;MH方法与SIBTEST方法检出的一致性很高 ;SIBTEST方法具有较好的性能 ,在实际应用中可以作为首选的方法 ;在进行DIF检测时 ,样本容量在 10 0 0左右为宜。 展开更多
关键词 教育心理学 DIF检测方法 比较研究 MH方法 STND方法 NBTEST方法 功能差异
下载PDF
检验项目功能差异的两类方法—CFA和IRT的比较 被引量:12
4
作者 骆方 张厚粲 《心理学探新》 CSSCI 北大核心 2006年第1期74-78,共5页
目前在验证性因素分析(CFA)和项目反应理论(IRT)两个领域,都有一些检验方法来识别项目功能差异(DIF)。该文主要针对单维的多级计分项目,分别介绍CFA和IRT检测DIF的方法,并进行二者的比较。
关键词 验证性因素分析 项目反应理论 项目功能差异
下载PDF
心理测量学模型在学习进阶中的应用:理论、途径和突破 被引量:14
5
作者 高一珠 陈孚 +2 位作者 辛涛 詹沛达 姜宇 《心理科学进展》 CSSCI CSCD 北大核心 2017年第9期1623-1630,共8页
学习进阶是对学生在一段时间内,关于某一主题连续发展、逐渐复杂思维的描述,它的建立是以假设性学习进阶为起点到收集证据验证假设性学习进阶不断迭代的过程。心理测量学模型能够使学习进阶与评价结合起来,既为验证学习进阶的有效性提... 学习进阶是对学生在一段时间内,关于某一主题连续发展、逐渐复杂思维的描述,它的建立是以假设性学习进阶为起点到收集证据验证假设性学习进阶不断迭代的过程。心理测量学模型能够使学习进阶与评价结合起来,既为验证学习进阶的有效性提供证据,又能对学生做出诊断,当前应用到学习进阶中的心理测量学模型有单维项目反应模型、多维项目反应模型和认知诊断模型。学习进阶还能为垂直量尺化、自适应学习提供新的研究视角,但应注意项目功能差异等问题。 展开更多
关键词 学习进阶 项目反应模型 认知诊断模型 垂直量尺化 自适应学习 项目功能差异
下载PDF
语言测试中的偏差研究 被引量:10
6
作者 孔文 李清华 《外语界》 CSSCI 北大核心 2008年第1期81-89,共9页
语言测试中的偏差是指由于与测试构念无关的因素导致某个或某些考生群体获得系统性高分或低分,从而影响测试结果的准确解释和使用,降低测试效度。自20世纪60年代以来,偏差研究作为高风险测试效度验证的必要环节已受到国外语言测试界... 语言测试中的偏差是指由于与测试构念无关的因素导致某个或某些考生群体获得系统性高分或低分,从而影响测试结果的准确解释和使用,降低测试效度。自20世纪60年代以来,偏差研究作为高风险测试效度验证的必要环节已受到国外语言测试界的关注,但国内在这方面的研究几乎是空白。本文在综述国外研究成果的基础上,着重介绍偏差的概念、偏差的来源和偏差的主要侦测方法,以期对国内大规模高风险外语测试的偏差研究提供一定的理论依据和方法指导。 展开更多
关键词 测试偏差 效度验证 测试公平性 项目功能差异
原文传递
认知诊断测验中的项目功能差异检测方法比较 被引量:9
7
作者 王卓然 郭磊 边玉芳 《心理学报》 CSSCI CSCD 北大核心 2014年第12期1923-1932,共10页
检测项目功能差异(DIF)是认知诊断测验中很重要的问题。首先将逻辑斯蒂克回归法(LR)引入认知诊断测验DIF检测,然后将LR法与MH法和Wald检验法的DIF检验效果进行比较。在比较中同时考察了匹配变量、DIF种类、DIF大小和受测者人数的影响。... 检测项目功能差异(DIF)是认知诊断测验中很重要的问题。首先将逻辑斯蒂克回归法(LR)引入认知诊断测验DIF检测,然后将LR法与MH法和Wald检验法的DIF检验效果进行比较。在比较中同时考察了匹配变量、DIF种类、DIF大小和受测者人数的影响。结果表明:(1)LR法在认知诊断测验DIF检测中,检验力较高,一类错误率较低。(2)LR法在检测认知诊断测验的DIF时,不受认知诊断方法的影响。(3)LR法可以有效区分一致性DIF和非一致性DIF,并有较高检验力和较低一类错误率。(4)采用知识状态作为匹配变量,能够得到较理想的检验力和一类错误率。(5)DIF越大,受测者人数越多,统计检验力越高,但一类错误率不受影响。 展开更多
关键词 认知诊断 项目功能差异 逻辑斯蒂克回归法
下载PDF
能力水平分组对Mantel-Haenszel方法检验DIF效应的影响分析 被引量:7
8
作者 李付鹏 《中国考试》 2011年第9期10-15,共6页
Mantel-Haenszel方法(以下简称M-H方法)是探测试题是否存在DIF现象的一类重要的和普遍的方法。能力分组是M-H方法应用的一个关键环节。本文以某年度6000名考生普通高考文科综合选择题的作答数据为样本,探讨了能力水平分组对该方法检验... Mantel-Haenszel方法(以下简称M-H方法)是探测试题是否存在DIF现象的一类重要的和普遍的方法。能力分组是M-H方法应用的一个关键环节。本文以某年度6000名考生普通高考文科综合选择题的作答数据为样本,探讨了能力水平分组对该方法检验敏感性的影响程度。研究结果表明:不同能力水平分组的检验结果均具有较好的一致性;检验结果对能力水平分组组数的敏感性较小;M-H方法具有较好的稳定性。 展开更多
关键词 项目功能差异 M—H方法 能力分组
下载PDF
统计测量视角下考试公平推动教育公平的对策 被引量:7
9
作者 汪文义 张华华 《江西师范大学学报(自然科学版)》 CAS 北大核心 2017年第4期385-393,共9页
考试不公平将影响被试受教育机会的公平性和社会公平性.针对我国考试公平性中统计分析长期被忽视问题,该文主要从统计测量视角,在介绍测验公平性评价在国外盛行情况之后,深入剖析测验公平性统计分析的项目功能差异方法.最后,针对高厉害... 考试不公平将影响被试受教育机会的公平性和社会公平性.针对我国考试公平性中统计分析长期被忽视问题,该文主要从统计测量视角,在介绍测验公平性评价在国外盛行情况之后,深入剖析测验公平性统计分析的项目功能差异方法.最后,针对高厉害考试的公平性问题,提出促进考试公平的详细并可行的举措,以供读者借鉴. 展开更多
关键词 考试公平 教育公平 项目功能差异 统计测量 高考
下载PDF
运用均数与协方差结构模型侦查项目功能差异 被引量:6
10
作者 赵必华 顾海根 《心理发展与教育》 CSSCI 北大核心 2009年第3期119-122,共4页
阐释了运用多组均数与协方差结构(MACS)模型侦查多级反应项目的一致性与非一致性项目功能差异(DIF)的原理与程序,以道德自我概念量表DIF的侦查进行示例,并对该方法进行了评价。与项目反应理论比照,MACS采用系统的、迭代的方式利用修正... 阐释了运用多组均数与协方差结构(MACS)模型侦查多级反应项目的一致性与非一致性项目功能差异(DIF)的原理与程序,以道德自我概念量表DIF的侦查进行示例,并对该方法进行了评价。与项目反应理论比照,MACS采用系统的、迭代的方式利用修正指数来侦查DIF,并提供多个拟合指数协同评价模型拟合;与标准验证性因素分析相较,MACS不仅能侦查非一致性DIF,而且能侦查一致性DIF。运用MACS侦查DIF是一种值得推荐的方法。 展开更多
关键词 均数与协方差结构模型 项目功能差异 非一致性DIF 一致性DIF
原文传递
全国高考英语试题的城乡项目功能差异分析 被引量:6
11
作者 关丹丹 乔辉 +1 位作者 陈康 韩奕帆 《心理学探新》 CSSCI 北大核心 2019年第1期64-69,共6页
本研究主要目的是针对高考英语成绩存在的城乡差异,检验这种差异是否来源于试题在城乡上的项目功能差异。如果两个能力本来相同的考生群体在某一试题得分上表现出不同程度的差异,该试题就存在项目功能差异。研究采用试题标准化分数差法... 本研究主要目的是针对高考英语成绩存在的城乡差异,检验这种差异是否来源于试题在城乡上的项目功能差异。如果两个能力本来相同的考生群体在某一试题得分上表现出不同程度的差异,该试题就存在项目功能差异。研究采用试题标准化分数差法,利用STDIF软件逐一分析了2016年三套全国高考英语卷的客观题是否存在城乡上的项目功能差异,在确定客观题没有项目功能差异后,以客观题成绩为匹配变量,采用条件得分图法对书面表达题是否存在城乡上的项目功能差异进行了分析。研究结果显示,高考英语全国I、II、III卷均未发现城乡上的项目功能差异试题,即可以认为高考英语全国卷对城乡不同户籍考生都非常公平、公正,城乡考生在英语成绩上的差异并非题目的公平性所致。 展开更多
关键词 高考英语 项目功能差异 城乡
下载PDF
语言测试界的项目偏差研究及其基本问题 被引量:3
12
作者 聂建中 张琨 《中国外语》 CSSCI 2008年第4期13-17,共5页
项目偏差有损于语言测试的效度和公平性。在我国的大规模高风险外语测试中,考生众多,考生个人特征差异大,避免项目偏差尤其重要。由于我国语言测试界的相关研究甚少,本文拟探讨项目偏差研究的意义,梳理其研究思路,分析国外有关项目偏差... 项目偏差有损于语言测试的效度和公平性。在我国的大规模高风险外语测试中,考生众多,考生个人特征差异大,避免项目偏差尤其重要。由于我国语言测试界的相关研究甚少,本文拟探讨项目偏差研究的意义,梳理其研究思路,分析国外有关项目偏差研究的贡献和局限,并对未来研究提出建议。 展开更多
关键词 语言测试 项目偏差研究 项目功能差异
原文传递
项目功能差异检验及其对学前教育质量评价的价值
13
作者 王欣怡 陈德枝 《幼儿教育》 2023年第27期24-29,共6页
学前教育质量评价工具的公平性是保证评价科学化的前提,项目功能差异检验是验证工具公平性的重要方法,但其在学前教育质量评价领域的应用存在诸多问题有待探究。本文梳理了项目功能差异检验的基本概念、应用和方法,阐明其是学前教育质... 学前教育质量评价工具的公平性是保证评价科学化的前提,项目功能差异检验是验证工具公平性的重要方法,但其在学前教育质量评价领域的应用存在诸多问题有待探究。本文梳理了项目功能差异检验的基本概念、应用和方法,阐明其是学前教育质量评价公平性和误差分析的主要表征和内容,同时从检验方法、检验变量和成因分析等方面,对学前教育质量评价的项目功能差异研究提出展望。 展开更多
关键词 学前教育质量评价 项目功能差异 公平性
原文传递
DIF值和样本量对SIBTEST检测方法的影响研究 被引量:3
14
作者 朱乙艺 韦小满 《中国考试》 2012年第9期9-14,共6页
本模拟研究的目标组和参照组的题目作答反应数据是通过三参数逻辑斯蒂克模型来产生的,通过模拟数据探讨了DIF值和样本量对SIBTEST方法的检测效果的影响。研究结果表明:在一定的DIF值和样本量条件下,SIBTEST方法的检验力和I型错误随着样... 本模拟研究的目标组和参照组的题目作答反应数据是通过三参数逻辑斯蒂克模型来产生的,通过模拟数据探讨了DIF值和样本量对SIBTEST方法的检测效果的影响。研究结果表明:在一定的DIF值和样本量条件下,SIBTEST方法的检验力和I型错误随着样本量和DIF值的增大而增大;当用SIBTEST方法对实测数据进行DIF检测时,1000~2000的样本量是比较合适的;当用模拟数据进行SIBTEST方法的研究时,DIF值和样本量的选择需要满足一定的限制条件。 展开更多
关键词 DIF值 样本量 SIBTEST方法 项目功能差异
下载PDF
项目功能差异在临床问卷分析中的应用 被引量:3
15
作者 刘曦 张建新 《中国临床心理学杂志》 CSCD 2006年第4期349-351,共3页
在跨文化问卷分析中,对项目功能差异的分析是保证测量公平性和有效性的重要依据。与经典测量理论相比,在测查项目功能差异时,运用项目反应理论有较强的前提假设和优越性。本研究对项目功能差异的相关概念进行解释;介绍项目功能差异的常... 在跨文化问卷分析中,对项目功能差异的分析是保证测量公平性和有效性的重要依据。与经典测量理论相比,在测查项目功能差异时,运用项目反应理论有较强的前提假设和优越性。本研究对项目功能差异的相关概念进行解释;介绍项目功能差异的常用分析方法;简介国内外有关项目功能差异在跨文化临床问卷分析中的应用。 展开更多
关键词 临床问卷 项目功能差异 跨文化
下载PDF
生命意义问卷(修订版)在初中生群体中的信效度:留守与非留守学生的比较分析 被引量:2
16
作者 陈维 何妃霞 +1 位作者 黄蓉 赵守盈 《心理学探新》 CSSCI 北大核心 2017年第3期247-253,共7页
检验生命意义问卷(修订版)在初中生群体中的信效度,并比较了留守与非留守学生在测量学指标上的差异。采用生命意义问卷(修订版)、超越意义量表、情感调节量表、Rosenberg自尊量表和幸福感指数量表对1300名初中生进行调查,其中有636名留... 检验生命意义问卷(修订版)在初中生群体中的信效度,并比较了留守与非留守学生在测量学指标上的差异。采用生命意义问卷(修订版)、超越意义量表、情感调节量表、Rosenberg自尊量表和幸福感指数量表对1300名初中生进行调查,其中有636名留守初中生。探索性因素分析、平行分析和最小平均偏相关分析均表明该量表为双因子结构,验证性因素分析与各类群体拟合良好;与上述效标变量均有显著的正相关;在性别和是否留守学生变量上,个别条目表现出一致性或非一致性条目功能差异;总量表、追寻和拥有意义分量表的δ系数都大于0.9。生命意义问卷(修订版)具有在初中生和留守初中生中均有良好的信效度;可以忽略在性别和是否留守学生变量的条目功能差异;问卷辨识度较高。 展开更多
关键词 生命意义 留守儿童 条目功能差异 信度 效度
下载PDF
现代测量理论观点下的测验偏差评价 被引量:1
17
作者 刘铁川 戴海琦 赵玉 《中国临床心理学杂志》 CSSCI CSCD 北大核心 2012年第3期346-349,共4页
测验在当前社会广泛应用的同时,其公平性受到了社会各界的广泛关注。具备公平性的测验应是无偏差的。随着测量理论的快速发展,目前已经出现多类测验偏差评价技术用以维护测验公平,而国内测验研究与实践中所使用的方法却相对滞后。本研... 测验在当前社会广泛应用的同时,其公平性受到了社会各界的广泛关注。具备公平性的测验应是无偏差的。随着测量理论的快速发展,目前已经出现多类测验偏差评价技术用以维护测验公平,而国内测验研究与实践中所使用的方法却相对滞后。本研究从现代测量学的角度,介绍了评价测量偏差、预测偏差、等值偏差方法的最新进展,并给出了使用建议。这些方法关注测验偏差的不同角度,但紧密相联。我国各行业的测验工作者应充分利用这些理论技术来指导测验的编制、使用,以促进测验的公平性。 展开更多
关键词 测验公平 测验偏差 项目功能差异 预测偏差 群体不变性
原文传递
二级计分数据DIF模拟研究的数据产生原理及其软件实现 被引量:1
18
作者 朱乙艺 焦丽亚 《考试研究》 2012年第6期80-87,19,共9页
和基于实测数据的DIF研究相比,基于模拟数据的DIF研究不仅可以自由操纵实验条件,而且可以给出检验力和I型错误指标。本文详细阐述了二级计分DIF模拟数据的产生原理,其产生过程包括四个阶段:选择DIF产生思路,选择项目反应理论模型,确定... 和基于实测数据的DIF研究相比,基于模拟数据的DIF研究不仅可以自由操纵实验条件,而且可以给出检验力和I型错误指标。本文详细阐述了二级计分DIF模拟数据的产生原理,其产生过程包括四个阶段:选择DIF产生思路,选择项目反应理论模型,确定考生特征、题目特征和复本数,计算考生在题目上的正确作答概率并转化为二级计分数据。并且分别利用常用软件Excel和专业软件WinGen3展示了二级计分DIF模拟数据的产生过程。 展开更多
关键词 项目功能差异 模拟研究
下载PDF
匹配变量纯化的测验偏差检验方法
19
作者 汪文义 何韵玲 +1 位作者 宋丽红 黄涛 《江西师范大学学报(自然科学版)》 CAS 北大核心 2022年第5期447-452,共6页
CSIBTEST方法是基于参照组和目标组2个测验信度对真分数进行估计,再按交叉位置分数将匹配分数划分为2类子样本,并分别计算其卡方统计量,然后将这2个独立的卡方统计量相加得到自由度为2的检验统计量.鉴于测验信度具有群体依赖性,即不同... CSIBTEST方法是基于参照组和目标组2个测验信度对真分数进行估计,再按交叉位置分数将匹配分数划分为2类子样本,并分别计算其卡方统计量,然后将这2个独立的卡方统计量相加得到自由度为2的检验统计量.鉴于测验信度具有群体依赖性,即不同群体的测验信度可能不尽相同,而CSIBTEST方法将参照组和目标组分别划分为2类子样本,有必要对子样本上的测验信度也进行估计,由此拓展了CSIBTEST.新方法先使用CSIBTEST获得交叉位置参数,相当于进行DIF预分析,再使用子样本上的信度估计用于真分数估计,以在对匹配变量进行纯化后获得检测统计量.模拟研究结果显示:相比SIBTEST和CSIBTEST,匹配变量纯化的测验偏差检验方法对存在DIF试题有着更高的统计检验力. 展开更多
关键词 测验偏差 项目功能差异 CSIBTEST 信度 考试公平
下载PDF
题目参数漂移:概念厘定及相关研究
20
作者 叶萌 辛涛 《心理科学进展》 CSSCI CSCD 北大核心 2015年第10期1859-1868,共10页
题目参数漂移(Item Parameter Drift,IPD)指锚题参数值在若干连续性测试场合或测验水平之间的变化。该概念和项目功能差异(Differential Item Function,DIF)有实质区别。当前的IPD研究涵盖五个方面:IPD的实际存在、产生原因、检测方法... 题目参数漂移(Item Parameter Drift,IPD)指锚题参数值在若干连续性测试场合或测验水平之间的变化。该概念和项目功能差异(Differential Item Function,DIF)有实质区别。当前的IPD研究涵盖五个方面:IPD的实际存在、产生原因、检测方法、链接结果效应,及极端锚题的处理策略。横向IPD领域需要更进一步和具有综合性的研究,尤其需研究DIF检测方法在IPD检测中的语境适用性,开发针对IPD的检测方法,以及发展修正的链接程序。纵向IPD研究需要进行系统、深入探索。 展开更多
关键词 测验链接 参数不变性 题目参数漂移 项目功能差异 非等组锚测验设计
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部