期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
试卷质量定量分析系统中的几个参数及其应用 被引量:67
1
作者 田考聪 彭斌 《医学教育探索》 2004年第4期52-54,共3页
试卷质量定量分析系统是我们自行研制、开发的用于评估试卷质量的软件包 ,其中所涉及的信度 (α)、效度 (E)、难度 (P)和区分度 (D)这几个参数在衡量试题质量、进行试卷评价中起着至关重要的作用。本文在详细阐述这几个参数的意义基础... 试卷质量定量分析系统是我们自行研制、开发的用于评估试卷质量的软件包 ,其中所涉及的信度 (α)、效度 (E)、难度 (P)和区分度 (D)这几个参数在衡量试题质量、进行试卷评价中起着至关重要的作用。本文在详细阐述这几个参数的意义基础上 ,通过实例介绍了它们在试卷分析评价中的作用 ,对试卷分析评价工作具有较大的参考价值。 展开更多
关键词 试卷质量 试卷分析 试卷评价 难度 试题质量 区分度 参数 定量分析 作用 信度
下载PDF
父亲在位问卷的初步修订 被引量:21
2
作者 蒲少华 卢宁 +2 位作者 唐辉 王孟成 凌瑛 《中国心理卫生杂志》 CSSCI CSCD 北大核心 2012年第2期139-142,共4页
目的:引进父亲在位问卷(FPQ),初步检验其在大学生群体中的信效度,建立父亲在位问卷的中文修订版(FPQ-R)。方法:方便抽取705名大学生进行FPQ测试,对其中的414名被试同时施测父母教养方式量表父亲版(PBI-F),间隔4周后对144名大一被试进行... 目的:引进父亲在位问卷(FPQ),初步检验其在大学生群体中的信效度,建立父亲在位问卷的中文修订版(FPQ-R)。方法:方便抽取705名大学生进行FPQ测试,对其中的414名被试同时施测父母教养方式量表父亲版(PBI-F),间隔4周后对144名大一被试进行FPQ重测。采用相关系数、Cron-bachα系数、因素分析进行分量表的调整,对修订后的问卷进行信效度分析。结果:父亲在位问卷中文修订版(FPQ-R)共96个条目,包含与父亲的关系、家庭代际关系、有关父亲的信念3个高阶维度,分为8个分量表。96个条目与所在分量表的相关系数为0.43~0.83。验证性因素分析发现8因子模型的拟合指数为χ2/df=3.03,NFI=0.92,NNFI=0.94,CFI=0.94,RM SEA=0.05;3因子高阶修正模型的拟合指数为χ2/df=3.08,NFI=0.91,NNFI=0.93,CFI=0.94,RM SEA=0.06。3个高阶维度内各分量表的相关系数为0.42~0.75,3个高阶维度间各分量表的相关系数为0.18~0.45。除高阶维度二的2个分量表外,其余6个分量表与PBI-F的关爱、鼓励自主因子及总分均呈正相关(r=0.17~0.66,均P<0.01)。3个高阶维度和8个分量表的内部一致性Cronbachα系数都超过0.86,重测信度系数为0.59~0.80。结论:父亲在位问卷中文修订版具有较好的信效度,可以用于我国大学生群体。 展开更多
关键词 父亲在位问卷 项目区分度 信度 效度 心理测量学研究
下载PDF
认知诊断计算机化自适应测验中新的选题策略:结合项目区分度指标 被引量:14
3
作者 郭磊 郑蝉金 +2 位作者 边玉芳 宋乃庆 夏凌翔 《心理学报》 CSSCI CSCD 北大核心 2016年第7期903-914,共12页
当前国内外大部分认知诊断计算机化自适应测验(CD-CAT)主要采用PWKL作为选题策略进行研究。PWKL结合后验分布信息对KL指标进行加权,提高了判准率,但该方法仅利用个体层面信息加权,忽视了项目本身能够提供的信息,属于单源指标。本研究结... 当前国内外大部分认知诊断计算机化自适应测验(CD-CAT)主要采用PWKL作为选题策略进行研究。PWKL结合后验分布信息对KL指标进行加权,提高了判准率,但该方法仅利用个体层面信息加权,忽视了项目本身能够提供的信息,属于单源指标。本研究结合认知诊断中的项目区分度信息,对PWKL进行修正,提出了4种新的多源选题策略:GIDPWKL、AIDPWKL、CIDPWKL和KLEDPWKL方法,并在加入曝光控制下与PWKL和互信息法(MIM)进行比较。模拟研究结果表明:(1)在定长测验情景下的绝大多数实验结果表明,测验长度越短,新方法的判准率越高。平均属性/模式判准率最高的是GIDPWKL,之后是AIDPWKL,而CIDPWKL、KLEDPWKL和MIM方法的优势随实验条件不同而不同。(2)在定长测验情景下的绝大多数实验结果表明,题目质量越高,新方法的优势越明显。(3)Q矩阵结构的复杂性会影响不同选题策略的表现。(4)在变长测验情景下,4种新方法和MIM的平均测验长度均要低于PWKL方法,表现最好的是GIDPWKL方法。因此,若实际测验情景与本研究的模拟情景相似,推荐GIDPWKL方法。 展开更多
关键词 认知诊断计算机化自适应测验 选题策略 项目区分度 曝光控制
下载PDF
武警用简式明尼苏达人格调查表的适用性研究 被引量:11
4
作者 王进礼 张月娟 罗贵友 《中国临床心理学杂志》 CSCD 2005年第2期138-140,共3页
目的:根据武警部队大规模群体测验的需要,将MMPI进行分量表及条目筛减后构成简式MMPI,检验其作为人格评估工具进行武警部队兵员筛选、工作安置之适用性。方法:对940名战士施测MMPI后,根据武警部队特点及测验目的筛选分量表,根据测验条... 目的:根据武警部队大规模群体测验的需要,将MMPI进行分量表及条目筛减后构成简式MMPI,检验其作为人格评估工具进行武警部队兵员筛选、工作安置之适用性。方法:对940名战士施测MMPI后,根据武警部队特点及测验目的筛选分量表,根据测验条目区分度筛选条目,组成简式MMPI,随机整群取样3095名战士,对简式MMPI进行条目分析及信度和效度分析。结果:简式MMPI60%的条目鉴别指数在0.2以上,比原MMPI条目的鉴别指数(53%)提高。各分量表的重测相关系数在0.58-0.85之间(P<0.01)。实证效度检验显示,简式MMPI对精神分裂症患者与正常人群的区分达到显著水平(P<0.01)。各分量表与领导评定的各维度间有不同程度显著相关,量表总分与领导评定总分相关0.49。结论:武警用简式明尼苏达人格调查表符合心理测量学的要求,可做武警部队的人格评估工具。 展开更多
关键词 人格调查表 明尼苏达 适用性 简式 MMPI 精神分裂症患者 武警部队 评估工具 心理测量学 分量表 效度分析 相关系数 效度检验 正常人群 不同程度 条目 测验 筛选 区分度 分析及 战士 指数 鉴别 领导
下载PDF
全国日语专业八级考试分析研究 被引量:7
5
作者 谭晶华 杨诎人 《外国语》 CSSCI 北大核心 2008年第6期69-73,共5页
本文对2005年12月根据《全国日语专业八级考试大纲(修订本)》实施的全国日语专业八级考试的各种答题数据进行了分析研究,根据答题情况剖析了目前考生的一些实际情况,找出了尚存在的不足之处,并对今后提高试题区分度等问题提出了建议。
关键词 八级考试 信度 难易度 区分度
原文传递
提高选择题区分度的若干方法 被引量:5
6
作者 杨志明 《教育测量与评价》 2017年第2期5-10,共6页
选择题是许多大规模标准化考试中广为使用的题型。为了保障选拔性考试的测量信度、效度和公平性,题目的区分度必须得到保障。文章对选择题及其区分度估计的经典测验理论和项目反应理论方法做了详细讨论,并从命题和测量学分析两个角度提... 选择题是许多大规模标准化考试中广为使用的题型。为了保障选拔性考试的测量信度、效度和公平性,题目的区分度必须得到保障。文章对选择题及其区分度估计的经典测验理论和项目反应理论方法做了详细讨论,并从命题和测量学分析两个角度提出了一些提高区分度的具体建议。 展开更多
关键词 选择题 区分度 命题 经典测验理论 项目反应理论
下载PDF
高校日语专业期末测试项目分析的基础研究 被引量:5
7
作者 董博 岛田めぐみ 《大连大学学报》 2016年第1期118-125,共8页
本文通过经典测试理论中衡量项目质量的"难度"与"区分度"这两项重要指标对一份高校日语期末测试进行了项目分析,根据"高分组""中间组""低分组"的各项不同选择率绘制的"题目分析... 本文通过经典测试理论中衡量项目质量的"难度"与"区分度"这两项重要指标对一份高校日语期末测试进行了项目分析,根据"高分组""中间组""低分组"的各项不同选择率绘制的"题目分析图"对理想项目和不理想项目进行了深入的研究探讨。分析结果为高校日语测试"题库建设"提供了依据,对如何反馈教学,如何平衡高校日语专业"教与考"的关系提出了方法和建议。 展开更多
关键词 项目分析 难度 区分度 题目分析图 日语教学
下载PDF
结合项目反应时间与项目区分度的CAT选题新策略
8
作者 李佳 况天昊 《江西师范大学学报(自然科学版)》 CAS 北大核心 2023年第4期377-383,共7页
计算机化自适应测验(CAT)的测量有效性不仅在于测验的项目数量,而且还在于被试完成测验所花费的时间.该文提出的结合项目反应时间和项目区分度动态分层的选题新策略是一种连续升a降β的选题方法,该方法在保证测验精度的同时,不仅有效地... 计算机化自适应测验(CAT)的测量有效性不仅在于测验的项目数量,而且还在于被试完成测验所花费的时间.该文提出的结合项目反应时间和项目区分度动态分层的选题新策略是一种连续升a降β的选题方法,该方法在保证测验精度的同时,不仅有效地降低了被试的测验时间,而且还提高了题库的利用率.蒙特卡罗(Monte Carlo)模拟实验结果表明:新选题方法在测验精度、测验时间有效性、题库利用率和测验安全性等评价指标中总体表现良好. 展开更多
关键词 计算机化自适应测验 选题策略 项目反应时间 项目区分度 项目曝光控制
下载PDF
CD-CAT初始阶段项目选取方法 被引量:4
9
作者 高椿雷 罗照盛 +3 位作者 郑蝉金 喻晓锋 彭亚风 郭小军 《心理科学》 CSSCI CSCD 北大核心 2017年第2期485-491,共7页
CD-CAT是CDA同CAT的相结合的产物,适用于课堂教学,是教师补救教学、学生自我学习的重要工具。作为CD-CAT重要组成部分的初始阶段项目选取方法是影响测验判准率的重要因素。本文基于现有研究和CDA的项目区分度提出了四种新的初始阶段项... CD-CAT是CDA同CAT的相结合的产物,适用于课堂教学,是教师补救教学、学生自我学习的重要工具。作为CD-CAT重要组成部分的初始阶段项目选取方法是影响测验判准率的重要因素。本文基于现有研究和CDA的项目区分度提出了四种新的初始阶段项目选取方法:CTTID法、CDI法、CTTIDR*法和CDIR*法。通过模拟研究发现,在定长的CD-CAT下,题库质量是HD-HV下,初始阶段结束时,CTTIDR*法的PCCR比现有的T阵法高了.2999,比PWKL高了.1707,其它题库下趋势相同。整个测验结束时CTTIDR*法的判准率仍然是最高的。在变长的CD-CAT下,最大后验概率大于.7、.8、.9下,CTTIDR*法的被试平均测验长度比T阵法分别缩短了2.6170、2.2347、1.7470道题。 展开更多
关键词 CD-CAT 初始阶段项目选取方法 项目区分度
下载PDF
精神创伤影响评定问卷编制的项目分析 被引量:4
10
作者 赵虎 张文蔚 张永东 《中国行为医学科学》 CSCD 2007年第3期270-272,共3页
目的 编制精神创伤影响评定问卷预试问卷(PTIQ)的原始条目池,并通过项目分析进行题项的筛选和分析。方法 根据PTIQ的10个理论维度,编制原始条目池。预试样本为120例近期遭遇精神创伤事件的当事人或家属。预试后,采用t检验法和相关法... 目的 编制精神创伤影响评定问卷预试问卷(PTIQ)的原始条目池,并通过项目分析进行题项的筛选和分析。方法 根据PTIQ的10个理论维度,编制原始条目池。预试样本为120例近期遭遇精神创伤事件的当事人或家属。预试后,采用t检验法和相关法进行条目鉴别力分析,修订问卷的题项组成。结果 问卷原始条目池共116个题项,形成预试问卷。根据条目鉴别力大小,有39个题项不具有满意的鉴别力,予以删除。予以保留的77个题项的决断值为2.348~12.377(P〈0.05),题项与问卷总分的相关系数(r1)为0.235~0.704(P〈0.01),题项与所在分量表分的相关系数(r2)为0.511~0.818(P〈0.01)。结论 项目分析表明,保留的77个题项具有满意的鉴别力,为PTIQ的效度和信度分析奠定基础。 展开更多
关键词 精神创伤 问卷 条目池 项目分析 项目鉴别力
下载PDF
湖南省体育高考难美项目测试相关内容的比较研究 被引量:2
11
作者 周建社 栗霞 《辽宁体育科技》 2008年第1期74-75,共2页
采用文献资料、数理统计等方法,对湖南省2006和2007年体育高考体操、武术、健美操和艺术体操四个项目的测试成绩进行分析。并从受测人数、内容、难度、区分度四个方面进行比较。结果显示:受测人数较多的依次是武术、体操、健美操和艺术... 采用文献资料、数理统计等方法,对湖南省2006和2007年体育高考体操、武术、健美操和艺术体操四个项目的测试成绩进行分析。并从受测人数、内容、难度、区分度四个方面进行比较。结果显示:受测人数较多的依次是武术、体操、健美操和艺术体操;难易程度依次是健美操、艺术体操、武术、体操;健美操和艺术体操测试的区分与评价较好,其次为体操,武术尚可但需改进;各项测试指标与评分权重体现了项目特征。 展开更多
关键词 湖南省 难美项目 专项测试 难度 区分度
下载PDF
项目分析在教师自编测试中的应用 被引量:1
12
作者 何国雄 《嘉兴学院学报》 2007年第1期125-128,共4页
该文根据经典测试理论对一个实际使用的子测验30个项目进行了定量分析。分析结果显示,该子测验的难度总体上偏易,区分度指数偏低,部分干扰项不起干扰作用。文章认为,为了提高命题质量,对于重要的测验有必要实施预测和项目分析。
关键词 项目分析 项目难度 项目区分度 干扰项
下载PDF
语言测试中的项目分析方法
13
作者 张红 《民族教育研究》 2002年第4期38-42,共5页
对每一次测试的试题进行项目分析的目的 ,是为了确定试题的科学性 ,把那些符合测试规则、能够体现测试功能的科学性的试题保存在试题库中。项目分析的方法不仅适合于英语测试 ,还可以扩大到任何一种选项式的测试。语言测试在教学研究中... 对每一次测试的试题进行项目分析的目的 ,是为了确定试题的科学性 ,把那些符合测试规则、能够体现测试功能的科学性的试题保存在试题库中。项目分析的方法不仅适合于英语测试 ,还可以扩大到任何一种选项式的测试。语言测试在教学研究中有着很重要的作用。如何使它更为科学、更为精确 ,并对学生起到积极的引导作用是一项艰巨且有意义的研究工作。 展开更多
关键词 语言测试 项目分析方法 难度 区分度 信度 试题分析 民族院校 教学研究 大学英语
下载PDF
基于项目区分度的双目标CD-CAT选题策略 被引量:1
14
作者 何洁 毛秀珍 +1 位作者 唐倩 王霞 《心理科学》 CSSCI CSCD 北大核心 2022年第1期204-212,共9页
针对双目标CD-CAT,将六种项目区分度(鉴别力D、一般区分度GDI、优势比OR、2PL的区分度a、属性区分度ADI、认知诊断区分度CDI)分别与信息量乘积方法(IPA)方法结合,得到新的选题策略。模拟研究比较了它们的表现,还考察了区分度分层在控制... 针对双目标CD-CAT,将六种项目区分度(鉴别力D、一般区分度GDI、优势比OR、2PL的区分度a、属性区分度ADI、认知诊断区分度CDI)分别与信息量乘积方法(IPA)方法结合,得到新的选题策略。模拟研究比较了它们的表现,还考察了区分度分层在控制项目曝光的表现。结果发现:新方法都能明显提高知识状态的判准率和能力估计精度;分层选题均能很好地提高题库利用率。总体上,OR加权能显著提高测量精度;OR分层选题在保证测量精度条件下显著提高项目曝光均匀性。 展开更多
关键词 认知诊断 计算机化自适应测验 项目区分度 选题策略 分层选题
下载PDF
关于物理试题的价值取向和统计指标的思考 被引量:1
15
作者 范佳午 《中国考试》 2016年第9期28-31,46,共5页
在深化教育领域综合改革的背景下,物理教育应更加关注学生的创新精神和实践能力。本文通过分析两道中考物理试题统计数据以及价值取向的不同,提出需要提高考查学生探究能力和创新思维的开放性试题的区分度,以契合改革的要求,同时对教学... 在深化教育领域综合改革的背景下,物理教育应更加关注学生的创新精神和实践能力。本文通过分析两道中考物理试题统计数据以及价值取向的不同,提出需要提高考查学生探究能力和创新思维的开放性试题的区分度,以契合改革的要求,同时对教学产生积极的导向作用。 展开更多
关键词 科学教育测评 考试招生制度改革 命题 试题难度 试题区分度
下载PDF
基于语言测试的一次高中英语月考试卷分析 被引量:1
16
作者 杨婕 《南昌教育学院学报》 2014年第4期117-120,共4页
语言测试是检测外语教学成效和提高外语教学质量的重要手段。语言测试有四个重要因素:信度、效度、难度和区分度。将所搜集的数据通过SPSS,对一次高三英语月考试卷从这四个方面进行分析,旨在帮助教师总结测试,减少测试误差的影响,提高... 语言测试是检测外语教学成效和提高外语教学质量的重要手段。语言测试有四个重要因素:信度、效度、难度和区分度。将所搜集的数据通过SPSS,对一次高三英语月考试卷从这四个方面进行分析,旨在帮助教师总结测试,减少测试误差的影响,提高测试的效率,从而促进外语教学。 展开更多
关键词 语言测试 信度 效度 难度 区分度
下载PDF
具有疲劳或学习效应的一题多做测验模型
17
作者 赵志文 梁滨滨 李阳 《吉林师范大学学报(自然科学版)》 2017年第3期42-46,共5页
已有文献中关于重复测量项目反应模型都是以正确反应次数为实验观测数据.但是在实际中,许多重复测量实验只能观测到被试最终是否做出正确反应,无法获得正确反应次数数据.以被试最后是否做出正确反应为实验观测数据,建立了具有学习效应... 已有文献中关于重复测量项目反应模型都是以正确反应次数为实验观测数据.但是在实际中,许多重复测量实验只能观测到被试最终是否做出正确反应,无法获得正确反应次数数据.以被试最后是否做出正确反应为实验观测数据,建立了具有学习效应或疲劳效应的一题多做项目反应模型,给出了模型区分度参数的最大似然估计,并且通过随机模拟说明了上述估计方法的可行性. 展开更多
关键词 项目反应理论 Newton-Raphson迭代方法 学习效应 项目区分度
下载PDF
A Study on College English Test Construction and Evaluation
18
作者 黄雅彬 《黑龙江生态工程职业学院学报》 2008年第1期101-103,共3页
Testing is a universal feature of social life.Throughout history people have been put to the test to prove their capabilities or to establish qualifications.Language tests play an important role in many people's l... Testing is a universal feature of social life.Throughout history people have been put to the test to prove their capabilities or to establish qualifications.Language tests play an important role in many people's lives,acting as gateways at important transitional moments in education.The college English test paper was reviewed and checked against the test specifications to see its content coverage and representative.To evaluate the test,this includes item analysis,descriptive statistics,validity,and what we see as the strong points and the weaknesses of the test based on the analysis and the testing conditions,both of which provided validity evidence.In order to gather details of the test items,item analysis was done to find out the difficulty and discrimination of each item and identify misfit items for further discussion. 展开更多
关键词 item ANALYSIS validity item discrimination
下载PDF
Effects of Differential Item Discriminations between Individual-Level and Cluster-Level under the Multilevel Item Response Theory Model
19
作者 Chalie Patarapichayatham Akihito Kamata 《Open Journal of Applied Sciences》 2014年第8期425-432,共8页
This study attempted to interpret differential item discriminations between individual and cluster levels by focusing on patterns and magnitudes of item discriminations under 2PL multilevel IRT model through a set of ... This study attempted to interpret differential item discriminations between individual and cluster levels by focusing on patterns and magnitudes of item discriminations under 2PL multilevel IRT model through a set of variety simulation conditions. The consistency between the mean of individual-level ability estimates and cluster-level ability estimates was evaluated by the correlations between them. As a result, it was found that they were highly correlated if the patterns of item discriminations were the same for both individual and cluster levels. The magnitudes of item discriminations themselves did not affect much on correlations, as far as the patterns were the same at the two levels. However, it was found that the correlation became lower when the patterns of item discriminations were different between the individual and cluster levels. Also, it was revealed that the mean of the estimated individual-level abilities would not be necessarily a good representation of the cluster-level ability, if the patterns were different at the two levels. 展开更多
关键词 MULTILEVEL item Response Theory MODEL Ability ESTIMATES item discrimination
下载PDF
试论测试质量分析在大学英语教学中的意义及应用
20
作者 纪鸿 《甘肃政法学院学报》 2002年第5期93-95,共3页
本文就“测试质量分析”在大学英语教学的组织管理过程中的作用、意义及其具体做法进行了初步探讨。作者认为 ,只有重视“测试质量分析” ,才能确保大学英语教学中的测试质量 ,实现测试的目的 。
关键词 测试质量分析 信度 效度 难度 区分度
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部