期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
大语言模型在过程性评价中的应用:基于英语写作的评分及反馈
1
作者
黄晓婷
郭丽婷
《教育学术月刊》
北大核心
2024年第7期74-80,共7页
大语言模型在教育领域中的应用备受瞩目,为改善传统的教育评价方式提供了新的技术契机。本研究以英语写作评分与反馈为例,初步探讨了大语言模型在过程性评价中的应用,旨在评估少样本学习条件下这些模型被学校教师采用的可能性。为明确...
大语言模型在教育领域中的应用备受瞩目,为改善传统的教育评价方式提供了新的技术契机。本研究以英语写作评分与反馈为例,初步探讨了大语言模型在过程性评价中的应用,旨在评估少样本学习条件下这些模型被学校教师采用的可能性。为明确何种提示语(prompts)方案能够有效提升大语言模型在处理英语写作评分与反馈任务中的可行性与可靠性,本研究采用了梯度的提示语设计方法。结果显示,“作文题目+评分标准+人工评分样本”的提示语类型与人工评分的一致性最高。基于此,GPT-3.5和GPT-4分别对166份测试集写作样本进行评分与反馈,并通过皮尔逊相关系数、相邻一致性、精确一致性、二次加权卡帕系数等多个指标进行了验证。研究发现,GPT-4在评分的准确性和一致性方面表现均优于GPT-3.5,但鉴于其低成本优势,GPT-3.5也具有一定的可行性。此外,大语言模型可以提供详细的写作反馈,反馈质量得到专家组的一致认可。因此,本研究认为,教师在日常教学和评价中积极探索和应用大语言模型,尤其是教育资源薄弱的学校教师,可以借助这一工具,提升教育质量,以缩小与优质学校的差距。
展开更多
关键词
大语言模型
提示语工程
过程性评价
英语写作评分
英语写作反馈
原文传递
英语作文自动评分及其效度、信度与可操作性探讨
被引量:
13
2
作者
谢贤春
《江西师范大学学报(哲学社会科学版)》
2010年第2期136-140,共5页
评述国内外作文自动评分系统,并依据英语作文测试中的信度、效度和实践可操作性对其进行分析。探讨国内英语作文自动评阅系统的发展,在肯定其优点的同时,指出和分析其中的问题和不足,并提出相应之对策,以期为我国英语作文自动评阅系统...
评述国内外作文自动评分系统,并依据英语作文测试中的信度、效度和实践可操作性对其进行分析。探讨国内英语作文自动评阅系统的发展,在肯定其优点的同时,指出和分析其中的问题和不足,并提出相应之对策,以期为我国英语作文自动评阅系统研发提供借鉴和启迪。
展开更多
关键词
作文自动评阅
英语写作
信度
效度
可操作性
下载PDF
职称材料
题名
大语言模型在过程性评价中的应用:基于英语写作的评分及反馈
1
作者
黄晓婷
郭丽婷
机构
北京大学教育学院
出处
《教育学术月刊》
北大核心
2024年第7期74-80,共7页
基金
教育部人文社会科学重点研究基地重大项目“数字化背景下的教育质量评价研究”(编号:22JJD880002)。
文摘
大语言模型在教育领域中的应用备受瞩目,为改善传统的教育评价方式提供了新的技术契机。本研究以英语写作评分与反馈为例,初步探讨了大语言模型在过程性评价中的应用,旨在评估少样本学习条件下这些模型被学校教师采用的可能性。为明确何种提示语(prompts)方案能够有效提升大语言模型在处理英语写作评分与反馈任务中的可行性与可靠性,本研究采用了梯度的提示语设计方法。结果显示,“作文题目+评分标准+人工评分样本”的提示语类型与人工评分的一致性最高。基于此,GPT-3.5和GPT-4分别对166份测试集写作样本进行评分与反馈,并通过皮尔逊相关系数、相邻一致性、精确一致性、二次加权卡帕系数等多个指标进行了验证。研究发现,GPT-4在评分的准确性和一致性方面表现均优于GPT-3.5,但鉴于其低成本优势,GPT-3.5也具有一定的可行性。此外,大语言模型可以提供详细的写作反馈,反馈质量得到专家组的一致认可。因此,本研究认为,教师在日常教学和评价中积极探索和应用大语言模型,尤其是教育资源薄弱的学校教师,可以借助这一工具,提升教育质量,以缩小与优质学校的差距。
关键词
大语言模型
提示语工程
过程性评价
英语写作评分
英语写作反馈
Keywords
Large
Language
Models(LLMs)
prompt
project
formative
assessment
scoring
english
writing
feedback
on
english
writing
分类号
G424.2 [文化科学—课程与教学论]
原文传递
题名
英语作文自动评分及其效度、信度与可操作性探讨
被引量:
13
2
作者
谢贤春
机构
茂名学院外国语学院
出处
《江西师范大学学报(哲学社会科学版)》
2010年第2期136-140,共5页
文摘
评述国内外作文自动评分系统,并依据英语作文测试中的信度、效度和实践可操作性对其进行分析。探讨国内英语作文自动评阅系统的发展,在肯定其优点的同时,指出和分析其中的问题和不足,并提出相应之对策,以期为我国英语作文自动评阅系统研发提供借鉴和启迪。
关键词
作文自动评阅
英语写作
信度
效度
可操作性
Keywords
automated
essay
scoring
english
writing
reliability
validity
operability
分类号
H319.3 [语言文字—英语]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
大语言模型在过程性评价中的应用:基于英语写作的评分及反馈
黄晓婷
郭丽婷
《教育学术月刊》
北大核心
2024
0
原文传递
2
英语作文自动评分及其效度、信度与可操作性探讨
谢贤春
《江西师范大学学报(哲学社会科学版)》
2010
13
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部