融合预训练模型和自注意力的英语语法纠错

English grammatical error correction based on pre-training model and self-attention mechanism

下载PDF

导出

摘要针对现有基于Seq2Seq框架的语法纠错模型对句子语义信息利用不充分的问题,提出一种基于预训练语言模型与自注意力机制的英语语法纠错模型。通过预训练语言模型与卷积神经网络结构进行编码,获取句子的局部语义信息;通过自注意力机制来提升单词语义信息表征的准确性;采用SRU网络将预测单词分布与注意力得分分布进行融合,并结合束搜索策略生成最终结果;运用集成学习进一步提升语法纠错模型性能。在CoNLL-2014和JFLEG数据集上的实验结果表明,相较于其他基线语法纠错方法,文中提出的方法能够取得更好的纠错效果。 The existing grammatical error correction models based on Seq2Seq framework cannot make full use of semantic information of English sentences.Therefore,this paper proposes an English grammatical error correction model based on pre-training language model and self-attention mechanism.Firstly,the local semantic information of the English sentences is obtained by encoding of the pre-training language model and the convolutional neural network.Secondly,self-attention mechanism is used to improve the accuracy of word semantic information representation.Thirdly,the SRU network is used to fuse the predicted word distribution with the attention score distribution,and combined with the beam search strategy to generate the final result.Finally,ensemble learning is used to further improve the performance of the proposed model.Experiment results on CoNLL-2014 and JFLEG data sets show that the proposed method can achieve better grammatical error correction performance than several baseline models.

作者郝琛 HAO Chen(School of International Studies,Wenzhou Business College,Wenzhou 325035,Zhejiang Province,China)

机构地区温州商学院国际学院

出处《信息技术》 2023年第12期147-155,161,共10页 Information Technology

关键词预训练模型自注意力语法纠错束搜索集成学习 pre-training model self-attention grammatical error correction beam search ensemble learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1李燕.大学英语语法教学的重要意义及改进策略[J].海外英语,2021(21):152-153. 被引量：3
2邓依依,邬昌兴,魏永丰,万仲保,黄兆华.基于深度学习的命名实体识别综述[J].中文信息学报,2021,35(9):30-45. 被引量：28
3景艳娥.基于深度学习技术的语法纠错算法模型构建分析[J].信息技术,2020,44(9):143-147. 被引量：8
4郭琰,张矛.基于深度学习的语法纠错算法建模研究[J].信息技术,2021,45(4):148-152. 被引量：7

二级参考文献48

1王辰成,杨麟儿,王莹莹,杜永萍,杨尔弘.基于Transformer增强架构的中文语法纠错方法[J].中文信息学报,2020(6):106-114. 被引量：27
2安美华.大学英语语法教学问题种种[J].外语界,2000(3):38-40. 被引量：149
3张华斌.大学英语纠错教学的有效性探究[J].浙江工业大学学报（社会科学版）,2014,13(1):100-104. 被引量：2
4易会战,陈娟,杨学军,刘喆.基于语法树的实时动态电压调节低功耗算法[J].软件学报,2005,16(10):1726-1734. 被引量：12
5卢俊之,陈小荷,王东波,陈锋.基于语法功能匹配的汉语句法分析算法[J].计算机工程与应用,2008,44(16):151-153. 被引量：5
6李波,高文君,邱锡鹏.基于语法分析和统计方法的答案排序模型[J].中文信息学报,2009,23(2):23-27. 被引量：6
7刘丹,方卫国,周泓.二元语法中文分词数据平滑算法性能研究[J].计算机工程与应用,2009,45(17):33-36. 被引量：4
8周东祥,李群,王维平.仿真模型的语法可组合问题及组合判定[J].火力与指挥控制,2009,34(8):4-9. 被引量：3
9战学刚,吴强.基于TF统计和语法分析的关键词提取算法[J].计算机应用与软件,2014,31(1):47-49. 被引量：12
10刘楠,韩丽芳,夏坤峰,曲通.一种改进的基于抽象语法树的软件源代码比对算法[J].信息网络安全,2014(1):38-42. 被引量：9

共引文献40

1杨雷,韦韩,龚尚文,赵莺菲.基于LSTM的桥梁养护文本数据的命名实体识别方法[J].公路交通科技,2023,40(S02):187-192.
2杨志敏,陈一童,吴桂龙,黄强,贺云.基于深度学习的电力通信光纤配线标签识别研究[J].电力信息与通信技术,2022,20(4):18-23. 被引量：4
3陈潇艺.基于Seq2Seq的英语聊天机器人构建[J].自动化与仪器仪表,2022(7):242-246. 被引量：3
4魏晓,王晓鑫,陈永琪,张惠然.基于自然语言处理的材料领域知识图谱构建方法[J].上海大学学报（自然科学版）,2022,28(3):386-398. 被引量：3
5田静,贾智勇.基于深度学习算法的英语语法纠错系统设计[J].自动化与仪器仪表,2022(9):128-131. 被引量：1
6朱西平,卢星宇,苏作新,高昂,肖丽娟,郭露.基于多神经网络与注意力的页岩气实体识别[J].中国科技论文,2022,17(11):1201-1206. 被引量：1
7黄源航,强梦烨,李涛,晏明昊,张涵艺,贾大昌.基于RoBERTa的电力领域词汇挖掘模型[J].电力大数据,2022,25(6):1-8. 被引量：1
8余厚强,马超,王玥,李龙飞.中国替代计量数据的来源与识别研究[J].情报理论与实践,2022,45(12):111-118. 被引量：1
9刘兴丽,范俊杰,马海群.面向小样本命名实体识别的数据增强算法改进策略研究[J].数据分析与知识发现,2022,6(10):128-141. 被引量：3
10程煜,李济廷,韩明.基于深度学习的技能实体抽取研究[J].现代信息科技,2022,6(23):112-115.

1刘扬,杜帅兵.改进EEMD-WOA-SRU模型在用水量预测中的应用[J].水电能源科学,2023,41(12):32-35.
2何木璇,郑丽娜,常辉.界面视角下韩国学习者汉语否定辖域的习得研究[J].世界汉语教学,2024,38(1):111-125.

信息技术

2023年第12期

浏览历史

内容加载中请稍等...

融合预训练模型和自注意力的英语语法纠错

参考文献4

二级参考文献48

共引文献40

相关作者

相关机构

相关主题

浏览历史