一种基于BERT和池化操作的文本分类模型被引量：3

A Text Classification Model Based on BERT and Pooling Operation

下载PDF

导出

摘要使用预训练语言模型的微调方法在以文本分类为代表的许多自然语言处理任务中取得了良好的效果,尤其以基于Transformer框架的BERT模型为典型代表。然而,BERT直接使用[CLS]对应的向量作为文本表征,没有从全局和局部考虑文本的特征,从而限制了模型的分类性能。因此,本文提出一种引入池化操作的文本分类模型,使用平均池化、最大池化以及K-MaxPooling等池化方法从BERT输出矩阵中提取文本的表征向量。实验结果表明,与原始的BERT模型相比,本文提出的引入池化操作的文本分类模型具有更好的性能,在实验的所有文本分类任务中,其准确率和F1-Score值均优于BERT模型。 The fine-tuning method using the pre-trained language model has achieved good results in many natural language processing tasks represented by text classification,BERT model based on the Transformer framework as a typical representative especially.However,BERT uses the vector corresponding to [CLS]as the text representation directly,and does not consider the local features and global features of texts,which limits the classification performance of the model.Therefore,this paper proposes a text classification model that introduces a pooling operation,and uses pooling methods such as average pooling,maximum pooling,and K-MaxPooling to extract the representation vector of texts from the output matrix of BERT.The experimental results show that compared with the original BERT model,the text classification model with pooling operation proposed in this paper has better performance.In all text classification tasks in the experiment,its accuracy and F1-Score value are better than BERT model.

作者张军邱龙龙 ZHNAG Jun;QIU Long-long(School of Software,East China University of Technology,Nanchang 330013,China;School of Information Engineering,East China University of Technology,Nanchang 330013,China)

机构地区东华理工大学软件学院东华理工大学信息工程学院

出处《计算机与现代化》 2022年第6期1-7,共7页 Computer and Modernization

基金国家自然科学基金资助项目(62162002,61662002,61972293,61902189) 江西省自然科学基金资助项目(20212BAB202002) 江苏省自然科学基金资助项目(BK20180821)。

关键词文本分类分类模型 BERT 平均池化最大池化 K-MaxPooling text classification classification model BERT mean-pooling max-pooling K-MaxPooling

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1朱雪晨,陈三林,蔡刚,黄志洪.降低参数规模的卷积神经网络模型压缩方法[J].计算机与现代化,2021(9):83-89. 被引量：7
2刘奇旭,刘心宇,罗成,王君楠,陈浪平,刘嘉熹.基于双向循环神经网络的安卓浏览器指纹识别方法[J].计算机研究与发展,2020,57(11):2294-2311. 被引量：7
3夏瑜潞.循环神经网络的发展综述[J].电脑知识与技术,2019,15(7X):182-184. 被引量：32
4罗嘉,王乐豪,涂姗姗,宋鸽,韩莹.基于LSTM-BLS的突发气象灾害事件中公众情感倾向分析[J].南京信息工程大学学报（自然科学版）,2021,13(4):477-483. 被引量：9
5马月梅,陈海英,刘国军.彩色图像质量评价的广义平均池化策略[J].激光与光电子学进展,2018,55(2):200-207. 被引量：6
6刘国军,高丽霞,陈丽奇.广义平均的全参考型图像质量评价池化策略[J].光学精密工程,2017,25(3):742-748. 被引量：11
7王静..基于最大池化的图双注意力网络研究及应用[D].河北师范大学,2020:

二级参考文献21

1杨春玲,陈冠豪,谢胜利.基于梯度信息的图像质量评判方法的研究[J].电子学报,2007,35(7):1313-1317. 被引量：62
2贾燕花,徐蔚鸿.K-means聚类和支持向量机结合的文本分类研究[J].计算机工程与应用,2010,46(22):172-174. 被引量：6
3邹蕾,张先锋.人工智能及其发展应用[J].信息网络安全,2012(2):11-13. 被引量：209
4崔法毅.色度马氏距离图与灰度图特征自适应融合的彩色人脸识别[J].红外与激光工程,2015,44(4):1382-1389. 被引量：4
5路永玲,陶风波,周志成,刘洋.气象灾害对江苏电网设备的影响及防御分析[J].南京信息工程大学学报（自然科学版）,2015,7(5):469-474. 被引量：10
6徐海勇,郁梅,骆挺,吕亚奇,蒋刚毅.基于非负矩阵分解的彩色图像质量评价方法[J].电子与信息学报,2016,38(3):578-585. 被引量：5
7Qiaohong Li,Yu-Ming Fang,Member, CCF,Jing-Tao Xu.A Novel Spatial Pooling Strategy for Image Quality Assessment[J].Journal of Computer Science & Technology,2016,31(2):225-234. 被引量：3
8骆媛,张科,纪明.增强无人机态势感知的彩色图像融合方法[J].红外与激光工程,2016,45(B05):200-206. 被引量：6
9刘国军,高丽霞,陈丽奇.广义平均的全参考型图像质量评价池化策略[J].光学精密工程,2017,25(3):742-748. 被引量：11
10金志威,曹娟,王博,王蕊,张勇东.融合多模态特征的社会多媒体谣言检测技术研究[J].南京信息工程大学学报（自然科学版）,2017,9(6):583-592. 被引量：9

共引文献66

1阳雨妍,宋爱国,沈书馨,李会军.基于CNN-GRU的遥操作机器人操作者识别与自适应速度控制方法[J].仪器仪表学报,2021,42(3):123-131. 被引量：18
2方洁,崔兰兰.突发自然灾害事件微信用户信息发布行为影响因素研究——以“7.20河南暴雨”灾害为例[J].知识管理论坛,2022(2):164-177. 被引量：1
3马建程,倪德芬.HDSL技术和速率可调的接口电路[J].电子产品世界,2000,7(4):55-56.
4马月梅,陈海英,刘国军.彩色图像质量评价的广义平均池化策略[J].激光与光电子学进展,2018,55(2):200-207. 被引量：6
5韩雪莹,王琪,葛乃馨.相位调制潜像对图像呈色效果的影响[J].激光与光电子学进展,2018,55(7):208-214. 被引量：2
6胡聪,屈瑾瑾,许川佩,朱爱军.基于自适应池化的神经网络的服装图像识别[J].计算机应用,2018,38(8):2211-2217. 被引量：12
7朱浩然,刘云清,张文颖.基于灰度变换与两尺度分解的夜视图像融合[J].电子与信息学报,2019,41(3):640-648. 被引量：15
8朱浩然,刘云清,张文颖.基于迭代导向滤波与多视觉权重信息的红外与可见光图像融合[J].光子学报,2019,48(3):184-194. 被引量：8
9王同乐,王慈.基于概率矩阵分解的多失真图像质量评估算法[J].计算机应用与软件,2019,36(7):264-272. 被引量：1
10刘望明,胡荣明,史小亮.基于图像质量评价的航测影像成图质量的研究[J].电子测量技术,2019,42(11):122-127. 被引量：5

同被引文献25

1陆明,何卫春,党宝齐,闻峰,徐立,郭春华.高血压脑出血患者的手术时机和手术方式的选择[J].中国实用神经疾病杂志,2014,17(1):24-26. 被引量：25
2赵雄文,郭春霞,李景春.基于高阶累积量和循环谱的信号调制方式混合识别算法[J].电子与信息学报,2016,38(3):674-680. 被引量：81
3刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600. 被引量：993
4张晓晓,庞婷.浅谈人工智能特点及在医学中应用的几个阶段[J].福建电脑,2017,33(3):106-106. 被引量：9
5任浩,屈剑锋,柴毅,唐秋,叶欣.深度学习在故障诊断领域中的研究现状与挑战[J].控制与决策,2017,32(8):1345-1358. 被引量：198
6刘卫东.高血压性脑出血的诊治进展[J].上海医学,2017,40(11):646-649. 被引量：41
7王海滨,周正,李炳荣,解传军.基于数字通信信号瞬时特性的调制方式识别方法[J].现代电子技术,2019,42(16):22-25. 被引量：16
8张育瑜,赵磊,郭文彬,彭涛,王文博.基于知识图谱的无线电监测及盲信号识别[J].无线电工程,2020,50(3):187-192. 被引量：6
9占锦敏,赵知劲.常规调制信号与扩频信号的调制识别算法[J].信号处理,2020,36(4):511-519. 被引量：12
10无,游潮,刘鸣,于学忠,陶传元,肖安琪,伍聪.高血压性脑出血中国多学科诊治指南[J].中国急救医学,2020,40(8):689-702. 被引量：287

引证文献3

1王源,冯永新,钱博.一种循环谱特征提取的直扩信号智能识别方法[J].沈阳理工大学学报,2023,42(4):31-39. 被引量：2
2夏宇隆,蒋理,但炜,谢延风,邓博,黄琦麟,利节.基于人工智能的高血压性脑出血医疗文本信息自动识别系统[J].重庆医科大学学报,2023,48(9):1122-1127. 被引量：2
3张昆,张永伟,吴永城,张笑文,翟世臣.基于大模型的设备故障知识图谱自动构建方法[J].计算机与现代化,2024(11):46-53.

二级引证文献4

1任江飞,许魁,刘洋,陆瑞,张咪,叶子绿.一种基于改进残差神经网络的直扩信号感知方法[J].电讯技术,2023,63(12):1862-1868.
2曾俊泓,沈桃桃,伍国锋,欧阳静,饶佳琴,罗沙沙,张艺之,熊翠,顾颖.基于CiteSpace及VOSviewer的脑出血手术治疗相关研究现状及趋势的可视化分析[J].中国脑血管病杂志,2024,21(7):455-466.
3刘佳楠.基于干扰信号剔除的全频段音乐和弦识别方法[J].赤峰学院学报（自然科学版）,2024,40(9):64-69.
4夏涛,高磊.通腑醒神汤对高血压脑出血患者微创手术后神经功能及炎性因子的影响[J].世界复合医学（中英文）,2024,10(9):17-20.

1李云龙,余正涛,高盛祥,郭军军,彭仁杰.基于案件要素指导及深度聚类的新闻与案件相关性分析[J].中文信息学报,2021,35(11):60-69. 被引量：1
2田雨,张桂平,蔡东风,陈华威,宋彦.基于多颗粒度文本表征的中文命名实体识别方法[J].中文信息学报,2022,36(4):90-99. 被引量：4
3李亚水.2019年奔驰CLS300电动座椅靠背无法调节[J].汽车维修与保养,2022(6):35-37. 被引量：1
4Takehiko Sugita,Naohisa Miyatake,Seiya Miyamoto,Akira Sasaki,Ikuo Maeda,Makiko Okumoto,Nozomi Itou,Masayuki Kamimura,Takashi Aki,Toshimi Aizawa.Influence of Psychiatric Problems on Clinical Outcomes during the First 12 Months after Primary Total Knee Arthroplasty[J].Open Journal of Orthopedics,2022,12(5):242-252.
5李良毅.融入事件依存路径的事件时序关系识别[J].通信技术,2022,55(5):581-587.
6周健庭,郑和.2021年饲料霉菌毒素污染情况调查报告[J].养猪,2022(3):12-16. 被引量：16
7徐佳楠,张天瑞,赵伟博,贾泽轩.面向供应链风险评估的改进BP小波神经网络研究[J].计算机科学,2022,49(S01):654-660. 被引量：6
8郑和.2021中国饲用油脂分析报告[J].广东饲料,2022(4):42-45. 被引量：1
9Hussein Janna.Effectiveness of Using Natural Materials as a Coagulant for Reduction of Water Turbidity in Water Treatment[J].World Journal of Engineering and Technology,2016,4(4):505-516. 被引量：2
10肖丹.跨文化学习视域下英语专业课程思政教学路向探析[J].外国语文,2022,38(3):153-160. 被引量：10

计算机与现代化

2022年第6期

浏览历史

内容加载中请稍等...

一种基于BERT和池化操作的文本分类模型被引量：3

参考文献7

二级参考文献21

共引文献66

同被引文献25

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于BERT和池化操作的文本分类模型 被引量：3

参考文献7

二级参考文献21

共引文献66

同被引文献25

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于BERT和池化操作的文本分类模型被引量：3