图卷积网络与自注意机制在文本分类任务上的对比分析被引量：4

A Comparative Study of Graph Convolutional Networks and Self-Attention Mechanism on Text Classification

下载PDF

导出

摘要图卷积网络近年来受到大量关注,同时自注意机制作为Transformer结构及众多预训练模型的核心之一也得到广泛运用。该文从原理上分析发现,自注意机制可视为图卷积网络的一种泛化形式,其以所有输入样本为节点,构建有向全连接图进行卷积,且节点间连边权重可学。在多个文本分类数据集上的对比实验一致显示,使用自注意机制的模型较使用图卷积网络的对照模型分类效果更佳,甚至超过了目前图卷积网络用于文本分类任务的最先进水平,并且随着数据规模的增大,两者分类效果的差距也随之扩大。这些证据表明,自注意力机制更具表达能力,在文本分类任务上能够相对图卷积网络带来分类效果的提升。 Graph Convolutional Networks has drawn much attention recently,and the self-attention mechanism has been widely applied as the core of the Transformer and many pre-trained models.We disclose that the self-attention mechanism can be seen as a generalization of Graph Convolutional Networks,in that it takes all input samples as nodes and then constructs a directed fully connected graph with learnable edge weights for convolution.Experiments show that the self-attention mechanism achieves better text classification accuracy than many state-of-the-art Graph Convolutional Networks.Meanwhile,the performance gap of classification widens as the data size increases.These show that the self-attention mechanism is more expressive,and may surpass Graph Convolutional Networks with potential performance improvements on the task of text classification.

作者蒋浩泉张儒清郭嘉丰范意兴程学旗 JIANG Haoquan;ZHANG Ruqing;GUO Jiafeng;FAN Yixing;CHENG Xueqi(Key Laboratory of Network Data Science and Technology,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China;University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国科学院计算技术研究所网络数据科学与技术重点实验室中国科学院大学

出处《中文信息学报》 CSCD 北大核心 2021年第12期84-93,共10页 Journal of Chinese Information Processing

基金北京智源人工智能研究院项目(BAAI2019ZD0306) 国家自然科学基金(62006218,61902381,61773362,61872338) 中国科学院青年创新促进项目(20144310,2016102,2021100) 国家重点研发计划(2016QY02D0405) 联想-中科院联合实验室青年科学家项目王宽诚教育基金会项目重庆市基础科学与前沿技术研究专项项目(重点)(cstc2017jcjyBX0059)

关键词图卷积网络自注意机制文本分类 graph convolutional networks self-attention mechanism text classification

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

同被引文献29

1王光,李鸿宇,邱云飞,郁博文,柳厅文.基于图卷积记忆网络的方面级情感分类[J].中文信息学报,2021,35(8):98-106. 被引量：17
2罗双玲,夏昊翔,王延章.微博社会网络及传播研究评述[J].情报学报,2015,34(12):1304-1313. 被引量：5
3何跃,朱灿.基于微博的意见领袖网情感特征分析——以“非法疫苗”事件为例[J].数据分析与知识发现,2017,1(9):65-73. 被引量：11
4曾子明,杨倩雯.基于LDA和AdaBoost多特征组合的微博情感分析[J].数据分析与知识发现,2018,2(8):51-59. 被引量：16
5赵德安,吴任迪,刘晓洋,赵宇艳.基于YOLO深度卷积神经网络的复杂背景下机器人采摘苹果定位[J].农业工程学报,2019,35(3):164-173. 被引量：176
6刘敬学,孟凡荣,周勇,刘兵.字符级卷积神经网络短文本分类算法[J].计算机工程与应用,2019,55(5):135-142. 被引量：22
7马浚诚,刘红杰,郑飞翔,杜克明,张领先,胡新,孙忠富.基于可见光图像和卷积神经网络的冬小麦苗期长势参数估算[J].农业工程学报,2019,35(5):183-189. 被引量：20
8庞皓明,冀俊忠,刘金铎,姚垚.基于流形正则化极限学习机的文本分类算法研究[J].计算机工程,2019,45(6):242-248. 被引量：5
9马思丹,刘东苏.基于加权Word2vec的文本分类方法研究[J].情报科学,2019,37(11):38-42. 被引量：24
10曹卫东,李嘉琪,王怀超.采用注意力门控卷积网络模型的目标情感分析[J].西安电子科技大学学报,2019,46(6):30-36. 被引量：11

引证文献4

1魏海燕,沈进.基于改进TF-IDF算法的日本文学语料处理计算机系统方法研究[J].自动化与仪器仪表,2023(1):162-165.
2崔少国,陈思奇,杜兴.面向目标情感分析的双重图注意力网络模型[J].西安电子科技大学学报,2023,50(1):137-148. 被引量：2
3闫尚义,王靖亚,刘晓文,崔雨萌,陶知众,张晓帆.基于多头自注意力池化与多粒度特征交互融合的微博情感分析[J].数据分析与知识发现,2023,7(4):32-45. 被引量：1
4李想,马致远,汪伟,韩士洋.BAG:基于注意力机制融合Bert和GCN的文本分类模型[J].软件工程与应用,2023,12(2):230-241.

二级引证文献3

1何勇禧,韩虎,孔博.基于多依赖图和知识融合的方面级情感分析模型[J].浙江大学学报（工学版）,2024,58(4):737-747. 被引量：1
2江亿平,张婷,夏争鸣,李玉花,张兆同.融合边缘采样和Tri-training的用户评论情感分析方法[J].数据分析与知识发现,2024,8(5):102-112.
3陈可嘉,张雨鹏,林鸿熙.句法感知与知识增强的方面级情感分析[J].西安电子科技大学学报,2024,51(5):165-178.

1蔡宇.韩流文化影响下亲属称谓语“哥”的泛化[J].河北画报,2021(10):175-176.
2武晨,谷松原,房圣超.HBF神经网络的一种结构自适应在线学习算法[J].中国电子科学研究院学报,2021,16(5):486-495. 被引量：2
3刘梦雨.论大数据背景下财务会计向管理会计的转变[J].市场调查信息（综合版）,2022(10):58-60.
4廖学东,官志利,陈国栋.关于船舶舾装单元模块建造的探讨[J].船舶物资与市场,2022,30(5):32-34. 被引量：6
5程祥鸣,邓春华.基于无标签知识蒸馏的人脸识别模型的压缩算法[J].计算机科学,2022,49(6):245-253. 被引量：5
6石菲.《数据防泄露技术指南》发布,推动数据安全迈向新阶段[J].中国信息化,2022(5):29-29.
7苏铮,李丽,许静静,刘炳业,刘志峰,杨聪彬.基于模糊数据处理的我国机床技术差距评价体系[J].制造技术与机床,2022(6):84-91. 被引量：4
8王海涛.数据融合技术及其在WSN中的应用研究[J].数据通信,2022(2):18-22. 被引量：1
9李茂春,姜时保,陈新娟,李正祥,胡时均,谢拥军,吴新秋,朱佳.岳阳市肉牛综合养殖技术推广[J].今日畜牧兽医,2022,38(5):58-60.
10徐博,杜鑫,周纯杰.数字孪生视角下基于LSTM的工控系统异常检测方法[J].信息安全研究,2022,8(6):578-585. 被引量：1

中文信息学报

2021年第12期

浏览历史

内容加载中请稍等...

图卷积网络与自注意机制在文本分类任务上的对比分析被引量：4

同被引文献29

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

图卷积网络与自注意机制在文本分类任务上的对比分析 被引量：4

同被引文献29

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

图卷积网络与自注意机制在文本分类任务上的对比分析被引量：4