期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度学习的学术论文语步结构分类方法研究
被引量:
21
1
作者
王末
崔运鹏
+1 位作者
陈丽
李欢
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020年第6期60-68,共9页
【目的】以深度学习语言表征模型学习论文句子表达,以此为基础构建论文语步分类模型,提高分类效果。【方法】采用基于深度学习预训练语言表征模型BERT,结合句子文中位置改进模型输入,以标注数据集进行迁移学习,获得句子级的嵌入表达,并...
【目的】以深度学习语言表征模型学习论文句子表达,以此为基础构建论文语步分类模型,提高分类效果。【方法】采用基于深度学习预训练语言表征模型BERT,结合句子文中位置改进模型输入,以标注数据集进行迁移学习,获得句子级的嵌入表达,并以此输入神经网络分类器训练分类模型,实现论文语步分类。【结果】基于公开数据集的实验结果表明,11类别分类任务中,总体准确率提高了29.7%,达到81.3%;在7类别核心语步分类任务中,准确率达到85.5%。【局限】受限于实验环境,所提改进输入模型的预训练参数来源于原始的模型结构,迁移学习的参数对于新模型输入的适用程度可进一步探索。【结论】该方法较传统的"特征构建+机器学习"分类器方法效果有大幅提高,较原始BERT模型亦有一定提高,且无须人工构建特征,模型不局限于特定语言,可应用于中文学术论文的语步分类任务,具有较大的实际应用潜力。
展开更多
关键词
语步分类
深度学习
双向编码器
神经网络
原文传递
基于层次注意力网络的论证区间识别研究
被引量:
2
2
作者
王鑫
程齐凯
+1 位作者
马永强
罗卓然
《情报工程》
2020年第3期52-62,共11页
学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的HAN深度学习模型对学术文...
学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的HAN深度学习模型对学术文本论证区间识别进行了研究。本文首先构建了一个基于层次注意力机制的论证区间识别模型,阐述了该模型的整体架构和作用机制。其次,针对生物医学领域提出了一个论证区间9分类体系,在PubMed生物医学数据集上,用LSTM和SVM两种文本分类算法与HAN模型进行对比实验。研究结果表明,本文所采用的HAN模型在各个类别的论证区间识别上效果均为最优,F1值达到了0.90,能够较好的完成论证区间识别研究。最后,对实验结果进行错误总结和分析,并指出了下一步的研究方向。
展开更多
关键词
层次注意力网络
论证区间
深度学习
文本分类
下载PDF
职称材料
题名
基于深度学习的学术论文语步结构分类方法研究
被引量:
21
1
作者
王末
崔运鹏
陈丽
李欢
机构
中国农业科学院农业信息研究所
农业农村部农业大数据重点实验室
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020年第6期60-68,共9页
基金
中国农业科学院科技创新工程项目“多源异构农业大数据关联发现与计算挖掘”(项目编号:CAAS-ASTIP-2016-AII)的研究成果之一。
文摘
【目的】以深度学习语言表征模型学习论文句子表达,以此为基础构建论文语步分类模型,提高分类效果。【方法】采用基于深度学习预训练语言表征模型BERT,结合句子文中位置改进模型输入,以标注数据集进行迁移学习,获得句子级的嵌入表达,并以此输入神经网络分类器训练分类模型,实现论文语步分类。【结果】基于公开数据集的实验结果表明,11类别分类任务中,总体准确率提高了29.7%,达到81.3%;在7类别核心语步分类任务中,准确率达到85.5%。【局限】受限于实验环境,所提改进输入模型的预训练参数来源于原始的模型结构,迁移学习的参数对于新模型输入的适用程度可进一步探索。【结论】该方法较传统的"特征构建+机器学习"分类器方法效果有大幅提高,较原始BERT模型亦有一定提高,且无须人工构建特征,模型不局限于特定语言,可应用于中文学术论文的语步分类任务,具有较大的实际应用潜力。
关键词
语步分类
深度学习
双向编码器
神经网络
Keywords
argumentative
zoning
Deep
Learning
Bidirectional
Encoder
Neural
Networks
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于层次注意力网络的论证区间识别研究
被引量:
2
2
作者
王鑫
程齐凯
马永强
罗卓然
机构
武汉大学信息管理学院
武汉大学信息检索与知识挖掘研究所
出处
《情报工程》
2020年第3期52-62,共11页
基金
国家自然科学基金面上项目“基于多语义信息融合的学术文献引文推荐研究”(7167030644)
国家自然科学基金青年项目“基于深度语义挖掘的引文推荐多样化研究”(71704137)。
文摘
学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的HAN深度学习模型对学术文本论证区间识别进行了研究。本文首先构建了一个基于层次注意力机制的论证区间识别模型,阐述了该模型的整体架构和作用机制。其次,针对生物医学领域提出了一个论证区间9分类体系,在PubMed生物医学数据集上,用LSTM和SVM两种文本分类算法与HAN模型进行对比实验。研究结果表明,本文所采用的HAN模型在各个类别的论证区间识别上效果均为最优,F1值达到了0.90,能够较好的完成论证区间识别研究。最后,对实验结果进行错误总结和分析,并指出了下一步的研究方向。
关键词
层次注意力网络
论证区间
深度学习
文本分类
Keywords
Hierarchical
attention
network
argumentative
zoning
deep
learning
text
classification
分类号
G35 [文化科学—情报学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度学习的学术论文语步结构分类方法研究
王末
崔运鹏
陈丽
李欢
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020
21
原文传递
2
基于层次注意力网络的论证区间识别研究
王鑫
程齐凯
马永强
罗卓然
《情报工程》
2020
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部