期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于深度学习的学术论文语步结构分类方法研究 被引量:21
1
作者 王末 崔运鹏 +1 位作者 陈丽 李欢 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第6期60-68,共9页
【目的】以深度学习语言表征模型学习论文句子表达,以此为基础构建论文语步分类模型,提高分类效果。【方法】采用基于深度学习预训练语言表征模型BERT,结合句子文中位置改进模型输入,以标注数据集进行迁移学习,获得句子级的嵌入表达,并... 【目的】以深度学习语言表征模型学习论文句子表达,以此为基础构建论文语步分类模型,提高分类效果。【方法】采用基于深度学习预训练语言表征模型BERT,结合句子文中位置改进模型输入,以标注数据集进行迁移学习,获得句子级的嵌入表达,并以此输入神经网络分类器训练分类模型,实现论文语步分类。【结果】基于公开数据集的实验结果表明,11类别分类任务中,总体准确率提高了29.7%,达到81.3%;在7类别核心语步分类任务中,准确率达到85.5%。【局限】受限于实验环境,所提改进输入模型的预训练参数来源于原始的模型结构,迁移学习的参数对于新模型输入的适用程度可进一步探索。【结论】该方法较传统的"特征构建+机器学习"分类器方法效果有大幅提高,较原始BERT模型亦有一定提高,且无须人工构建特征,模型不局限于特定语言,可应用于中文学术论文的语步分类任务,具有较大的实际应用潜力。 展开更多
关键词 语步分类 深度学习 双向编码器 神经网络
原文传递
基于层次注意力网络的论证区间识别研究 被引量:2
2
作者 王鑫 程齐凯 +1 位作者 马永强 罗卓然 《情报工程》 2020年第3期52-62,共11页
学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的HAN深度学习模型对学术文... 学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的HAN深度学习模型对学术文本论证区间识别进行了研究。本文首先构建了一个基于层次注意力机制的论证区间识别模型,阐述了该模型的整体架构和作用机制。其次,针对生物医学领域提出了一个论证区间9分类体系,在PubMed生物医学数据集上,用LSTM和SVM两种文本分类算法与HAN模型进行对比实验。研究结果表明,本文所采用的HAN模型在各个类别的论证区间识别上效果均为最优,F1值达到了0.90,能够较好的完成论证区间识别研究。最后,对实验结果进行错误总结和分析,并指出了下一步的研究方向。 展开更多
关键词 层次注意力网络 论证区间 深度学习 文本分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部