期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
融合深度学习和链路预测的细粒度技术预测研究--以合成生物技术为例 被引量:1
1
作者 胡雅敏 吴晓燕 +2 位作者 钱杨舸 陈方 《图书情报工作》 CSSCI 北大核心 2022年第24期92-103,共12页
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和... [目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。 展开更多
关键词 技术术语识别 深度学习 技术预测 合成生物
原文传递
基于改进自注意力机制和表示学习的分层文档分类方法
2
作者 钱杨舸 +1 位作者 王乾垒 秦小林 《计算机科学》 CSCD 北大核心 2024年第2期238-244,共7页
文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型... 文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型面临的大量重复计算以及可解释性缺乏的问题,提出了一种分层文档分类模型,并研究了句子和文档表示方法对文档分类问题的性能影响。所提模型集成了使用改进自注意力机制融合输入特征向量的句子编码器和文档编码器,形成了一个层次结构,以实现对文档级数据的分层处理,在简化计算的同时增强了模型的可解释性。与仅使用预训练语言模型的特殊标记向量作为句子表示的模型相比,所提模型在5个公开文档分类数据集上实现了平均4%的性能提升,比使用词向量矩阵的注意力输出均值的模型提高了2%。 展开更多
关键词 句子表示 文档表示 注意力机制 文档分类 模型可解释性
下载PDF
交互式机器翻译综述 被引量:1
3
作者 秦小林 +1 位作者 张思齐 钱杨舸 《计算机应用》 CSCD 北大核心 2023年第2期329-334,共6页
随着深度学习的发展和成熟,神经机器翻译的质量也越来越高,然而仍不完美,为了达到可接受的翻译效果,需要人工进行后期编辑。交互式机器翻译(IMT)是这种串行工作的一个替代,即在翻译过程中进行人工互动,由用户对翻译系统产生的候选翻译... 随着深度学习的发展和成熟,神经机器翻译的质量也越来越高,然而仍不完美,为了达到可接受的翻译效果,需要人工进行后期编辑。交互式机器翻译(IMT)是这种串行工作的一个替代,即在翻译过程中进行人工互动,由用户对翻译系统产生的候选翻译进行验证,并且,如有必要,由用户提供新的输入,系统根据用户当前的反馈生成新的候选译文,如此往复,直到产生一个使用户满意的输出。首先,介绍了IMT的基本概念以及当前的研究进展;然后,分类对一些常用方法和前沿工作加以介绍,并简述每个工作的背景和创新之处;最后,探讨了IMT的发展趋势和研究难点。 展开更多
关键词 机器翻译 交互式机器翻译 交互式统计机器翻译 交互式神经机器翻译 强化学习 自然语言处理
下载PDF
基于深度学习的文本语义匹配综述 被引量:1
4
作者 钱杨舸 秦小林 +1 位作者 张思齐 《软件导刊》 2022年第12期252-261,共10页
文本的语义匹配任务旨在计算文本在语义上的相似度,进而衡量两段不同文本的匹配程度。作为自然语言处理中的重要基础,文本匹配可用于众多具体任务,如文本蕴含、信息检索、对话系统、机器翻译等。深度学习的应用使文本语义匹配模型能更... 文本的语义匹配任务旨在计算文本在语义上的相似度,进而衡量两段不同文本的匹配程度。作为自然语言处理中的重要基础,文本匹配可用于众多具体任务,如文本蕴含、信息检索、对话系统、机器翻译等。深度学习的应用使文本语义匹配模型能更充分地挖掘文本语义信息,在匹配任务中取得更好效果。基于此,从不同的语义组合结构对多种深度语义匹配模型进行了综述,并介绍了近年来广受关注的预训练语言模型在语义匹配任务上的应用。鉴于文本匹配任务和原始文本的多样性,还简要介绍了长文本的匹配任务和中文的语义匹配发展现状,概述有代表性的模型。最后结合下游实际应用,对深度文本语义匹配的未来发展方向进行了探讨。 展开更多
关键词 文本匹配 自然语言处理 深度学习 文本语义信息 预训练语言模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部