期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合深度学习和链路预测的细粒度技术预测研究--以合成生物技术为例
被引量:
1
1
作者
胡雅敏
吴晓燕
+2 位作者
廖
兴
滨
钱杨舸
陈方
《图书情报工作》
CSSCI
北大核心
2022年第24期92-103,共12页
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和...
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。
展开更多
关键词
技术术语识别
深度学习
技术预测
合成生物
原文传递
基于改进自注意力机制和表示学习的分层文档分类方法
2
作者
廖
兴
滨
钱杨舸
+1 位作者
王乾垒
秦小林
《计算机科学》
CSCD
北大核心
2024年第2期238-244,共7页
文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型...
文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型面临的大量重复计算以及可解释性缺乏的问题,提出了一种分层文档分类模型,并研究了句子和文档表示方法对文档分类问题的性能影响。所提模型集成了使用改进自注意力机制融合输入特征向量的句子编码器和文档编码器,形成了一个层次结构,以实现对文档级数据的分层处理,在简化计算的同时增强了模型的可解释性。与仅使用预训练语言模型的特殊标记向量作为句子表示的模型相比,所提模型在5个公开文档分类数据集上实现了平均4%的性能提升,比使用词向量矩阵的注意力输出均值的模型提高了2%。
展开更多
关键词
句子表示
文档表示
注意力机制
文档分类
模型可解释性
下载PDF
职称材料
交互式机器翻译综述
被引量:
1
3
作者
廖
兴
滨
秦小林
+1 位作者
张思齐
钱杨舸
《计算机应用》
CSCD
北大核心
2023年第2期329-334,共6页
随着深度学习的发展和成熟,神经机器翻译的质量也越来越高,然而仍不完美,为了达到可接受的翻译效果,需要人工进行后期编辑。交互式机器翻译(IMT)是这种串行工作的一个替代,即在翻译过程中进行人工互动,由用户对翻译系统产生的候选翻译...
随着深度学习的发展和成熟,神经机器翻译的质量也越来越高,然而仍不完美,为了达到可接受的翻译效果,需要人工进行后期编辑。交互式机器翻译(IMT)是这种串行工作的一个替代,即在翻译过程中进行人工互动,由用户对翻译系统产生的候选翻译进行验证,并且,如有必要,由用户提供新的输入,系统根据用户当前的反馈生成新的候选译文,如此往复,直到产生一个使用户满意的输出。首先,介绍了IMT的基本概念以及当前的研究进展;然后,分类对一些常用方法和前沿工作加以介绍,并简述每个工作的背景和创新之处;最后,探讨了IMT的发展趋势和研究难点。
展开更多
关键词
机器翻译
交互式机器翻译
交互式统计机器翻译
交互式神经机器翻译
强化学习
自然语言处理
下载PDF
职称材料
基于深度学习的文本语义匹配综述
被引量:
1
4
作者
钱杨舸
秦小林
+1 位作者
张思齐
廖
兴
滨
《软件导刊》
2022年第12期252-261,共10页
文本的语义匹配任务旨在计算文本在语义上的相似度,进而衡量两段不同文本的匹配程度。作为自然语言处理中的重要基础,文本匹配可用于众多具体任务,如文本蕴含、信息检索、对话系统、机器翻译等。深度学习的应用使文本语义匹配模型能更...
文本的语义匹配任务旨在计算文本在语义上的相似度,进而衡量两段不同文本的匹配程度。作为自然语言处理中的重要基础,文本匹配可用于众多具体任务,如文本蕴含、信息检索、对话系统、机器翻译等。深度学习的应用使文本语义匹配模型能更充分地挖掘文本语义信息,在匹配任务中取得更好效果。基于此,从不同的语义组合结构对多种深度语义匹配模型进行了综述,并介绍了近年来广受关注的预训练语言模型在语义匹配任务上的应用。鉴于文本匹配任务和原始文本的多样性,还简要介绍了长文本的匹配任务和中文的语义匹配发展现状,概述有代表性的模型。最后结合下游实际应用,对深度文本语义匹配的未来发展方向进行了探讨。
展开更多
关键词
文本匹配
自然语言处理
深度学习
文本语义信息
预训练语言模型
下载PDF
职称材料
题名
融合深度学习和链路预测的细粒度技术预测研究--以合成生物技术为例
被引量:
1
1
作者
胡雅敏
吴晓燕
廖
兴
滨
钱杨舸
陈方
机构
中国科学院成都文献情报中心
中国科学院大学经济与管理学院图书情报与档案管理系
中国科学院成都计算机应用研究所
出处
《图书情报工作》
CSSCI
北大核心
2022年第24期92-103,共12页
基金
中国科学院成都文献情报中心2021年创新基金青年项目“基于知识基因的领域创新路径分析框架研究”(项目编号:E1Z0000202)研究成果之一。
文摘
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。
关键词
技术术语识别
深度学习
技术预测
合成生物
Keywords
technology terms recognitiond
deep learning
technology prediction
synthetic biology
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于改进自注意力机制和表示学习的分层文档分类方法
2
作者
廖
兴
滨
钱杨舸
王乾垒
秦小林
机构
中国科学院成都计算机应用研究所自动推理实验室
中国科学院大学计算机科学与技术学院
出处
《计算机科学》
CSCD
北大核心
2024年第2期238-244,共7页
基金
四川省科技计划(2019ZDZX0006,2020YFQ0056)
中科院STS计划区域重点A类(KFJ-STS-QYZD-2021-21-001)。
文摘
文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型面临的大量重复计算以及可解释性缺乏的问题,提出了一种分层文档分类模型,并研究了句子和文档表示方法对文档分类问题的性能影响。所提模型集成了使用改进自注意力机制融合输入特征向量的句子编码器和文档编码器,形成了一个层次结构,以实现对文档级数据的分层处理,在简化计算的同时增强了模型的可解释性。与仅使用预训练语言模型的特殊标记向量作为句子表示的模型相比,所提模型在5个公开文档分类数据集上实现了平均4%的性能提升,比使用词向量矩阵的注意力输出均值的模型提高了2%。
关键词
句子表示
文档表示
注意力机制
文档分类
模型可解释性
Keywords
Sentence representation
Document representation
Attention mechanism
Document classification
Model interpre-tability
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
交互式机器翻译综述
被引量:
1
3
作者
廖
兴
滨
秦小林
张思齐
钱杨舸
机构
中国科学院成都计算机应用研究所
中国科学院大学计算机科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2023年第2期329-334,共6页
基金
四川省科技计划项目(2019ZDZX0006)
中国科学院STS计划区域重点项目(A类)(KFJ-STS-QYZD-2021-21-001)。
文摘
随着深度学习的发展和成熟,神经机器翻译的质量也越来越高,然而仍不完美,为了达到可接受的翻译效果,需要人工进行后期编辑。交互式机器翻译(IMT)是这种串行工作的一个替代,即在翻译过程中进行人工互动,由用户对翻译系统产生的候选翻译进行验证,并且,如有必要,由用户提供新的输入,系统根据用户当前的反馈生成新的候选译文,如此往复,直到产生一个使用户满意的输出。首先,介绍了IMT的基本概念以及当前的研究进展;然后,分类对一些常用方法和前沿工作加以介绍,并简述每个工作的背景和创新之处;最后,探讨了IMT的发展趋势和研究难点。
关键词
机器翻译
交互式机器翻译
交互式统计机器翻译
交互式神经机器翻译
强化学习
自然语言处理
Keywords
machine translation
Interactive Machine Translation(IMT)
Interactive Statistical Machine Translation(ISMT)
Interactive Neural Machine Translation(INMT)
Reinforcement Learning(RL)
Natural Language Processing(NLP)
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于深度学习的文本语义匹配综述
被引量:
1
4
作者
钱杨舸
秦小林
张思齐
廖
兴
滨
机构
中国科学院成都计算机应用研究所
中国科学院大学计算机科学与技术学院
出处
《软件导刊》
2022年第12期252-261,共10页
基金
中科院STS区域重点A类(KFJ-STS-QYZD-2021-21-001)
四川省科技计划项目(2020YFG0010,2021YFG0034,2020YFQ0056)。
文摘
文本的语义匹配任务旨在计算文本在语义上的相似度,进而衡量两段不同文本的匹配程度。作为自然语言处理中的重要基础,文本匹配可用于众多具体任务,如文本蕴含、信息检索、对话系统、机器翻译等。深度学习的应用使文本语义匹配模型能更充分地挖掘文本语义信息,在匹配任务中取得更好效果。基于此,从不同的语义组合结构对多种深度语义匹配模型进行了综述,并介绍了近年来广受关注的预训练语言模型在语义匹配任务上的应用。鉴于文本匹配任务和原始文本的多样性,还简要介绍了长文本的匹配任务和中文的语义匹配发展现状,概述有代表性的模型。最后结合下游实际应用,对深度文本语义匹配的未来发展方向进行了探讨。
关键词
文本匹配
自然语言处理
深度学习
文本语义信息
预训练语言模型
Keywords
text matching
natural language processing
deep learning
text semantic information
pre-trained language model
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合深度学习和链路预测的细粒度技术预测研究--以合成生物技术为例
胡雅敏
吴晓燕
廖
兴
滨
钱杨舸
陈方
《图书情报工作》
CSSCI
北大核心
2022
1
原文传递
2
基于改进自注意力机制和表示学习的分层文档分类方法
廖
兴
滨
钱杨舸
王乾垒
秦小林
《计算机科学》
CSCD
北大核心
2024
0
下载PDF
职称材料
3
交互式机器翻译综述
廖
兴
滨
秦小林
张思齐
钱杨舸
《计算机应用》
CSCD
北大核心
2023
1
下载PDF
职称材料
4
基于深度学习的文本语义匹配综述
钱杨舸
秦小林
张思齐
廖
兴
滨
《软件导刊》
2022
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部