期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于机器学习的技术术语识别研究综述
被引量:
15
1
作者
胡雅敏
吴晓燕
陈方
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2022年第2期7-17,共11页
【目的】梳理机器学习算法在技术术语识别中的应用现状与前景。【文献范围】在WOS核心库和CNKI数据库中,以“technology term*recognition”、“技术术语识别”为检索词检索文献,并延伸阅读相关算法文献,共筛选62篇代表性文献进行述评...
【目的】梳理机器学习算法在技术术语识别中的应用现状与前景。【文献范围】在WOS核心库和CNKI数据库中,以“technology term*recognition”、“技术术语识别”为检索词检索文献,并延伸阅读相关算法文献,共筛选62篇代表性文献进行述评。【方法】类比命名实体识别研究,归纳机器学习在技术术语识别中的应用和区别,从算法分类、一般流程、现存问题和下游应用4个方面进行梳理,并展望未来的应用前景。【结果】应用算法可分为单一的统计机器学习、单一深度学习和两者结合的混合算法,应用最广泛的是两者结合的混合算法,主流的模型代表是BiLSTM-CRF模型,迁移学习是未来重要的研究方向。【局限】深度学习快速发展,混合模型不断涌现,所归纳的算法模型仅为应用较为广泛的算法,并未逐一列出。【结论】现有方法仍然有诸多待优化研究的问题,应加强细粒度的实体识别、特征表示方法、评估方法和开源工具包等方面的研究。
展开更多
关键词
技术
术语
识别
机器学习
深度学习
原文传递
融合深度学习和链路预测的细粒度技术预测研究--以合成生物技术为例
被引量:
2
2
作者
胡雅敏
吴晓燕
+2 位作者
廖兴滨
钱杨舸
陈方
《图书情报工作》
CSSCI
北大核心
2022年第24期92-103,共12页
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和...
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。
展开更多
关键词
技术
术语
识别
深度学习
技术
预测
合成生物
原文传递
题名
基于机器学习的技术术语识别研究综述
被引量:
15
1
作者
胡雅敏
吴晓燕
陈方
机构
中国科学院成都文献情报中心
中国科学院大学经济与管理学院图书情报与档案管理系
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2022年第2期7-17,共11页
文摘
【目的】梳理机器学习算法在技术术语识别中的应用现状与前景。【文献范围】在WOS核心库和CNKI数据库中,以“technology term*recognition”、“技术术语识别”为检索词检索文献,并延伸阅读相关算法文献,共筛选62篇代表性文献进行述评。【方法】类比命名实体识别研究,归纳机器学习在技术术语识别中的应用和区别,从算法分类、一般流程、现存问题和下游应用4个方面进行梳理,并展望未来的应用前景。【结果】应用算法可分为单一的统计机器学习、单一深度学习和两者结合的混合算法,应用最广泛的是两者结合的混合算法,主流的模型代表是BiLSTM-CRF模型,迁移学习是未来重要的研究方向。【局限】深度学习快速发展,混合模型不断涌现,所归纳的算法模型仅为应用较为广泛的算法,并未逐一列出。【结论】现有方法仍然有诸多待优化研究的问题,应加强细粒度的实体识别、特征表示方法、评估方法和开源工具包等方面的研究。
关键词
技术
术语
识别
机器学习
深度学习
Keywords
Technology Term Recognition
Machine Learning
Deep Learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
融合深度学习和链路预测的细粒度技术预测研究--以合成生物技术为例
被引量:
2
2
作者
胡雅敏
吴晓燕
廖兴滨
钱杨舸
陈方
机构
中国科学院成都文献情报中心
中国科学院大学经济与管理学院图书情报与档案管理系
中国科学院成都计算机应用研究所
出处
《图书情报工作》
CSSCI
北大核心
2022年第24期92-103,共12页
基金
中国科学院成都文献情报中心2021年创新基金青年项目“基于知识基因的领域创新路径分析框架研究”(项目编号:E1Z0000202)研究成果之一。
文摘
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。
关键词
技术
术语
识别
深度学习
技术
预测
合成生物
Keywords
technology terms recognitiond
deep learning
technology prediction
synthetic biology
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于机器学习的技术术语识别研究综述
胡雅敏
吴晓燕
陈方
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2022
15
原文传递
2
融合深度学习和链路预测的细粒度技术预测研究--以合成生物技术为例
胡雅敏
吴晓燕
廖兴滨
钱杨舸
陈方
《图书情报工作》
CSSCI
北大核心
2022
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部