期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于机器学习的技术术语识别研究综述 被引量:15
1
作者 胡雅敏 吴晓燕 陈方 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第2期7-17,共11页
【目的】梳理机器学习算法在技术术语识别中的应用现状与前景。【文献范围】在WOS核心库和CNKI数据库中,以“technology term*recognition”、“技术术语识别”为检索词检索文献,并延伸阅读相关算法文献,共筛选62篇代表性文献进行述评... 【目的】梳理机器学习算法在技术术语识别中的应用现状与前景。【文献范围】在WOS核心库和CNKI数据库中,以“technology term*recognition”、“技术术语识别”为检索词检索文献,并延伸阅读相关算法文献,共筛选62篇代表性文献进行述评。【方法】类比命名实体识别研究,归纳机器学习在技术术语识别中的应用和区别,从算法分类、一般流程、现存问题和下游应用4个方面进行梳理,并展望未来的应用前景。【结果】应用算法可分为单一的统计机器学习、单一深度学习和两者结合的混合算法,应用最广泛的是两者结合的混合算法,主流的模型代表是BiLSTM-CRF模型,迁移学习是未来重要的研究方向。【局限】深度学习快速发展,混合模型不断涌现,所归纳的算法模型仅为应用较为广泛的算法,并未逐一列出。【结论】现有方法仍然有诸多待优化研究的问题,应加强细粒度的实体识别、特征表示方法、评估方法和开源工具包等方面的研究。 展开更多
关键词 技术术语识别 机器学习 深度学习
原文传递
融合深度学习和链路预测的细粒度技术预测研究--以合成生物技术为例 被引量:2
2
作者 胡雅敏 吴晓燕 +2 位作者 廖兴滨 钱杨舸 陈方 《图书情报工作》 CSSCI 北大核心 2022年第24期92-103,共12页
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和... [目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。 展开更多
关键词 技术术语识别 深度学习 技术预测 合成生物
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部