-
题名综合成分句法分析的技术名称识别
- 1
-
-
作者
朱俊杰
余丽
李圣文
周长征
-
机构
中国地质大学(武汉)计算机学院
中国工程科技前沿交叉战略研究中心(北京理工大学)
十堰巨能电力设计有限公司
-
出处
《计算机应用》
CSCD
北大核心
2024年第4期1072-1079,共8页
-
基金
国家自然科学基金资助项目(42071382)。
-
文摘
技术名称是科技领域中用于准确交流信息的术语,自动识别技术名称可以帮助专家和大众发现、认知、应用新技术,具有重要价值;而基于无监督的方法在识别技术名称时存在规则复杂、适应性差等问题。为了提升从文本中识别技术名称的能力,提出一种综合成分句法的技术名称识别方法。首先,通过成分句法分析构造句法结构树;其次,从自上而下和自下而上这两个角度抽取候选技术名称;最后,融合统计频次和语义信息,以选取最优技术名称。此外,构建一个技术术语数据集以验证所提方法的有效性。在该数据集上的实验结果表明,相较于基于依存关系的方法,所提基于自下而上的方法的F1值提高了4.55个百分点;同时在3D打印领域进行了案例分析,发现所提方法识别的技术名称与该名称对应领域的发展契合,可用于回溯技术的发展历程和描绘技术的演化路径,为理解、发现、探索领域未来技术提供参考。
-
关键词
技术名称识别
成分句法分析
无监督方法
成分句法树
术语抽取
-
Keywords
technology term recognition
constituency parsing
unsupervised method
constituency parsing tree
term extraction
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-