-
题名基于句法分析与词向量的领域新词发现方法
被引量:14
- 1
-
-
作者
赵志滨
石玉鑫
李斌阳
-
机构
东北大学计算机科学与工程学院
国际关系学院信息科技学院
-
出处
《计算机科学》
CSCD
北大核心
2019年第6期29-34,共6页
-
基金
国家重点研发计划项目(2018YFB1004700)
国家自然科学基金项目(61472070)
航天专业部新技术研究高校合作项目(SKX182010023)资助
-
文摘
很多已经存在的词汇和词组可能会被运用于它们之前从未被运用过的领域文本中,这样的词汇或词组被称为领域新词。领域新词的发现可以为该领域的研究人员提供最新的领域发展动态,帮助其分析该领域的最新舆情,因此具有非常重要的意义。针对领域新词发现这一问题,文中提出了一种基于依存句法分析与词向量的领域新词发现方法。首先,提出了句法词典的概念,并基于依存句法分析,结合TF-IDF值的计算,提出了构建领域句法词典的方法;然后,使用领域句法词典,结合词向量技术,完成了领域新词发现方法的设计;最后,使用来自于护肤品论坛的真实文本数据集对所提方法进行了正确性验证。实验结果表明,构建的句法词典的质量较高,所提方法在进行领域新词发现时具有良好的性能。
-
关键词
句法分析
词向量
领域新词发现
句法词典
-
Keywords
syntactic analysis
Term vector
Newly-emerging domain words
syntactic dictionary
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名互联网环境下的英文同义术语自动发现研究与系统实现
被引量:4
- 2
-
-
作者
刘伟
黄小江
万小军
王星
-
机构
中国科学技术信息研究所
北京大学计算机科学技术研究所
-
出处
《图书情报工作》
CSSCI
北大核心
2012年第22期26-31,共6页
-
基金
国家社会科学基金资助项目“基于知识组织的术语服务研究”(项目编号:11CTQ018)
国家高技术研究发展计划(863计划)“以科技文献服务为主的搜索引擎研制”(项目编号:2011AA01A206)子课题“资源整合及知识组织技术研究”研究成果之一
-
文摘
以英文同义术语为例,提出三种有效的自动获取互联网术语资源的技术手段,包括语法模式的自学习,在线同义词典的抽取,静态同义术语分类的爬取。在此基础上,设计并实现互联网同义术语检索原型系统(WebSynonym Searcher)。实验测试表明,从互联网中自动获取同义术语是一种非常有前景的途径。
-
关键词
同义术语
互联网
语法模式
在线词典
系统实现
-
Keywords
synonym term Web syntactical pattern online dictionary system implementation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-