期刊文献+

基于本体语义的简单向量距离分类方法 被引量:2

Semantic Simple Vector Distance Classification Based on Ontology
下载PDF
导出
摘要 针对传统简单距离分类方法的特征选择未考虑到不同抽象层次上的词汇语义差异,提出了一种基于本体语义的简单向量距离分类方法,在本体库的支持下有效地将语言学知识融合到文本向量空间的表示中,进一步挖掘出特征项概念间的深层语义联系,用得到的语义特征向量作为最终的文本特征向量。同时定义了基于领域本体计算不同抽象层上的语义相似度,并将其应用到简单向量距离分类算法中。在数据集CWT20G上的实验表明:基于本体语义的简单距离分类算法对同义词、多义词、上下位词区分能力更强;并且分类准确率随着语义分析的深入逐步提高。 The feature selection of traditional simple vector distance ignores the semantic difference of vocabulary on different abstract levels.Aimed at this problem,this paper proposed semantic simple vector distance classification based on ontology.It efficiently incorporates linguistic knowledge into text vector space representation with the support of ontology and further discover the deep-seated semantic relations among concepts of feature vector.Then those semantic feature vectors are used as final text feature vectors.At the same time,this approach defines how to calculate the semantic similarity of different abstract levels based on domain ontologies,and then the semantic similarity is used to improve the traditional simple vector distance method.Experiments on corpus CWT20G show that ontology semantic simple vector distance algorithm distinguishs better for synonym,polysemy and hyponymy.The accuracy rate of classification is gradually improved along with more and more in-depth semantic analysis.
出处 《北京石油化工学院学报》 2007年第3期13-17,共5页 Journal of Beijing Institute of Petrochemical Technology
基金 北京市教育委员会基金资助项目 项目号:KM200610017007
关键词 本体 语义距离 词汇语义相似度 简单向量距离 分类 ontology semantic distance similarity of words simple vector
  • 相关文献

参考文献6

二级参考文献36

  • 1吴健,蔡铭,唐敏,董金祥.网络制造中Web Service的服务质量模糊排序方法[J].计算机辅助设计与图形学学报,2005,17(7):1593-1599. 被引量:9
  • 2黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43. 被引量:1
  • 3鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36. 被引量:1
  • 4卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000.. 被引量:1
  • 5黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页 被引量:1
  • 6鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页 被引量:1
  • 7卜东波,博士学位论文,2000年 被引量:1
  • 8Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页 被引量:1
  • 9Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页 被引量:1
  • 10Li BL, Yu SW, Qin Lu. An improved k-nearest neighbor algorithm for text categorization. In: Sun MS, Yao TS, Yuan CF, eds. Proc.of the 20th Int'l Conf. on Computer Processing of Oriental Languages. Beijing: Tsinghua University Press, 2003. 被引量:1

共引文献536

同被引文献12

引证文献2

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部