摘要
采用本体(Ontology)为向量空间模型提供更为丰富、详细的概念空间,在本体的支持下,文档中的术语不再被孤立地看成关键词,而是彼此间有了一定的语义联系。以已获得丰富而详细的本体为前提,考虑当本体空间很大时,解决向量空间的高维数给计算带来复杂性与难度这一问题,提出基于HCA(Hierarchical Clustering Algorithm)的向量空间压缩算法。
In this paper,ontology based VSM is used to provide detailed and dependable concept space.With the support of ontology,two concepts are not standalone terms but meaning related.In this paper,the detailed and dependable ontology is the presupposition and HCA(Hierarchical Clustering Algorithm) is proposed to deal with computation complex and difficulty because of high dimensions of the vector space.
出处
《计算机工程与应用》
CSCD
北大核心
2007年第24期12-14,共3页
Computer Engineering and Applications
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant)
英国皇家学会国际合作项目(No(.2006)国科金外资助字第60611130271)
关键词
本体向量空间模型分层聚类算法语义距离
ontology
Vector Space Model(VSM)
Hierarchical Clustering Algorithm(HCA)
semantic distance