-
题名一种基于层次结构的科技论文分类模型
被引量:2
- 1
-
-
作者
姚力群
吴高巍
-
机构
中国科学院自动化研究所复杂系统与智能科学重点实验室
中国科学院计算技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第6期18-22,共5页
-
基金
国家973基础研究规划(编号:G1998030500)资助项目
-
文摘
互联网和科学研究的高速发展导致可利用的科技文献的数量急剧增加,为了更有效地利用这些文献、特别是英文文献,迫切需要对它们进行机器自动分类。传统的文本分类算法没有考虑科技文本具有明显层次结构的这一特征,在进行分类时无法达到满意的效果。论文针对这一特征提出了一种基于层次结构的文本分类模型,并对环境类科技论文进行了分类研究。结果表明,该模型能够稳定并有效地提高分类的精度,提高的幅度在1%到24%之间;同时,该模型还具有良好的泛化能力。
-
关键词
科技论文
文本分类
层次结构
精度泛化
-
Keywords
technical literature,text categorization,hiberarchy,accuracy,generalization
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-