-
题名基于多重特征选择和多分类器融合的文本层次分类研究
被引量:2
- 1
-
-
作者
贾美英
杨炳儒
郑德权
陈庆轩
-
机构
北京科技大学信息工程学院
北京图形研究所
哈尔滨工业大学教育部-微软语言语音重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第12期4467-4470,共4页
-
基金
国家自然科学基金资助项目(60736044)
-
文摘
针对大量电子文档需要准确地进行多层次自动分类管理的现实需求,提出基于多重特征选择和多分类器融合技术的层次分类方法。通过引入可信度函数对单分类器效果进行评价,适时采用辅助分类器对较难分类的文档进行分类投票判决。实验结果表明,相对于单分类器,该方法无论在平面分类和层次分类语料上都获得了更好的分类精度,且具有较好的时间复杂性,有很好的实际应用前景。
-
关键词
文本自动分类
文本层次分类
多重特征选择
可信度函数
多分类器融合
-
Keywords
text categorization
hierarchical text categorization
multiple feature selection
reliability function
multiple classifier fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名改进组合算法在中文短文本分类中的应用
- 2
-
-
作者
房满林
-
机构
五邑大学信息工程学院
-
出处
《现代工业经济和信息化》
2017年第3期95-97,99,共4页
-
文摘
采用最大熵模型与情感分类词典组合的方式对这种短文本用户声音来生成观点。源声的领域通过最大熵模型识别,评价的好坏通过情感模型识别,最后通过领域和评价的组合来得出最终的分类。值得注意的是分类对象具有特征多和类别多等特点,对于源声有多个观点的,可以将源声以分隔符进行拆分,短文本通过分隔符由内向外的文本层次嵌套的分类方法来进行识别源声观点,防止错误输出。结果表明针对中文短文本观点分类,分类器融合是一种高效的分类组合算法。
-
关键词
文本层次分类
最大熵模型
情感词典
-
Keywords
text hierarchical classification
maximum entropy model
emotional dictionary
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-