-
题名基于改进隐马尔可夫模型的文本分类研究
被引量:3
- 1
-
-
作者
李开荣
孔照昆
陈桂香
朱俊武
-
机构
扬州大学信息工程学院
扬州大学水利科学与工程学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2012年第11期161-165,共5页
-
基金
国家自然科学基金项目(61170201)
-
文摘
将一种改进的隐马尔可夫模型(HMM)应用于文本分类中,在考虑其前向依赖的同时,需考虑状态的后向依赖性.将当前观测值和和当前状态对其后一状态的依赖性加入模型的学习,这样的改进模型能有效提高文本信息抽取准确率.在文本分类过程研究中,首先对训练样本进行文本预处理,对HMM分类器模型进行参数学习,建立HMM分类器后用测试集进行测试并做出性能评价.在性能评价中用改进的评测指标,可针对不同数据集做出准确评价,以及可对比不同分类工作在同一数据集上的性能,大大提高评价质量.
-
关键词
隐马尔可夫模型
文本分类
期望交叉熵(ece)
χ2统计
TF-IDF方法
-
Keywords
hidden markov models
text categorization
excepted cross entropy(ece)
χ2statistic
TF-IDF method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-