期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于集成学习的标题分类算法研究 被引量:10
1
作者 高元 刘柏嵩 《计算机应用研究》 CSCD 北大核心 2017年第4期1004-1007,共4页
标题分类是对一个标题性语句进行分类,通常这个标题是不超过20个字的短文本,内容精炼且概括性强。针对标题文本的特征稀疏性和含义不确定性,提出了一种融合随机森林与贝叶斯多项式的标题分类算法。该算法将贝叶斯多项式模型引入到随机... 标题分类是对一个标题性语句进行分类,通常这个标题是不超过20个字的短文本,内容精炼且概括性强。针对标题文本的特征稀疏性和含义不确定性,提出了一种融合随机森林与贝叶斯多项式的标题分类算法。该算法将贝叶斯多项式模型引入到随机森林底层分类器构建过程中,同时利用随机森林附带的OOB数据提出了一种基于二维权重分布的投票机制。最后在图书馆真实书目数据上进行实验,针对分类性能与当前基于LDA主题扩展的SVM算法进行对比,实验结果表明在一定条件下,该方法性能稳定、表现较佳。 展开更多
关键词 自然语言处理 标题分类 集成学习 改进随机森林 oob维权分布
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部