摘要
在大数据时代下,每天会产生海量的文本信息,为实现对海量文本信息的高效利用,就必须运用文本分类技术剔除信息中的冗余信息,并对文本进行自动分类,在分类文本中提取出具有使用价值的信息,为信息检索与数据挖掘技术的应用打下基础。在信息数据爆发式增长的环境下,文本分类技术已经成为数据挖掘、信息检索以及提高信息资源利用价值的重要技术。本文从概述文本分类技术入手,将随机森林算法作为重点,研究了基于机械学习的文本分类技术,期望对提高文本分类性能有所帮助。
出处
《科技创新导报》
2020年第8期90-90,92,共2页
Science and Technology Innovation Herald