期刊文献+

Web内容过滤中的数据预处理模块设计 被引量:1

下载PDF
导出
摘要 Web内容过滤是将模式识别和文本分类的方法应用于通过服务器或个人终端的数据流上,实现不良或无关信息过滤的行为模式。之后介绍了典型的数据预处理技术,指出大量无关或冗余数据以及中文字符集的多样性影响了过滤的效果。提出了改良的数据预处理模块,其中引入了主体文本提取和中文字符集自动识别转换等技术。结合实验和实际系统应用说明了改良模块的作用,并给出了进一步的努力方向。
出处 《通信学报》 EI CSCD 北大核心 2005年第B01期141-144,共4页 Journal on Communications
  • 相关文献

参考文献4

二级参考文献14

共引文献27

同被引文献2

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部