期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于单类别文档分类的主题爬虫 被引量:3
1
作者 方加沛 黄战 《计算机工程与应用》 CSCD 北大核心 2010年第16期63-66,共4页
主题爬虫设计中关于主题的确立可以采用手工设置关键词集的方法也可以采用构造分类器的方法。前者易于实现,但是依赖于专家的经验,具有关键词缺漏和权值量化不精确的缺点;而后者的主要缺点在于难以获取具有代表性的反例训练样本。针对... 主题爬虫设计中关于主题的确立可以采用手工设置关键词集的方法也可以采用构造分类器的方法。前者易于实现,但是依赖于专家的经验,具有关键词缺漏和权值量化不精确的缺点;而后者的主要缺点在于难以获取具有代表性的反例训练样本。针对上述情况,提出了一种基于单类别文档分类的主题爬虫,同时还将分类作用于超链接的anchor text。实验结果充分证明了该主题爬虫的可行性。 展开更多
关键词 搜索引擎 主题爬虫 单类别文档分类 信息提取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部