检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到8篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于网页布局相似度的Web论坛数据抽取被引量：9: 1; 作者王允李弼程林琛《中文信息学报》 CSCD 北大核心 2010年第2期68-75,共8页; Web论坛中蕴含着丰富的信息资源,充分利用这些信息资源依赖于论坛数据抽取技术。该文解决了从Web论坛抽取什么数据和如何抽取的问题,提出了一种基于网页布局相似度的Web论坛数据抽取方法,有效弥补了目前方法的自动化程度低,或准确率低... 展开更多; 关键词计算机应用中文信息处理 web论坛数据抽取相似度; 下载PDF 职称材料

面向Web论坛的网络信息获取技术及系统实现被引量：7: 2; 作者彭冬蔡皖东《计算机工程与科学》 CSCD 北大核心 2011年第1期157-160,共4页; 网络爬虫技术是网络信息获取的重要手段,面向Web论坛的信息获取则是网络爬虫技术所面临的新课题。在分析和研究面向Web论坛信息获取技术的基础上,本文设计和实现了一种用于Web论坛信息获取的主题网络爬虫系统,根据Web论坛信息组织结构,... 展开更多; 关键词网络爬虫 web论坛正文提取主题相关度; 下载PDF 职称材料

基于动态主题建模的Web论坛文档摘要被引量：8: 3; 作者任昭春马军陈竹敏《计算机研究与发展》 EI CSCD 北大核心 2012年第11期2359-2367,共9页; 针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖... 展开更多; 关键词 web论坛论坛文档摘要主题建模 Gibbs EM采样文档摘要; 下载PDF 职称材料

Web论坛数据源增量爬虫的研究被引量：5: 4; 作者蔡欣宝郭若飞 +1 位作者赵朋朋崔志明《计算机工程》 CAS CSCD 北大核心 2010年第9期285-287,共3页; 针对Web论坛站点结构复杂、内容更新快等特点,提出一种针对论坛的增量信息采集算法,使用站点地图重建技术及网页更新频繁度估计方法,根据站点地图选择有效的链接,按照网页更新频度确定网页的采集频度。实验结果表明,该方法是有效的。; 关键词 web论坛增量爬虫站点地图泊松模型; 下载PDF 职称材料

一种基于LDA的Web论坛低质量回帖检测方法被引量：4: 5; 作者韩晓晖马军 +1 位作者邵海敏薛冉《计算机研究与发展》 EI CSCD 北大核心 2012年第9期1937-1946,共10页; 为了过滤Web论坛中的低质量回帖,提出了一种新的基于LDA(latent Dirichlet allocation)的低质量回帖检测方法.不同于以往的方法,该方法在对回帖进行质量分类时使用了两类特征:语义特征和统计特征.提出并定义了垃圾/非重要(J/Ⅰ)主题比... 展开更多; 关键词 web论坛主题模型主题分布低质量回帖语义特征分类; 下载PDF 职称材料

基于Nutch的Web论坛分块采集系统被引量：1: 6; 作者程杜新傅魁《图书馆学研究》 CSSCI 2017年第7期56-60,共5页; 随着网络论坛用户的不断增长,论坛帖子数量急剧增加,论坛结构不断变化,研究适用于整个Web论坛信息采集解析的定向、自动、准确的采集方法是网络爬虫领域研究的难点。由论坛领域建模、论坛模板解析、论坛板块采集及论坛帖子采集四大模块... 展开更多; 关键词 NUTCH web论坛信息采集分块解析; 原文传递

WEB论坛完全使用手册: 7; 作者江雁《电脑技术——Hello-IT》 2000年第5期62-63,共2页; 关键词 web论坛 INTERNET网 BBS站浏览器; 下载PDF 职称材料

基于DOM树的通用论坛抽取技术被引量：1: 8; 作者邓垦胡勇《网络安全技术与应用》 2015年第1期20-20,共1页; web论坛中蕴含着海量的信息资源,抽取论坛数据意义重大,因此本文提出了一种基于DOM树的通用论坛抽取方法,通过统计页面中的div标签频率,抽取出分布于各楼层中的主题信息。该方法无需人工干预,能够实现完全的自动化抽取。实验结果证明,... 展开更多; 关键词 web论坛抽取 DOM 自动化; 原文传递

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部