检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到5篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于DOM树结构的Blog网页自动识别被引量：8: 1; 作者张程陈自郁 +1 位作者古平杨瑞龙《计算机应用研究》 CSCD 北大核心 2008年第5期1489-1491,共3页; 针对当前Internet中大量出现的博客网页,通过分析博客网页自身的结构特点和技术特征,结合网页的DOM节点特性,提出了基于DOM树分析和模式匹配的博客网页自动识别算法,并通过实验对本算法进行了验证,指出需进一步完善的研究内容和方向。; 关键词博客网页文档对象模型结构分析特征发现; 下载PDF 职称材料

含有位置坐标树的Web页面分析和内容提取框架被引量：8: 2; 作者封化民刘飚 +2 位作者刘艳敏方勇宋国森《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2005年第S1期1767-1771,共5页; 随着In ternet的发展,W eb上信息呈爆炸式增长趋势,呈现方式也愈发多种多样,这就给信息检索、信息提取等计算机处理带来了巨大困难。针对HTM L的半结构化特征和DOM缺乏位置信息的不足,该文提出了一种新型的W eb页面分析和内容提取框架,... 展开更多; 关键词坐标树页面结构分析内容抽取 DOM 启发式规则; 原文传递

Web信息抽取技术在统一检索系统中的应用研究被引量：7: 3; 作者王权施韶亭《计算机应用与软件》 CSCD 2010年第10期120-122,137,共4页; 结合统一检索系统的信息抽取特点,应用基于HTML结构的信息抽取方法,介绍人工找到切割关键信息块的标记和位置的方法,最后提出基于子树广度的Web信息抽取方法,并给出了抽取规则的实现方案及实例。实验证明,该方法在基于Web过程模拟的统... 展开更多; 关键词 WEB信息抽取统一检索页面结构分析关键信息块子树广度; 下载PDF 职称材料

自动票据识别系统被引量：6: 4; 作者王林水潘武模 +3 位作者史广顺薛峰万宏武张辉《计算机工程》 EI CAS CSCD 北大核心 2005年第9期163-166,共4页; 提出了基于连通体的区域聚类方法来解决版面印刷字符区域的准确提取问题,提出了基于自然语言理解的错误纠正和信息分类算法解决字符识别率较低和信息分类困难的问题。同时对系统的各个模块进行相应的分析,给出了一套完整的实现方案。对... 展开更多; 关键词票据识别版面分析信息分类; 下载PDF 职称材料

基于非内容信息的网络关键资源有效定位被引量：2: 5; 作者刘奕群张敏马少平《智能系统学报》 2007年第1期45-52,共8页; 网络信息的爆炸式增长,使得当前任何搜索引擎都只可能索引到Web上一小部分数据,而其中又充斥着大量的低质量信息.如何在用户查询无关的条件下找到Web上高质量的关键资源,是Web信息检索面临的挑战.基于大规模网页统计的方法发现,多种网... 展开更多; 关键词网络信息检索关键资源页面主题过滤机器学习; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部