期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
一种基于XML的Web数据挖掘模型 被引量:33
1
作者 沈洁 薛贵荣 《系统工程理论与实践》 EI CSCD 北大核心 2002年第9期74-77,共4页
随着 HTML格式的出现 ,Internet得到了迅猛发展 ,面对着浩瀚如烟的数据 ,为了从中发现潜在的、有价值的信息 ,必须对 Web信息进行挖掘 ,但由于 HTML语言特点 ,使得 Web信息的组织结构性很差 ,对于进行 Web数据挖掘工作有很大的阻碍 ,XM... 随着 HTML格式的出现 ,Internet得到了迅猛发展 ,面对着浩瀚如烟的数据 ,为了从中发现潜在的、有价值的信息 ,必须对 Web信息进行挖掘 ,但由于 HTML语言特点 ,使得 Web信息的组织结构性很差 ,对于进行 Web数据挖掘工作有很大的阻碍 ,XML语言的出现从根本上解决了这个问题 ,XML语言具有良好的结构 ,层次性好 ,用其对 Web页面信息进行组织 ,有利于进行数据挖掘工作 .本文通过对XML语言的认识提出了一个基于 XML的 Web Miner模型 ,以帮助用户快速、有效的挖掘 展开更多
关键词 html XML 数据挖掘 数据仓库 WEB数据挖掘 数据库
原文传递
HTML浏览器的设计与分析 被引量:13
2
作者 刘彤 周工业 倪浆铭 《计算机工程与应用》 CSCD 北大核心 2001年第9期117-119,共3页
随着网络的广泛运用,特别是电视等视听类家电设备的网络化,使开发具有自主版权的浏览器变得日益重要。文章简要地分析HTML文档的一般特性,并给出了实现HTML浏览器的一个方案和核心模块重要数据结构的设计与实现。
关键词 超文本链接标记语言 数据结构 html 浏览器 信息交换 WEB
下载PDF
XML文件系统的设计 被引量:11
3
作者 周建洪 吴以群 +1 位作者 庞引明 楼荣生 《计算机工程与科学》 CSCD 2001年第2期72-75,共4页
本文提出了一种基于 XML的新型文件系统模型 ,实现了数据和数据表现的分离 ,使得各种文档和数据库相互兼容 。
关键词 XML html 文件系统 文档结构 设计 数据库
下载PDF
基于结构和链接扩展的中文网页分类研究 被引量:4
4
作者 刘菁菁 林鸿飞 《微电子学与计算机》 CSCD 北大核心 2007年第9期192-195,共4页
在研究Web结构特征的基础上,综合网页的结构和内容,抽取网页不同区域的内容信息,并赋予不同权重来表明其重要程度的不同。按网页间相互链接关系,扩展链接,将链接源网页所含有的类别信息传播给目标网页,从而提高分类效果。实验证明,该方... 在研究Web结构特征的基础上,综合网页的结构和内容,抽取网页不同区域的内容信息,并赋予不同权重来表明其重要程度的不同。按网页间相互链接关系,扩展链接,将链接源网页所含有的类别信息传播给目标网页,从而提高分类效果。实验证明,该方法比单独依赖网页内容信息的分类在效果上有所提高。 展开更多
关键词 分类 链接扩展 html标签 网络结构
下载PDF
HTML表格向XML的智能转换 被引量:3
5
作者 贾长云 程永上 《计算机工程》 CAS CSCD 北大核心 2009年第14期32-34,共3页
XML已经成为处理与管理信息的标准格式,而HTML表格被广泛应用于Web。为了充分利用与管理HTML表格信息,需要将HTML表格转换成XML。提出一种有效的处理方法,该方法包含2个部分,即表格识别与结构转换。表格识别通过检查格式、语法及语义的... XML已经成为处理与管理信息的标准格式,而HTML表格被广泛应用于Web。为了充分利用与管理HTML表格信息,需要将HTML表格转换成XML。提出一种有效的处理方法,该方法包含2个部分,即表格识别与结构转换。表格识别通过检查格式、语法及语义的特征将表格提取出来并分割成值域与属性域,使用预设的表格模板分析属性域与值域间的层次结构并将其转换成XML格式。通过300多个表格的实验表明,所提出的方法要优于传统方法,结果的准确率达86.7%。 展开更多
关键词 html表格 结构分析 规范化 信息提取 可扩展标记语言
下载PDF
新一代Web技术环境下面向用户体验的终端整体性能评测体系 被引量:3
6
作者 孙鑫 张成岩 严斌峰 《信息通信技术》 2014年第3期62-66,共5页
终端整体性能评测关注端到端的用户体验,涵盖了从软硬件环境、应用服务及承载网络等多个紧密联系的主要环节。另一方面,以往的评测标准缺乏量化依据和可度量、可比较、可拆解的指标体系,标准化程度较低。因此本文立足于客观评测方法论,... 终端整体性能评测关注端到端的用户体验,涵盖了从软硬件环境、应用服务及承载网络等多个紧密联系的主要环节。另一方面,以往的评测标准缺乏量化依据和可度量、可比较、可拆解的指标体系,标准化程度较低。因此本文立足于客观评测方法论,主要研究新一代Web技术的移动智能终端整机用户体验的评测体系,同时给出了评测体系中各指标相应的分解说明和主要评测方法。 展开更多
关键词 html5 终端整体性能评测 端到端用户体验 指标体系
下载PDF
一种提高Web信息检索精度的分段检索方法 被引量:2
7
作者 宋睿华 马少平 张敏 《广西师范大学学报(自然科学版)》 CAS 2003年第A01期151-155,共5页
在Web上存在一些长文档,它们包含着多个子主题,如果把这样的文档分成段,每个段的内容只围绕一个主题,将会提高检索质量.阐述了使用HTML结构中带有语义特征的标记来将多主题的文档分成段,在此基础上,对10G规模的Web数据实现了分段检索的... 在Web上存在一些长文档,它们包含着多个子主题,如果把这样的文档分成段,每个段的内容只围绕一个主题,将会提高检索质量.阐述了使用HTML结构中带有语义特征的标记来将多主题的文档分成段,在此基础上,对10G规模的Web数据实现了分段检索的方法,并通过使用TREC-9的查询做实验,比较了分段检索方法和传统的文档检索方法的检索质量.实验结果显示,在多主题文档集上分段检索方法比文档检索方法的11点平均准确率提高了大约9%,而在所有文档集上分段检索比文档检索提高了大约1.6%.分析发现,分段检索方法可以明显改善结果的排序,而且实际检索质量提高的幅度比现有的评价结果显示的更显著. 展开更多
关键词 信息检索 分段检索 Web数据 html结构
下载PDF
浅析网页标记语言HTML 被引量:2
8
作者 田玉娥 《山西科技》 2005年第4期54-55,共2页
文章介绍了网页标记语言HTML的概念、书写规则、文档结构及其在网页中的应用。
关键词 html 文档结构 书写规则
下载PDF
基于Leaflet的跨平台管线数据采集解决方法 被引量:3
9
作者 褚永彬 储奎 +2 位作者 舒珺 万善余 卞玉霞 《计算机应用与软件》 北大核心 2021年第12期7-10,29,共5页
城市快速发展促使地下管网规模不断扩大,对管网快速信息化提出了新要求。面向移动智能终端的普及和多样,基于Leaflet开源JavaScript地图库,结合HTML5技术设计并实现跨平台的管线数据采集系统。系统包含GPS位置获取模块、自动成图模块和... 城市快速发展促使地下管网规模不断扩大,对管网快速信息化提出了新要求。面向移动智能终端的普及和多样,基于Leaflet开源JavaScript地图库,结合HTML5技术设计并实现跨平台的管线数据采集系统。系统包含GPS位置获取模块、自动成图模块和拓扑编辑模块。该系统整体架构基于B/S模式,数据库采用MongoDB,具有良好的跨平台特性,实现了管线的快速绘制并自动建立网络连通关系。 展开更多
关键词 LEAFLET html5 燃气管网 数据采集 自动成图 拓扑结构
下载PDF
基于XML的网页结构化管理和数据检索 被引量:2
10
作者 黄晓 钟琴 《计算机仿真》 CSCD 2004年第4期83-86,共4页
近年来万维网 (WorldWideWeb)的广泛使用为人们访问大量的数据源提供了一种开放式的途径 ,而影响web数据访问的一个主要原因就是web页面之间以及web页面内部的信息都缺乏结构化。为了能更加有效的检索web数据 ,就有必要实现web页面结构... 近年来万维网 (WorldWideWeb)的广泛使用为人们访问大量的数据源提供了一种开放式的途径 ,而影响web数据访问的一个主要原因就是web页面之间以及web页面内部的信息都缺乏结构化。为了能更加有效的检索web数据 ,就有必要实现web页面结构化的管理。该文所提出的结构化的管理web页面分为两步 :①将超文本标记语言 (html)转换为扩展标记语言 (xml) ; 展开更多
关键词 XML 网页 结构化管理 数据检索 超文本标记语言 扩展标记语言 分级导航检索 web数据
下载PDF
基于HTML5与CreateJS的《数据结构与算法》演示平台 被引量:1
11
作者 钟迅科 《现代计算机》 2014年第20期61-65,共5页
《数据结构与算法》的教学过程中,需要使用各种演示工具以帮助学习者理解课程内容。现有的演示平台存在不少缺点,无法满足学习者新的需求。针对数据结构课程的特点进行分析,根据演示平台的基本要求,结合Java Script语言的特性,提出基于H... 《数据结构与算法》的教学过程中,需要使用各种演示工具以帮助学习者理解课程内容。现有的演示平台存在不少缺点,无法满足学习者新的需求。针对数据结构课程的特点进行分析,根据演示平台的基本要求,结合Java Script语言的特性,提出基于HTML5与Create JS技术构建新型演示平台的方法,为跨平台体验与动态开发等问题提供解决方案,总结实现步骤并提供运行示例。 展开更多
关键词 html5 数据结构 算法 演示
下载PDF
在Oracle HTML DB应用中使用虚拟私有数据库技术 被引量:1
12
作者 姚龙 陈闳中 《系统仿真技术》 2006年第4期244-248,共5页
建立仿真应用产品的过程中,若需要考虑安全因素,则应首先将其后台数据库级的安全因素作为重中之重来考虑。如果采用的是Oracle公司的数据库产品,则可以有两个可供选择的产品,用以控制数据库级的存取安全:FGA(Fine Grained Access)技术和... 建立仿真应用产品的过程中,若需要考虑安全因素,则应首先将其后台数据库级的安全因素作为重中之重来考虑。如果采用的是Oracle公司的数据库产品,则可以有两个可供选择的产品,用以控制数据库级的存取安全:FGA(Fine Grained Access)技术和VPD(Virtual Private Database)技术。本文对其中应用面比较广泛的VPD(虚拟私有数据库)技术在OracleHTMLDB方面的应用进行了实例研究。 展开更多
关键词 html DB ORACLE 虚拟私有数据库 VPD
下载PDF
基于HTML5的图结构演示系统
13
作者 陈俊建 蒋伟杰 +1 位作者 罗康 何勇 《湖南城市学院学报(自然科学版)》 CAS 2016年第5期45-46,共2页
在ASP.NET环境下,利用Javascript和XML技术实现了数据结构中的图结构演示系统。该系统能够让用户在网页上作出无向图、有向图、带权图,能够将所作的图以xml文件的方式保存在服务器端以便下次使用。
关键词 数据结构 图结构 html5 XML
下载PDF
网络数据智能提取
14
作者 王斌 王汉飞 《石油工业计算机应用》 2003年第2期36-38,5,共3页
HTML是当前编写网页使用的最多的语言,如何利用HTML这种标记性语言的特点,让计算机提供给用户快速的获取知识的途径成为许多计算机工作者的一大难题。文章介绍一个有效的从互联网上提取知识的方法供大家参考。这种方法可分成4个途径:①... HTML是当前编写网页使用的最多的语言,如何利用HTML这种标记性语言的特点,让计算机提供给用户快速的获取知识的途径成为许多计算机工作者的一大难题。文章介绍一个有效的从互联网上提取知识的方法供大家参考。这种方法可分成4个途径:①规范化基于HTML的网页脚本;②将网页结构和内容用一棵内容树表示;③比较相似网页的内容树生成提取规则;④将规则和下载程序结合得到最终的知识获取软件。 展开更多
关键词 网络数据 智能提取 树型化 知识获取 数据挖掘
下载PDF
Web数据库的设计与实现 被引量:4
15
作者 成四海 吴相林 《华中理工大学学报》 CSCD 北大核心 1999年第2期110-112,共3页
针对传统的Client/Server结构的局限性,分析了Browser/Server结构。
关键词 WEB数据库 html 数据库 WWW 服务器 设计 浏览器
下载PDF
基于HTML文档结构的向量空间模型的改进 被引量:10
16
作者 胡健 陆一鸣 马范援 《情报学报》 CSSCI 北大核心 2005年第4期433-437,共5页
根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能.实验结果表明,PFTF模型... 根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能.实验结果表明,PFTF模型对于这两个方面都有提高. 展开更多
关键词 html文档结构 信息检索 向量空间模型链接文本TREC 向量空间模型 html文档 文档结构 向量模型 分布特征 检索性能 标签
下载PDF
基于智能的网页信息提取系统的研究与设计 被引量:7
17
作者 刘亚东 彭舰 张达平 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期957-962,共6页
随着Internet的迅速发展,为人们提供了大量的信息,但这些信息都包含在网页中,为了使用这些信息数据,需要将数据从网页中提取出来.本文介绍了一种新的基于智能的网页信息提取系统EIES,通过对RoadRunner的改进和利用,在提取过程中不需人... 随着Internet的迅速发展,为人们提供了大量的信息,但这些信息都包含在网页中,为了使用这些信息数据,需要将数据从网页中提取出来.本文介绍了一种新的基于智能的网页信息提取系统EIES,通过对RoadRunner的改进和利用,在提取过程中不需人工干预,实现了信息提取的智能化.实验表明,该系统能够更准确、更有效地分类相似网页和提取网页信息. 展开更多
关键词 智能 WEB信息提取 RoadRunner html结构树
原文传递
URL模式与HTML结构相结合的平行网页获取方法 被引量:6
18
作者 刘奇 刘洋 孙茂松 《中文信息学报》 CSCD 北大核心 2013年第3期91-99,共9页
平行语料库是对机器翻译、跨语言信息检索等应用技术具有重要支撑作用的基础数据资源。虽然互联网上的平行网页数量巨大且持续增长,但由于平行网站的异构性和复杂性,如何快速自动获取高质量的平行网页进而构造平行语料库仍然是巨大的挑... 平行语料库是对机器翻译、跨语言信息检索等应用技术具有重要支撑作用的基础数据资源。虽然互联网上的平行网页数量巨大且持续增长,但由于平行网站的异构性和复杂性,如何快速自动获取高质量的平行网页进而构造平行语料库仍然是巨大的挑战。该文提出了一种URL模式与HTML结构相结合的平行网页获取方法,首先利用HTML结构实现平行网页的递归访问,其次使用URL模式优化遍历平行网站的拓扑顺序,从而实现高效准确的平行网页获取。在联合国与香港政府①两个平行网站上的实验表明,该方法相对传统获取方法在获取时间上减少50%以上,准确率提高15%,并显著提高了机器翻译的质量(BLEU值分别提高1.6和0.7个百分点)。 展开更多
关键词 平行网页获取 平行语料库 URL模式 html结构
下载PDF
基于HTML5的数据结构算法演示系统的设计与实现 被引量:4
19
作者 傅金枝 黄世梅 《实验室科学》 2015年第2期72-75,共4页
算法的动态演示对学习数据结构算法起着重要的作用,传统的web算法演示系统依赖于FLASH插件,HTML5可以在网页上直接绘图,为算法的动态演示提供了一种新方法,研究了HTML5实现动画演示的方法,设计了数据结构算法动态演示系统的总体框架,并... 算法的动态演示对学习数据结构算法起着重要的作用,传统的web算法演示系统依赖于FLASH插件,HTML5可以在网页上直接绘图,为算法的动态演示提供了一种新方法,研究了HTML5实现动画演示的方法,设计了数据结构算法动态演示系统的总体框架,并对其中的关键技术及其实现方法进行详细的阐述,最后给出了一个约瑟夫环算法的应用实例。该系统具有操作简单、交互方式灵活,动画演示直观形象等优点,在实践中取得了良好的教学效果。 展开更多
关键词 html5 数据结构算法 JAVA SCRIPT 动画演示
下载PDF
基于HTML特征与层次聚类的Web查询接口发现 被引量:4
20
作者 魏佳欣 叶飞跃 《计算机工程》 CAS CSCD 北大核心 2016年第2期56-61,共6页
针对各网站Web查询接口(WQI)因结构异构而难以被自动发现的问题,提出一种基于超级文本标记语言(HTML)特征和层次聚类的Web查询接口发现方法。利用HTML控件元素之间的层级结构、依附关系和HTML交互控件的终端特性,通过前序和后序遍历相... 针对各网站Web查询接口(WQI)因结构异构而难以被自动发现的问题,提出一种基于超级文本标记语言(HTML)特征和层次聚类的Web查询接口发现方法。利用HTML控件元素之间的层级结构、依附关系和HTML交互控件的终端特性,通过前序和后序遍历相结合的方式解析页面,建立合适的页面树状模型。按照查询区域交互密度的局部集中性定位并初始化聚类集合。将聚类集合中各潜在接口区域结构距离的相似性进行层次聚类,并对所得潜在接口中的交互控件选择合适的文本节点进行语义标注,得出完整WQI区域,利用接口中的文本特征过滤非查询接口。实验结果表明,该方法克服了传统方法对<form>标签的过度依赖,具有较强的通用性,接口识别率与准确率分别达到90.7%和92%。 展开更多
关键词 Web查询接口 超级文本标记语言 层次聚类 结构距离 交互密度 文本过滤器
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部