期刊文献+
共找到18,434篇文章
< 1 2 250 >
每页显示 20 50 100
基于语义理解的文本相似度算法 被引量:79
1
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第2期291-297,共7页
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包... 相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高. 展开更多
关键词 语义理解 相似度算法 相似度计算 计算方法 文本相似度 语义相似度 信息检索 实例验证 计算公式 准确性 文档 知网
下载PDF
从WEB文档中构造半结构化信息的抽取器 被引量:47
2
作者 黄豫清 戚广志 张福炎 《软件学报》 EI CSCD 北大核心 2000年第1期73-78,共6页
为了对 WEB上不规则的、动态的信息按照数据库的方式集成和查询 ,采用对象交换模型 (object ex-change model,简称 OEM)建立了 WEB信息模型 .为了将页面中各个部分表示为对应的 OEM对象 ,设计了半结构化信息的抽取算法 ,并给出测试结果 ... 为了对 WEB上不规则的、动态的信息按照数据库的方式集成和查询 ,采用对象交换模型 (object ex-change model,简称 OEM)建立了 WEB信息模型 .为了将页面中各个部分表示为对应的 OEM对象 ,设计了半结构化信息的抽取算法 ,并给出测试结果 .该方法可以抽取结构化和半结构化的信息 ,比现有的抽取方法通用性更强 . 展开更多
关键词 启发式规则 信息抽取器 WEB 文档
下载PDF
XML文档到关系数据库的直接转换 被引量:35
3
作者 方翔 《计算机工程》 CAS CSCD 北大核心 2001年第11期65-66,122,共3页
介绍了一种利用DTD文档直接实现XML文档向关系数据库转换的方法。此方法用较为简洁的结构保存了XML文档的动态信息和相关信息。
关键词 XML 关系数据库 文档 数据转换 面向对象
下载PDF
XML的数据库存储技术研究 被引量:31
4
作者 李由 黄凯歌 汤大权 《计算机应用研究》 CSCD 北大核心 2002年第4期60-62,共3页
针对XML的特点 ,探讨了XML的存取方法和研究现状 ,重点研究了XML在关系数据库中的存储方法 。
关键词 XML 数据库 存储技术 文档
下载PDF
基于Web-Log Mining的Web文档聚类 被引量:29
5
作者 苏中 马少平 +1 位作者 杨强 张宏江 《软件学报》 EI CSCD 北大核心 2002年第1期99-104,共6页
速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(re... 速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(recursive density based clustering algorithm,简称RDBC),此算法可以智能地、动态地修改其密度参数.RDBC是基于DBSCAN的一种改进算法,其运算复杂度和DBSCAN相同.通过在Web文档上的聚类实验,结果表明,RDBC不但保留了DBSCAN高速度的优点,而且聚类效果大大优于DBSCAN. 展开更多
关键词 数据库 聚类 数据挖掘 WEB 文档 Web-LogMining
下载PDF
办公自动化系统的系统分析 被引量:34
6
作者 陈江东 《计算机系统应用》 1998年第10期12-14,共3页
本文分析了在办公自动化系统分析必然会涉及的两个问题:文档和人员这两大元素的静态和动态属性及其相互之间的关系;用简单的图形将复杂的工作流拆分成若干种标准的流程组件,及讨论这些组件的组合规则。为任何一个完整的办公自动化系... 本文分析了在办公自动化系统分析必然会涉及的两个问题:文档和人员这两大元素的静态和动态属性及其相互之间的关系;用简单的图形将复杂的工作流拆分成若干种标准的流程组件,及讨论这些组件的组合规则。为任何一个完整的办公自动化系统提供一种通用的分析设计思想。 展开更多
关键词 文档 人员 工作流 办公自动化系统 系统分析
下载PDF
在J2EE体系结构上构建基于XML的数据交换系统 被引量:19
7
作者 宋善德 何栋 梅雪莲 《小型微型计算机系统》 CSCD 北大核心 2003年第4期778-780,共3页
本文介绍了一种在J2EE体系结构上实现的基于XML的数据交换系统.系统实现了一个统一数据交换接口,各种类型的外部数据结构(包括HTML、WML)都可以通过格式转换而变为系统可以识别处理的XML文档.同时,系统自定义了一套XML标签来标记各个XM... 本文介绍了一种在J2EE体系结构上实现的基于XML的数据交换系统.系统实现了一个统一数据交换接口,各种类型的外部数据结构(包括HTML、WML)都可以通过格式转换而变为系统可以识别处理的XML文档.同时,系统自定义了一套XML标签来标记各个XML文档,根据这些标签的内容来对XML文档进行处理.最后,本文还描述了系统中XML文档与传统关系型数据库的数据交换与格式转换,并指出了一些有待解决的问题. 展开更多
关键词 J2EE 体系结构 XML 数据交换系统 关系数据库 文档
下载PDF
影响软件项目管理关键因素的探讨 被引量:26
8
作者 窦燕 《燕山大学学报》 CAS 2004年第4期369-372,共4页
介绍了软件项目的内容,分析了软件项目的特点,介绍了项目管理的几个方面,指出将项目管理引入软件项目管理的必要性。结合多年参与软件项目的经验,探讨了影响软件项目管理的需求、计划、流程、沟通、文档等几个关键因素。
关键词 软件项目管理 文档 流程 关键因素 目的 需求 影响 沟通 计划 必要性
下载PDF
基于MVC的软件界面体系结构研究与实现 被引量:24
9
作者 王映辉 王英杰 +1 位作者 王彦君 樊宏斌 《计算机应用研究》 CSCD 北大核心 2004年第9期188-190,193,共4页
软件体系结构研究是目前软件工程领域研究的新一轮热潮,是对软件的更高层次抽象。在分析MVC(Model/View/Controller)模式机理的基础上,给出了基于MVC的软件界面体系结构及其工作机理。软件界面体系结构带来了软件设计的灵活性和高度重... 软件体系结构研究是目前软件工程领域研究的新一轮热潮,是对软件的更高层次抽象。在分析MVC(Model/View/Controller)模式机理的基础上,给出了基于MVC的软件界面体系结构及其工作机理。软件界面体系结构带来了软件设计的灵活性和高度重用性。最后,以软件界面体系结构为指导,分析了MFC(MicrosoftFunda mentClass)的文档视图结构,并给出了软件界面体系结构的具体设计和实现。 展开更多
关键词 软件体系结构 模型/视图/控制器模式 文档 视图
下载PDF
医院信息系统实施中的几个问题 被引量:34
10
作者 徐昀 《中华医院管理杂志》 北大核心 2005年第4期247-250,共4页
医院在信息系统实施过程中常常面临以下困难没有合理的实施流程可参考,没有标准的数据定义格式可借鉴,没有规范的文档记录可辅助等。建议以“总体规划、分步实施”为医院信息系统实施原则。给出了医院信息系统实施流程。同时论述了在医... 医院在信息系统实施过程中常常面临以下困难没有合理的实施流程可参考,没有标准的数据定义格式可借鉴,没有规范的文档记录可辅助等。建议以“总体规划、分步实施”为医院信息系统实施原则。给出了医院信息系统实施流程。同时论述了在医院信息系统实施过程中规范系统数据和完善过程文档等问题,以期对其他医院和系统供应商的医院信息系统顺利上线有所帮助。 展开更多
关键词 医院信息系统 实施流程 实施原则 分步实施 供应商 数据 文档
原文传递
面向输变电工程数据存储管理的分布式数据存储架构 被引量:32
11
作者 韩文军 余春生 《沈阳工业大学学报》 EI CAS 北大核心 2019年第4期366-371,共6页
针对输变电工程数据的多源、异构、迭代更新和集成应用导致需要巨大存储空间且不利于数据挖掘分析的问题,提出了一种面向输变电工程数据存储管理的分布式数据存储架构.该架构基于元数据模型对输变电工程的工程地理信息、三维设计模型和... 针对输变电工程数据的多源、异构、迭代更新和集成应用导致需要巨大存储空间且不利于数据挖掘分析的问题,提出了一种面向输变电工程数据存储管理的分布式数据存储架构.该架构基于元数据模型对输变电工程的工程地理信息、三维设计模型和文档资料三类数据进行细化,并根据不同数据存储模式的不同,设计了一种分布式存储架构分别处理各种数据.系统实现与仿真实验结果表明,所提出的分布式存储架构在保证存储效率及数据完整性的同时,也能保证数据的安全. 展开更多
关键词 输变电 工程 分布式 存储 三维设计模型 文档 架构 异构
下载PDF
信息检索的概率模型 被引量:14
12
作者 邢永康 马少平 《计算机科学》 CSCD 北大核心 2003年第8期13-17,共5页
The study of mathematical models on information retrieval is an important area in the Information Retrievalcommunity. Because of the uncertainty characteristic of IR,the probability model based on statistical probabil... The study of mathematical models on information retrieval is an important area in the Information Retrievalcommunity. Because of the uncertainty characteristic of IR,the probability model based on statistical probability is apromising model from recent to future. Those models can be classified into classical models and probability networkmodels. Several famous models are introduced and their shortcomings are pointed out in this paper. We also clarifythe relationship of these models and introduce a new models based on statistical language model curtly. 展开更多
关键词 信息检索 概率模型 多媒体信息 文档 数学模型
下载PDF
正向最大匹配法在中文分词技术中的应用 被引量:18
13
作者 胡锡衡 《鞍山师范学院学报》 2008年第2期42-45,共4页
分词是中文信息处理的一部分,分词本身并不是目的,而是后续处理过程的必要阶段,是中文信息处理的基础技术.正向最大匹配法是一种基于词典的分词方法,它能够有效地实现对中文文档的扫描,将文档分解成为词的集合.从而实现中文文本结构化... 分词是中文信息处理的一部分,分词本身并不是目的,而是后续处理过程的必要阶段,是中文信息处理的基础技术.正向最大匹配法是一种基于词典的分词方法,它能够有效地实现对中文文档的扫描,将文档分解成为词的集合.从而实现中文文本结构化的表示. 展开更多
关键词 信息处理 分词 文档 正向最大匹配 文本结构化
下载PDF
XML技术在软件测试自动化中的应用 被引量:15
14
作者 朱经纬 《计算机工程》 EI CAS CSCD 北大核心 2005年第2期94-95,132,共3页
将XML技术应用到软件测试自动化技术中,提出了测试脚本的XMLSchema数据模型,给出了如何利用XSLT从该模型得到测试驱动程序、测试报告等文档的方法。
关键词 软件测试自动化 XML技术 测试脚本 文档 XSLT 驱动程序 数据模型 术中 方法 利用
下载PDF
PDF文档与Web数据库接口技术初探 被引量:17
15
作者 林天 《计算机应用》 CSCD 2000年第5期21-23,共3页
本文详细讨论了PDF文档表单数据存贮文件FDF的基本组成结构 ,并通过实例给出结合ASP技术实现将浏览器端PDF表单数据提交给Web数据库、从Web数据库读取记录动态生成PDF文档的过程。
关键词 PDF WEB 电子出版 文档 数据库 接口
下载PDF
可定制办公自动化系统的设计与实现 被引量:15
16
作者 王莉 刘厚泉 +1 位作者 刘迎春 陆亚萍 《计算机工程与设计》 CSCD 北大核心 2006年第11期2085-2087,2096,共4页
通过对办公自动化系统现状的分析,提出了一种基于模板的可定制办公自动化系统的结构。强调了文档在流程处理中的重要性,并从界面显示、操作流程和数据存储3个层次构建系统架构。同时还介绍了通用办公集成环境以及系统的动态执行过程,并... 通过对办公自动化系统现状的分析,提出了一种基于模板的可定制办公自动化系统的结构。强调了文档在流程处理中的重要性,并从界面显示、操作流程和数据存储3个层次构建系统架构。同时还介绍了通用办公集成环境以及系统的动态执行过程,并举例说明系统的使用过程,最后总结出系统各项技术特点以及在安全方面所采取的措施,充分显示了系统在实际应用中的使用价值。 展开更多
关键词 办公自动化 可定制 模板 文档 流程定制
下载PDF
飞机探测云物理数据集的建立和应用 被引量:15
17
作者 姚展予 濮江平 +3 位作者 刘卫国 陈跃 汪晓滨 王柏忠 《应用气象学报》 CSCD 北大核心 2004年第B12期68-74,共7页
通过收集大量历史和现今的飞机探测云物理资料,对所获取的资料进行必要的质量控制和检验,并进行统一整理、加工、规范和信息化处理,形成了具有规范格式和详细说明文档的"飞机探测云物理数据集"产品。该数据集产品具有分类查... 通过收集大量历史和现今的飞机探测云物理资料,对所获取的资料进行必要的质量控制和检验,并进行统一整理、加工、规范和信息化处理,形成了具有规范格式和详细说明文档的"飞机探测云物理数据集"产品。该数据集产品具有分类查询、数据导出、格式说明等功能.可以按照时间属性、地理空间属性、数据种类等不同属性对该数据集中的各类数据进行多元化使用。借助于"气象科研数据共享平台","飞机探测云物理数据集"产品已在一定范围内得到广泛应用。在此应用基础上,包括国家科技攻关项目在内的许多科研或业务项目已经取得了众多可喜的成果。 展开更多
关键词 云物理 探测 气象科研 数据集 地理空间 信息化处理 资料 文档 数据导出 属性
下载PDF
一种基于后缀数组的无词典分词方法 被引量:14
18
作者 张长利 赫枫龄 左万利 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2004年第4期548-553,共6页
提出一种基于后缀数组的无词典分词算法.该算法通过后缀数组和利用散列表获得汉字的结合模式,通过置信度筛选词.实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词.适用于对词条频度敏感、对计算速度要... 提出一种基于后缀数组的无词典分词算法.该算法通过后缀数组和利用散列表获得汉字的结合模式,通过置信度筛选词.实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词.适用于对词条频度敏感、对计算速度要求高的中文信息处理. 展开更多
关键词 无词典分词 数组 文档 散列表 计算速度 算法 中文信息处理 法能 频度 实验
下载PDF
基于Lucene的全文检索系统的设计与实现 被引量:14
19
作者 王莉云 王华 +1 位作者 陈刚 姚乃明 《计算机工程与设计》 CSCD 北大核心 2007年第24期5959-5961,共3页
Lucene是一个全文索引引擎工具包,具有访问索引效率高、支持多用户访问、跨平台等优点。把Lucene的索引与全文检索数据库的索引进行比较来介绍Lucene的索引原理及其结构组成,并分析通用的检索系统的组成。最后提出了通用的基于Lucene的... Lucene是一个全文索引引擎工具包,具有访问索引效率高、支持多用户访问、跨平台等优点。把Lucene的索引与全文检索数据库的索引进行比较来介绍Lucene的索引原理及其结构组成,并分析通用的检索系统的组成。最后提出了通用的基于Lucene的全文检索系统的设计以及对实现的关键技术进行了探讨。 展开更多
关键词 检索 索引 文档
下载PDF
基于Android的XML解析器的分析与比较 被引量:15
20
作者 栾咏红 《南京晓庄学院学报》 2011年第6期98-100,共3页
Android平台上应用程序访问Web服务时,多数都会使用XML的解析技术.文中从工作原理、常用接口及类方法,XML文档解析的过程三个方面,分析比较Android所支持的三种解析技术:DOM、SAX、XML Pull.指出Android平台上选用何种解析技术主要取决... Android平台上应用程序访问Web服务时,多数都会使用XML的解析技术.文中从工作原理、常用接口及类方法,XML文档解析的过程三个方面,分析比较Android所支持的三种解析技术:DOM、SAX、XML Pull.指出Android平台上选用何种解析技术主要取决于三方面的因素:移动设备内存的大小、XML解析文档的大小,以及移动应用程序中解析文档的主要用途. 展开更多
关键词 ANDROID XML 解析 文档
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部