期刊文献+
共找到92篇文章
< 1 2 5 >
每页显示 20 50 100
搜索引擎用户点击行为分析 被引量:45
1
作者 王继民 彭波 《情报学报》 CSSCI 北大核心 2006年第2期154-162,共9页
基于大规模分布式搜索引擎系统——北大“天网”的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布,点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一... 基于大规模分布式搜索引擎系统——北大“天网”的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布,点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一些具有普适性的规律。提出了利用点击日志确定相近查询词的一个新的有效算法。这些研究结果对于掌握用户的搜索行为,完善搜索引擎系统的设计,提高检索服务的效率和质量具有重要的意义。 展开更多
关键词 搜索引擎 点击日志 用户行为 分布特征 相似查询
下载PDF
一种高效的多变量时间序列相似查询算法 被引量:16
2
作者 周大镯 吴晓丽 闫红灿 《计算机应用》 CSCD 北大核心 2008年第10期2541-2543,2552,共4页
为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+-... 为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+-树结构进行索引查询;MTS序列比较相似采用的是扩展的Frobenius范数(Eros)。通过对股票数据集实验验证了Dbis算法的高效性。 展开更多
关键词 多变量时间序列 聚类 相似查询
下载PDF
领域相关多媒体对象的基于内容查询 被引量:4
3
作者 巩志国 周龙骧 董淑珍 《计算机学报》 EI CSCD 北大核心 2002年第1期63-72,共10页
该文通过对多媒体对象领域知识特点的分析 ,指出了领域属性与多媒体对象分离的必要性 ,对多媒体对象的领域属性进行了分类 ,采用框架 (frame)结构作为领域知识的表示模型 ,利用语义网表示领域概念之间的分类关系以及同义关系 ,并用上下... 该文通过对多媒体对象领域知识特点的分析 ,指出了领域属性与多媒体对象分离的必要性 ,对多媒体对象的领域属性进行了分类 ,采用框架 (frame)结构作为领域知识的表示模型 ,利用语义网表示领域概念之间的分类关系以及同义关系 ,并用上下文 (context)记录了特定用户更细的辅助知识 ,包括多媒体相似阈值刻画、模糊值的描述以及用户查询反馈等参数 .该文还给出了多媒体对象相似的计算公式 ,分析了多媒体基于内容查询的各种类型 。 展开更多
关键词 内容查询 相似查询 模糊查询 多媒体对象 多媒体数据库
下载PDF
用基于移动均值的索引实现时间序列相似查询 被引量:4
4
作者 林子雨 杨冬青 王腾蛟 《软件学报》 EI CSCD 北大核心 2008年第9期2349-2361,共13页
提出了基于移动均值的索引来解决子序列匹配中的“ε-查询”问题:提出并证明了基于移动均值的缩距定理和缩距比关系定理,后者具有很好的“裁减”能力,可以在相似查询时淘汰大部分不符合条件的候选时间序列,从而达到快速相似查找的... 提出了基于移动均值的索引来解决子序列匹配中的“ε-查询”问题:提出并证明了基于移动均值的缩距定理和缩距比关系定理,后者具有很好的“裁减”能力,可以在相似查询时淘汰大部分不符合条件的候选时间序列,从而达到快速相似查找的目的引入了由Jagadish等人提出的BATON^*-树,并在此基础上适当修改,建立了MABI索引,极大地加快了相似查询过程;最后,在一个股票交易数据集上进行了实验,证明了MABI索引的良好性能. 展开更多
关键词 相似查询 子序列匹配 移动均值 时间序列数据库
下载PDF
基于空间关系的图像检索方法研究 被引量:1
5
作者 王丽萍 邱飞岳 《计算机工程与应用》 CSCD 北大核心 2003年第13期206-207,220,共3页
对基于空间关系的图像检索方法进行了全面的论述,提出了图像对象空间关系的形式化描述,通过邻近和邻近距阵以及数学期望和均方差,给出了一种在图像进行投影变换和旋转变换中保持不变的图像相似匹配算法,并为图像数据库检索提供了有力的... 对基于空间关系的图像检索方法进行了全面的论述,提出了图像对象空间关系的形式化描述,通过邻近和邻近距阵以及数学期望和均方差,给出了一种在图像进行投影变换和旋转变换中保持不变的图像相似匹配算法,并为图像数据库检索提供了有力的支持。 展开更多
关键词 空间关系 形式化 相似查询 相似匹配算法 图像数据库
下载PDF
人在回路的数据融合系统 被引量:2
6
作者 孙佶 李国良 《计算机学报》 EI CAS CSCD 北大核心 2022年第3期654-668,共15页
一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段以及对每个实体聚类中的数据形式进行转换的阶段.经过这些步骤之后,数据融合系统可以将每个实体分组中的... 一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段以及对每个实体聚类中的数据形式进行转换的阶段.经过这些步骤之后,数据融合系统可以将每个实体分组中的实体合并成一条权威的实体表示(被称作“黄金记录”).传统的数据融合系统通常会按照特定的顺序,在用户时间代价不超过预算的前提下,依次询问特定集合中的问题并且获得用户反馈.可是,由于这些问题是高度相关的,一个问题的答案会影响到数据处理管道中任何一个阶段的结果,所以将各个阶段交替进行并且对他们的执行顺序进行全局优化能带来显著的收益.在这篇文章中,我们提出一个“人在回路”的数据融合系统,通过交替询问不同种类的问题来减少获得用户回答的代价.基于这个框架,我们提出了一些不同种类问题能够带来的数据融合质量提升的收益评价模型,以及不同问题需要的用户回答时间的代价评估模型.在这个端到端的“人在回路”数据融合系统中,我们开发出一个问题调度框架来精心选择问题集合以及问题询问的顺序,最终实现利用同等的用户代价让实体合并的精确度从基线方法的70%提升到90%. 展开更多
关键词 数据融合 实体匹配 实体合并 人在回路 机器学习 相似查询 代价优化
下载PDF
一种面向相似查询的轨迹索引方法 被引量:3
7
作者 王飞 庞悦 +1 位作者 周向东 陈海波 《计算机应用与软件》 2017年第11期1-5,63,共6页
轨迹数据具有重要的应用价值,轨迹索引技术得到广泛的研究与关注。传统索引方法存在节点重叠、缺乏动态划分空间能力和丢失大量原始信息等问题,为此提出一种面向相似查询的轨迹索引方法GeoSAX。该方法将原始轨迹分成若干等长子段并采用... 轨迹数据具有重要的应用价值,轨迹索引技术得到广泛的研究与关注。传统索引方法存在节点重叠、缺乏动态划分空间能力和丢失大量原始信息等问题,为此提出一种面向相似查询的轨迹索引方法GeoSAX。该方法将原始轨迹分成若干等长子段并采用基于Geohash的空间编码;对编码后的整条轨迹设计了基于HBase存储的索引架构;实现相似轨迹查询。GeoSAX不仅节点间没有重叠,还能依据数据量的大小对空间动态划分,同时保留指定精度的轨迹信息。在真实的航运和出租车数据集上进行的对比实验表明,与传统方法相比GeoSAX具有更好的轨迹查询性能。 展开更多
关键词 轨迹索引 相似查询 Geohash 空间编码 HBASE
下载PDF
空间相似查询中MBR边界区域关系研究 被引量:1
8
作者 闫实 王学良 《计算机系统应用》 2009年第1期29-34,共6页
相似查询是基于向量空间的一种重要查询方法。点、线段、区域是向量空间对空间对象的三种基本表达。本文在不改变结点MBR区域前提下,通过区域扫描对MBR区域重叠面积进行计算。利用R^*树结点MBR允许重叠的特性,在不能消除区域重叠产... 相似查询是基于向量空间的一种重要查询方法。点、线段、区域是向量空间对空间对象的三种基本表达。本文在不改变结点MBR区域前提下,通过区域扫描对MBR区域重叠面积进行计算。利用R^*树结点MBR允许重叠的特性,在不能消除区域重叠产生的死空间情况下,研究了更为精确的MBR边界的线段关系,并给出线段的最近邻查询算法和相似线段选取算法。实验结果表明该方法的CPU计算代价较低且显著提高了相似查询与更新的效率。 展开更多
关键词 相似查询 MBR 最小外包矩形 R~*树 线段
下载PDF
基于相关反馈的微博相似主题时序查询 被引量:2
9
作者 包红云 李秋丹 +1 位作者 宋双永 高珩 《计算机科学》 CSCD 北大核心 2013年第4期169-171,198,共4页
提出了一种基于相关反馈的微博相似主题时序查询方法。该方法通过考虑用户对不同查询结果是否满意的反馈情况,建立修改度量系数的目标函数,从而实现微博中体现用户兴趣的主题时序相似性计算,为用户提供更满意的相似主题时序查询结果。... 提出了一种基于相关反馈的微博相似主题时序查询方法。该方法通过考虑用户对不同查询结果是否满意的反馈情况,建立修改度量系数的目标函数,从而实现微博中体现用户兴趣的主题时序相似性计算,为用户提供更满意的相似主题时序查询结果。基于该方法设计了一个可视化的微博相似主题时序查询系统,在微博代表性网站-Twitter数据集上进行的实验,表明了该方法在微博背景下的相似主题时序查询中的有效性。 展开更多
关键词 微博客 主题时序 相似查询 相关反馈
下载PDF
基于历史点击数据的集合选择方法 被引量:2
10
作者 刘颖 陈岭 +2 位作者 陈根才 赵江奇 王敬昌 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第1期23-28,161,共7页
针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利... 针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利用历史查询中的相似查询估计新查询与各集合的相关度,选择相关度最高的M个集合进行检索,给出要获取前k个文档的情况下各集合应当返回的文档数.采用召回率Rm、前n个检索结果的准确率P@n及平均准确率MAP对集合选择方法的性能进行验证.实验结果表明,采用PCTD-CS方法提高了检索结果的召回率和准确率,能够更准确地定位到包含相关文档多的集合. 展开更多
关键词 分布式信息检索 集合选择 相似查询 点击数据
下载PDF
基于小波变换的数据流快速索引的研究
11
作者 杨颖 陈秋莲 杨磊 《计算机应用》 CSCD 北大核心 2006年第11期2657-2660,共4页
提出了一个新颖的方案来概要和索引分布式数据流,通过采用离散小波变换在线提取数据流特征,并插入到高维索引结构序列中,来减少维护索引结构所需的开销。实验表明该方法在分析模式和相关性检测上改进了查询精度和响应时间。
关键词 小波系数 最小边限矩形 相似查询 内积查询
下载PDF
基于特征索引的图相似查询过滤算法
12
作者 邹晓红 李甲 +1 位作者 郭景峰 柴然 《计算机工程》 CAS CSCD 北大核心 2011年第14期50-52,55,共4页
分析图相似查询候选集的产生过程以及特征图之间的关系对候选图集的影响,提出一种基于特征索引的图相似查询过滤算法,使用GIndex算法建立特征图索引结构,通过特征图之间的选择性关系给出一个有序的特征集,并借助特征-图矩阵对数据库进... 分析图相似查询候选集的产生过程以及特征图之间的关系对候选图集的影响,提出一种基于特征索引的图相似查询过滤算法,使用GIndex算法建立特征图索引结构,通过特征图之间的选择性关系给出一个有序的特征集,并借助特征-图矩阵对数据库进行筛选得到候选图集。实验结果证明,该方法能准确地产生候选图集,从而提高图查询的效率。 展开更多
关键词 相似查询 图数据库 特征索引 特征图 过滤算法
下载PDF
一种基于CHORD系统的多维相似查询处理方法 被引量:1
13
作者 李智玲 《计算机系统应用》 2006年第4期37-40,44,共5页
如何在对等计算环境下处理多维空间中的相似查询是目前学术界的研究热点之一。本文通过基于代表点的多维空间划分策略,提出了一种对等计算环境下的分布式多维索引技术,实现了一种基于CHORD系统的多维相似查询处理。仿真实验证明了本文... 如何在对等计算环境下处理多维空间中的相似查询是目前学术界的研究热点之一。本文通过基于代表点的多维空间划分策略,提出了一种对等计算环境下的分布式多维索引技术,实现了一种基于CHORD系统的多维相似查询处理。仿真实验证明了本文提出的方法的有效性。 展开更多
关键词 对等计算 空间划分 索引 相似查询
下载PDF
基于模糊数据模型的智能查询优化算法
14
作者 左利云 《微型电脑应用》 2010年第5期9-10,13+72,共4页
为实现对数据库信息查询时使用自然语言与计算机交流,提出了一种智能查询优化算法-IIOP算法;首创提出将模糊查询与相似查询结合的思想,其中模糊匹配查询更符合人脑思维特性,更合理有效;为提高查询效率,在进行查询时首先对原始数据序列... 为实现对数据库信息查询时使用自然语言与计算机交流,提出了一种智能查询优化算法-IIOP算法;首创提出将模糊查询与相似查询结合的思想,其中模糊匹配查询更符合人脑思维特性,更合理有效;为提高查询效率,在进行查询时首先对原始数据序列提取能反映数据变化趋势的特征极值点,然后仅对特征极值点进行相似查询,极大减少了数据存储量,提高了查询计算速度。该算法经实验验证切实有效可行,相对其它算法能明显提高查询速度和准确率。 展开更多
关键词 模糊查询 相似查询 特征极值点
下载PDF
无线传感器网络多查询的节能优化
15
作者 申少辉 王晓明 《微型机与应用》 2011年第6期56-58,共3页
提出了一个无线传感器网络多查询的节能优化方案。该方案通过建立相似查询判断算法把多查询中的相似查询分为一组,并在每一组找一个能使传输能耗达到最小的中继节点作为处理节点。组内节点的数据都传送到该处理节点,并由该节点利用数据... 提出了一个无线传感器网络多查询的节能优化方案。该方案通过建立相似查询判断算法把多查询中的相似查询分为一组,并在每一组找一个能使传输能耗达到最小的中继节点作为处理节点。组内节点的数据都传送到该处理节点,并由该节点利用数据处理函数处理数据,然后再传到基站。这样就减少了网络中数据的传输量,从而有效地节省了网络的能量,达到能量的最大化利用。 展开更多
关键词 无线传感器网络 查询 相似查询 处理节点 能量
下载PDF
不确定集值数据的高效相似查询
16
作者 陈珂 洪银杰 陈刚 《软件学报》 EI CSCD 北大核心 2012年第6期1588-1601,共14页
基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界... 基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界的集合期望相似度的度量公式.在期望的度量公式中,如果一对集合(X,Y)的期望相似度大于给定的阈值(0,1),则被称为相似集合对.一般的算法,在基于可能世界的情况下计算不确定集合的期望相似度,其复杂度是指数级的.提出了利用动态规划来计算集合期望相似度的算法,该算法的复杂度是多项式级别,极大地减少了计算时间.实验结果表明了基于该算法查询的可用性和高性能. 展开更多
关键词 相似查询 期望相似 动态规划 不确定集值
下载PDF
一种多维向量并行查询算法
17
作者 黄海 侯颖 朱圣平 《微电子学与计算机》 CSCD 北大核心 2010年第8期17-19,共3页
为了解决多维向量数据快速查询问题,在查询范围上限已知的条件下,通过对数据集合采用最近邻准则进行空间划分,构造一种多叉扩展平衡索引树,并设计了索引树的串行和并行查询算法.最后,对并行查询算法的性能进行了分析,测试结果验证了该... 为了解决多维向量数据快速查询问题,在查询范围上限已知的条件下,通过对数据集合采用最近邻准则进行空间划分,构造一种多叉扩展平衡索引树,并设计了索引树的串行和并行查询算法.最后,对并行查询算法的性能进行了分析,测试结果验证了该方法的有效性. 展开更多
关键词 多维索引结构 并行计算 相似查询
下载PDF
基于B^+-tree索引的多元时间序列相似查询
18
作者 郭小芳 李锋 叶华 《计算机工程与应用》 CSCD 2013年第22期139-142,145,共5页
为提高多元时间序列相似查询执行效率,采用了基于距离索引结构的相似查询算法。利用主成分分析方法对多元时间序列数据降维并在此基础上进行聚类,以聚类质心为参考点,将各类变换到一维空间,利用B+-tree结构进行索引查询,找到与查询序列... 为提高多元时间序列相似查询执行效率,采用了基于距离索引结构的相似查询算法。利用主成分分析方法对多元时间序列数据降维并在此基础上进行聚类,以聚类质心为参考点,将各类变换到一维空间,利用B+-tree结构进行索引查询,找到与查询序列最相似的k个MTS序列。实验表明查询效率和准确性都有比较大的提高。 展开更多
关键词 多元时间序列 主元分析 B+-tree索引 相似查询
下载PDF
一种基于B^+-tree索引的有效相似查询算法
19
作者 郭小芳 叶华 《西北师范大学学报(自然科学版)》 CAS 北大核心 2012年第4期33-37,共5页
提出了一种多元时间序列相似查询算法.在距离索引结构相似查询算法的基础上,利用主成分分析方法对多元时间序列进行降维,并对主成分进行聚类,在聚类质心与各类之间的范数所构成的一维空间上,对聚类建立B+-tree索引结构,然后利用k近邻查... 提出了一种多元时间序列相似查询算法.在距离索引结构相似查询算法的基础上,利用主成分分析方法对多元时间序列进行降维,并对主成分进行聚类,在聚类质心与各类之间的范数所构成的一维空间上,对聚类建立B+-tree索引结构,然后利用k近邻查询算法查找出与查询序列最相似的k个MTS序列.实验结果表明,文中算法的候选比率与查询时间明显低于Muse算法,且候选比率与查询时间受聚类个数影响不大,说明文中算法具有一定的优越性. 展开更多
关键词 多元时间序列 主元分析 B+-tree索引 相似查询
下载PDF
基于相似查询树的快速密文检索方法 被引量:6
20
作者 田雪 朱晓杰 +2 位作者 申培松 陈驰 邹洪 《软件学报》 EI CSCD 北大核心 2016年第6期1566-1576,共11页
随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查... 随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查询树的密文检索方法(MRSE-SS).该方法通过设置聚类中心和成员之间的最大距离对文档向量进行聚类,并把中心向量看成n维超球体的球心,最大距离作为半径,再逐步将小聚类聚合成大聚类.使用该方法构建的密文文档集合,在查询阶段,仅需检索查询向量相邻的聚类即可获得理想的查询结果集合,从而提高了密文检索的效率.以《软件学报》最近10年的论文作为样本进行了实验,数据集中选取2 900篇文档和4 800个关键词.实验结果显示:当文档集个数呈指数增长时,检索时间仅呈线性增长,并且检索结果的关联性比传统检索方法更强. 展开更多
关键词 云计算 密文检索 多关键字排序检索 相似查询 云安全
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部