期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
92
篇文章
<
1
2
…
5
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
搜索引擎用户点击行为分析
被引量:
45
1
作者
王继民
彭波
《情报学报》
CSSCI
北大核心
2006年第2期154-162,共9页
基于大规模分布式搜索引擎系统——北大“天网”的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布,点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一...
基于大规模分布式搜索引擎系统——北大“天网”的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布,点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一些具有普适性的规律。提出了利用点击日志确定相近查询词的一个新的有效算法。这些研究结果对于掌握用户的搜索行为,完善搜索引擎系统的设计,提高检索服务的效率和质量具有重要的意义。
展开更多
关键词
搜索引擎
点击日志
用户行为
分布特征
相似
查询
下载PDF
职称材料
一种高效的多变量时间序列相似查询算法
被引量:
16
2
作者
周大镯
吴晓丽
闫红灿
《计算机应用》
CSCD
北大核心
2008年第10期2541-2543,2552,共4页
为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+-...
为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+-树结构进行索引查询;MTS序列比较相似采用的是扩展的Frobenius范数(Eros)。通过对股票数据集实验验证了Dbis算法的高效性。
展开更多
关键词
多变量时间序列
聚类
相似
查询
下载PDF
职称材料
领域相关多媒体对象的基于内容查询
被引量:
4
3
作者
巩志国
周龙骧
董淑珍
《计算机学报》
EI
CSCD
北大核心
2002年第1期63-72,共10页
该文通过对多媒体对象领域知识特点的分析 ,指出了领域属性与多媒体对象分离的必要性 ,对多媒体对象的领域属性进行了分类 ,采用框架 (frame)结构作为领域知识的表示模型 ,利用语义网表示领域概念之间的分类关系以及同义关系 ,并用上下...
该文通过对多媒体对象领域知识特点的分析 ,指出了领域属性与多媒体对象分离的必要性 ,对多媒体对象的领域属性进行了分类 ,采用框架 (frame)结构作为领域知识的表示模型 ,利用语义网表示领域概念之间的分类关系以及同义关系 ,并用上下文 (context)记录了特定用户更细的辅助知识 ,包括多媒体相似阈值刻画、模糊值的描述以及用户查询反馈等参数 .该文还给出了多媒体对象相似的计算公式 ,分析了多媒体基于内容查询的各种类型 。
展开更多
关键词
内容
查询
相似
查询
模糊
查询
多媒体对象
多媒体数据库
下载PDF
职称材料
用基于移动均值的索引实现时间序列相似查询
被引量:
4
4
作者
林子雨
杨冬青
王腾蛟
《软件学报》
EI
CSCD
北大核心
2008年第9期2349-2361,共13页
提出了基于移动均值的索引来解决子序列匹配中的“ε-查询”问题:提出并证明了基于移动均值的缩距定理和缩距比关系定理,后者具有很好的“裁减”能力,可以在相似查询时淘汰大部分不符合条件的候选时间序列,从而达到快速相似查找的...
提出了基于移动均值的索引来解决子序列匹配中的“ε-查询”问题:提出并证明了基于移动均值的缩距定理和缩距比关系定理,后者具有很好的“裁减”能力,可以在相似查询时淘汰大部分不符合条件的候选时间序列,从而达到快速相似查找的目的引入了由Jagadish等人提出的BATON^*-树,并在此基础上适当修改,建立了MABI索引,极大地加快了相似查询过程;最后,在一个股票交易数据集上进行了实验,证明了MABI索引的良好性能.
展开更多
关键词
相似
查询
子序列匹配
移动均值
时间序列数据库
下载PDF
职称材料
基于空间关系的图像检索方法研究
被引量:
1
5
作者
王丽萍
邱飞岳
《计算机工程与应用》
CSCD
北大核心
2003年第13期206-207,220,共3页
对基于空间关系的图像检索方法进行了全面的论述,提出了图像对象空间关系的形式化描述,通过邻近和邻近距阵以及数学期望和均方差,给出了一种在图像进行投影变换和旋转变换中保持不变的图像相似匹配算法,并为图像数据库检索提供了有力的...
对基于空间关系的图像检索方法进行了全面的论述,提出了图像对象空间关系的形式化描述,通过邻近和邻近距阵以及数学期望和均方差,给出了一种在图像进行投影变换和旋转变换中保持不变的图像相似匹配算法,并为图像数据库检索提供了有力的支持。
展开更多
关键词
空间关系
形式化
相似
查询
相似
匹配算法
图像数据库
下载PDF
职称材料
人在回路的数据融合系统
被引量:
2
6
作者
孙佶
李国良
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第3期654-668,共15页
一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段以及对每个实体聚类中的数据形式进行转换的阶段.经过这些步骤之后,数据融合系统可以将每个实体分组中的...
一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段以及对每个实体聚类中的数据形式进行转换的阶段.经过这些步骤之后,数据融合系统可以将每个实体分组中的实体合并成一条权威的实体表示(被称作“黄金记录”).传统的数据融合系统通常会按照特定的顺序,在用户时间代价不超过预算的前提下,依次询问特定集合中的问题并且获得用户反馈.可是,由于这些问题是高度相关的,一个问题的答案会影响到数据处理管道中任何一个阶段的结果,所以将各个阶段交替进行并且对他们的执行顺序进行全局优化能带来显著的收益.在这篇文章中,我们提出一个“人在回路”的数据融合系统,通过交替询问不同种类的问题来减少获得用户回答的代价.基于这个框架,我们提出了一些不同种类问题能够带来的数据融合质量提升的收益评价模型,以及不同问题需要的用户回答时间的代价评估模型.在这个端到端的“人在回路”数据融合系统中,我们开发出一个问题调度框架来精心选择问题集合以及问题询问的顺序,最终实现利用同等的用户代价让实体合并的精确度从基线方法的70%提升到90%.
展开更多
关键词
数据融合
实体匹配
实体合并
人在回路
机器学习
相似
查询
代价优化
下载PDF
职称材料
一种面向相似查询的轨迹索引方法
被引量:
3
7
作者
王飞
庞悦
+1 位作者
周向东
陈海波
《计算机应用与软件》
2017年第11期1-5,63,共6页
轨迹数据具有重要的应用价值,轨迹索引技术得到广泛的研究与关注。传统索引方法存在节点重叠、缺乏动态划分空间能力和丢失大量原始信息等问题,为此提出一种面向相似查询的轨迹索引方法GeoSAX。该方法将原始轨迹分成若干等长子段并采用...
轨迹数据具有重要的应用价值,轨迹索引技术得到广泛的研究与关注。传统索引方法存在节点重叠、缺乏动态划分空间能力和丢失大量原始信息等问题,为此提出一种面向相似查询的轨迹索引方法GeoSAX。该方法将原始轨迹分成若干等长子段并采用基于Geohash的空间编码;对编码后的整条轨迹设计了基于HBase存储的索引架构;实现相似轨迹查询。GeoSAX不仅节点间没有重叠,还能依据数据量的大小对空间动态划分,同时保留指定精度的轨迹信息。在真实的航运和出租车数据集上进行的对比实验表明,与传统方法相比GeoSAX具有更好的轨迹查询性能。
展开更多
关键词
轨迹索引
相似
查询
Geohash
空间编码
HBASE
下载PDF
职称材料
空间相似查询中MBR边界区域关系研究
被引量:
1
8
作者
闫实
王学良
《计算机系统应用》
2009年第1期29-34,共6页
相似查询是基于向量空间的一种重要查询方法。点、线段、区域是向量空间对空间对象的三种基本表达。本文在不改变结点MBR区域前提下,通过区域扫描对MBR区域重叠面积进行计算。利用R^*树结点MBR允许重叠的特性,在不能消除区域重叠产...
相似查询是基于向量空间的一种重要查询方法。点、线段、区域是向量空间对空间对象的三种基本表达。本文在不改变结点MBR区域前提下,通过区域扫描对MBR区域重叠面积进行计算。利用R^*树结点MBR允许重叠的特性,在不能消除区域重叠产生的死空间情况下,研究了更为精确的MBR边界的线段关系,并给出线段的最近邻查询算法和相似线段选取算法。实验结果表明该方法的CPU计算代价较低且显著提高了相似查询与更新的效率。
展开更多
关键词
相似
查询
MBR
最小外包矩形
R~*树
线段
下载PDF
职称材料
基于相关反馈的微博相似主题时序查询
被引量:
2
9
作者
包红云
李秋丹
+1 位作者
宋双永
高珩
《计算机科学》
CSCD
北大核心
2013年第4期169-171,198,共4页
提出了一种基于相关反馈的微博相似主题时序查询方法。该方法通过考虑用户对不同查询结果是否满意的反馈情况,建立修改度量系数的目标函数,从而实现微博中体现用户兴趣的主题时序相似性计算,为用户提供更满意的相似主题时序查询结果。...
提出了一种基于相关反馈的微博相似主题时序查询方法。该方法通过考虑用户对不同查询结果是否满意的反馈情况,建立修改度量系数的目标函数,从而实现微博中体现用户兴趣的主题时序相似性计算,为用户提供更满意的相似主题时序查询结果。基于该方法设计了一个可视化的微博相似主题时序查询系统,在微博代表性网站-Twitter数据集上进行的实验,表明了该方法在微博背景下的相似主题时序查询中的有效性。
展开更多
关键词
微博客
主题时序
相似
查询
相关反馈
下载PDF
职称材料
基于历史点击数据的集合选择方法
被引量:
2
10
作者
刘颖
陈岭
+2 位作者
陈根才
赵江奇
王敬昌
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2013年第1期23-28,161,共7页
针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利...
针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利用历史查询中的相似查询估计新查询与各集合的相关度,选择相关度最高的M个集合进行检索,给出要获取前k个文档的情况下各集合应当返回的文档数.采用召回率Rm、前n个检索结果的准确率P@n及平均准确率MAP对集合选择方法的性能进行验证.实验结果表明,采用PCTD-CS方法提高了检索结果的召回率和准确率,能够更准确地定位到包含相关文档多的集合.
展开更多
关键词
分布式信息检索
集合选择
相似
查询
点击数据
下载PDF
职称材料
基于小波变换的数据流快速索引的研究
11
作者
杨颖
陈秋莲
杨磊
《计算机应用》
CSCD
北大核心
2006年第11期2657-2660,共4页
提出了一个新颖的方案来概要和索引分布式数据流,通过采用离散小波变换在线提取数据流特征,并插入到高维索引结构序列中,来减少维护索引结构所需的开销。实验表明该方法在分析模式和相关性检测上改进了查询精度和响应时间。
关键词
小波系数
最小边限矩形
相似
查询
内积
查询
下载PDF
职称材料
基于特征索引的图相似查询过滤算法
12
作者
邹晓红
李甲
+1 位作者
郭景峰
柴然
《计算机工程》
CAS
CSCD
北大核心
2011年第14期50-52,55,共4页
分析图相似查询候选集的产生过程以及特征图之间的关系对候选图集的影响,提出一种基于特征索引的图相似查询过滤算法,使用GIndex算法建立特征图索引结构,通过特征图之间的选择性关系给出一个有序的特征集,并借助特征-图矩阵对数据库进...
分析图相似查询候选集的产生过程以及特征图之间的关系对候选图集的影响,提出一种基于特征索引的图相似查询过滤算法,使用GIndex算法建立特征图索引结构,通过特征图之间的选择性关系给出一个有序的特征集,并借助特征-图矩阵对数据库进行筛选得到候选图集。实验结果证明,该方法能准确地产生候选图集,从而提高图查询的效率。
展开更多
关键词
相似
查询
图数据库
特征索引
特征图
过滤算法
下载PDF
职称材料
一种基于CHORD系统的多维相似查询处理方法
被引量:
1
13
作者
李智玲
《计算机系统应用》
2006年第4期37-40,44,共5页
如何在对等计算环境下处理多维空间中的相似查询是目前学术界的研究热点之一。本文通过基于代表点的多维空间划分策略,提出了一种对等计算环境下的分布式多维索引技术,实现了一种基于CHORD系统的多维相似查询处理。仿真实验证明了本文...
如何在对等计算环境下处理多维空间中的相似查询是目前学术界的研究热点之一。本文通过基于代表点的多维空间划分策略,提出了一种对等计算环境下的分布式多维索引技术,实现了一种基于CHORD系统的多维相似查询处理。仿真实验证明了本文提出的方法的有效性。
展开更多
关键词
对等计算
空间划分
索引
相似
查询
下载PDF
职称材料
基于模糊数据模型的智能查询优化算法
14
作者
左利云
《微型电脑应用》
2010年第5期9-10,13+72,共4页
为实现对数据库信息查询时使用自然语言与计算机交流,提出了一种智能查询优化算法-IIOP算法;首创提出将模糊查询与相似查询结合的思想,其中模糊匹配查询更符合人脑思维特性,更合理有效;为提高查询效率,在进行查询时首先对原始数据序列...
为实现对数据库信息查询时使用自然语言与计算机交流,提出了一种智能查询优化算法-IIOP算法;首创提出将模糊查询与相似查询结合的思想,其中模糊匹配查询更符合人脑思维特性,更合理有效;为提高查询效率,在进行查询时首先对原始数据序列提取能反映数据变化趋势的特征极值点,然后仅对特征极值点进行相似查询,极大减少了数据存储量,提高了查询计算速度。该算法经实验验证切实有效可行,相对其它算法能明显提高查询速度和准确率。
展开更多
关键词
模糊
查询
相似
查询
特征极值点
下载PDF
职称材料
无线传感器网络多查询的节能优化
15
作者
申少辉
王晓明
《微型机与应用》
2011年第6期56-58,共3页
提出了一个无线传感器网络多查询的节能优化方案。该方案通过建立相似查询判断算法把多查询中的相似查询分为一组,并在每一组找一个能使传输能耗达到最小的中继节点作为处理节点。组内节点的数据都传送到该处理节点,并由该节点利用数据...
提出了一个无线传感器网络多查询的节能优化方案。该方案通过建立相似查询判断算法把多查询中的相似查询分为一组,并在每一组找一个能使传输能耗达到最小的中继节点作为处理节点。组内节点的数据都传送到该处理节点,并由该节点利用数据处理函数处理数据,然后再传到基站。这样就减少了网络中数据的传输量,从而有效地节省了网络的能量,达到能量的最大化利用。
展开更多
关键词
无线传感器网络
多
查询
相似
查询
处理节点
能量
下载PDF
职称材料
不确定集值数据的高效相似查询
16
作者
陈珂
洪银杰
陈刚
《软件学报》
EI
CSCD
北大核心
2012年第6期1588-1601,共14页
基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界...
基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界的集合期望相似度的度量公式.在期望的度量公式中,如果一对集合(X,Y)的期望相似度大于给定的阈值(0,1),则被称为相似集合对.一般的算法,在基于可能世界的情况下计算不确定集合的期望相似度,其复杂度是指数级的.提出了利用动态规划来计算集合期望相似度的算法,该算法的复杂度是多项式级别,极大地减少了计算时间.实验结果表明了基于该算法查询的可用性和高性能.
展开更多
关键词
相似
查询
期望
相似
度
动态规划
不确定集值
下载PDF
职称材料
一种多维向量并行查询算法
17
作者
黄海
侯颖
朱圣平
《微电子学与计算机》
CSCD
北大核心
2010年第8期17-19,共3页
为了解决多维向量数据快速查询问题,在查询范围上限已知的条件下,通过对数据集合采用最近邻准则进行空间划分,构造一种多叉扩展平衡索引树,并设计了索引树的串行和并行查询算法.最后,对并行查询算法的性能进行了分析,测试结果验证了该...
为了解决多维向量数据快速查询问题,在查询范围上限已知的条件下,通过对数据集合采用最近邻准则进行空间划分,构造一种多叉扩展平衡索引树,并设计了索引树的串行和并行查询算法.最后,对并行查询算法的性能进行了分析,测试结果验证了该方法的有效性.
展开更多
关键词
多维索引结构
并行计算
相似
查询
下载PDF
职称材料
基于B^+-tree索引的多元时间序列相似查询
18
作者
郭小芳
李锋
叶华
《计算机工程与应用》
CSCD
2013年第22期139-142,145,共5页
为提高多元时间序列相似查询执行效率,采用了基于距离索引结构的相似查询算法。利用主成分分析方法对多元时间序列数据降维并在此基础上进行聚类,以聚类质心为参考点,将各类变换到一维空间,利用B+-tree结构进行索引查询,找到与查询序列...
为提高多元时间序列相似查询执行效率,采用了基于距离索引结构的相似查询算法。利用主成分分析方法对多元时间序列数据降维并在此基础上进行聚类,以聚类质心为参考点,将各类变换到一维空间,利用B+-tree结构进行索引查询,找到与查询序列最相似的k个MTS序列。实验表明查询效率和准确性都有比较大的提高。
展开更多
关键词
多元时间序列
主元分析
B+-tree索引
相似
查询
下载PDF
职称材料
一种基于B^+-tree索引的有效相似查询算法
19
作者
郭小芳
叶华
《西北师范大学学报(自然科学版)》
CAS
北大核心
2012年第4期33-37,共5页
提出了一种多元时间序列相似查询算法.在距离索引结构相似查询算法的基础上,利用主成分分析方法对多元时间序列进行降维,并对主成分进行聚类,在聚类质心与各类之间的范数所构成的一维空间上,对聚类建立B+-tree索引结构,然后利用k近邻查...
提出了一种多元时间序列相似查询算法.在距离索引结构相似查询算法的基础上,利用主成分分析方法对多元时间序列进行降维,并对主成分进行聚类,在聚类质心与各类之间的范数所构成的一维空间上,对聚类建立B+-tree索引结构,然后利用k近邻查询算法查找出与查询序列最相似的k个MTS序列.实验结果表明,文中算法的候选比率与查询时间明显低于Muse算法,且候选比率与查询时间受聚类个数影响不大,说明文中算法具有一定的优越性.
展开更多
关键词
多元时间序列
主元分析
B+-tree索引
相似
查询
下载PDF
职称材料
基于相似查询树的快速密文检索方法
被引量:
6
20
作者
田雪
朱晓杰
+2 位作者
申培松
陈驰
邹洪
《软件学报》
EI
CSCD
北大核心
2016年第6期1566-1576,共11页
随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查...
随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查询树的密文检索方法(MRSE-SS).该方法通过设置聚类中心和成员之间的最大距离对文档向量进行聚类,并把中心向量看成n维超球体的球心,最大距离作为半径,再逐步将小聚类聚合成大聚类.使用该方法构建的密文文档集合,在查询阶段,仅需检索查询向量相邻的聚类即可获得理想的查询结果集合,从而提高了密文检索的效率.以《软件学报》最近10年的论文作为样本进行了实验,数据集中选取2 900篇文档和4 800个关键词.实验结果显示:当文档集个数呈指数增长时,检索时间仅呈线性增长,并且检索结果的关联性比传统检索方法更强.
展开更多
关键词
云计算
密文检索
多关键字排序检索
相似
查询
树
云安全
下载PDF
职称材料
题名
搜索引擎用户点击行为分析
被引量:
45
1
作者
王继民
彭波
机构
北京大学信息科学技术学院
中国科学院资源环境科学信息中心
出处
《情报学报》
CSSCI
北大核心
2006年第2期154-162,共9页
基金
国家自然科学基金重点项目(60435020)
教育部博士点基金项目(20030001076)
中国博士后科学基金项目(2004036182).
文摘
基于大规模分布式搜索引擎系统——北大“天网”的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布,点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一些具有普适性的规律。提出了利用点击日志确定相近查询词的一个新的有效算法。这些研究结果对于掌握用户的搜索行为,完善搜索引擎系统的设计,提高检索服务的效率和质量具有重要的意义。
关键词
搜索引擎
点击日志
用户行为
分布特征
相似
查询
Keywords
search engine, click log, user behavior, characteristic distribution, similar query.
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种高效的多变量时间序列相似查询算法
被引量:
16
2
作者
周大镯
吴晓丽
闫红灿
机构
天津大学管理学院
河北经贸大学计算机中心
河北理工大学理学院
出处
《计算机应用》
CSCD
北大核心
2008年第10期2541-2543,2552,共4页
基金
河北省科技攻关计划项目(062135140)
文摘
为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+-树结构进行索引查询;MTS序列比较相似采用的是扩展的Frobenius范数(Eros)。通过对股票数据集实验验证了Dbis算法的高效性。
关键词
多变量时间序列
聚类
相似
查询
Keywords
Multivariate Time Series (MTS)
cluster
similarity search
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
领域相关多媒体对象的基于内容查询
被引量:
4
3
作者
巩志国
周龙骧
董淑珍
机构
澳门大学科技学院
中国科学院数学研究所
河北师范大学计算机科学系
出处
《计算机学报》
EI
CSCD
北大核心
2002年第1期63-72,共10页
基金
国家自然科学基金 (69983 0 11)资助
文摘
该文通过对多媒体对象领域知识特点的分析 ,指出了领域属性与多媒体对象分离的必要性 ,对多媒体对象的领域属性进行了分类 ,采用框架 (frame)结构作为领域知识的表示模型 ,利用语义网表示领域概念之间的分类关系以及同义关系 ,并用上下文 (context)记录了特定用户更细的辅助知识 ,包括多媒体相似阈值刻画、模糊值的描述以及用户查询反馈等参数 .该文还给出了多媒体对象相似的计算公式 ,分析了多媒体基于内容查询的各种类型 。
关键词
内容
查询
相似
查询
模糊
查询
多媒体对象
多媒体数据库
Keywords
Content based retrieval
Knowledge representation
Multimedia systems
分类号
TP311.134 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
用基于移动均值的索引实现时间序列相似查询
被引量:
4
4
作者
林子雨
杨冬青
王腾蛟
机构
北京大学高可信软件技术教育部重点实验室
出处
《软件学报》
EI
CSCD
北大核心
2008年第9期2349-2361,共13页
基金
国家自然科学基金
国家高技术研究与发展计划(863)~~
文摘
提出了基于移动均值的索引来解决子序列匹配中的“ε-查询”问题:提出并证明了基于移动均值的缩距定理和缩距比关系定理,后者具有很好的“裁减”能力,可以在相似查询时淘汰大部分不符合条件的候选时间序列,从而达到快速相似查找的目的引入了由Jagadish等人提出的BATON^*-树,并在此基础上适当修改,建立了MABI索引,极大地加快了相似查询过程;最后,在一个股票交易数据集上进行了实验,证明了MABI索引的良好性能.
关键词
相似
查询
子序列匹配
移动均值
时间序列数据库
Keywords
similarity search
subsequence matching
moving average
time series database
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于空间关系的图像检索方法研究
被引量:
1
5
作者
王丽萍
邱飞岳
机构
浙江工业大学信息管理与智能决策研究所
浙江工业大学集成化信息系统研究所
出处
《计算机工程与应用》
CSCD
北大核心
2003年第13期206-207,220,共3页
基金
浙江省自然科学基金资助项目(编号:60074035)
文摘
对基于空间关系的图像检索方法进行了全面的论述,提出了图像对象空间关系的形式化描述,通过邻近和邻近距阵以及数学期望和均方差,给出了一种在图像进行投影变换和旋转变换中保持不变的图像相似匹配算法,并为图像数据库检索提供了有力的支持。
关键词
空间关系
形式化
相似
查询
相似
匹配算法
图像数据库
Keywords
Spatial relationships,formalization description,Similarity retrieval,Similarity matching algorithm,Image databases
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
人在回路的数据融合系统
被引量:
2
6
作者
孙佶
李国良
机构
清华大学计算机系
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第3期654-668,共15页
基金
国家自然科学基金“众包数据库基础理论与关键技术”(61632016)、“智能数据管理”(61925205)资助
文摘
一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段以及对每个实体聚类中的数据形式进行转换的阶段.经过这些步骤之后,数据融合系统可以将每个实体分组中的实体合并成一条权威的实体表示(被称作“黄金记录”).传统的数据融合系统通常会按照特定的顺序,在用户时间代价不超过预算的前提下,依次询问特定集合中的问题并且获得用户反馈.可是,由于这些问题是高度相关的,一个问题的答案会影响到数据处理管道中任何一个阶段的结果,所以将各个阶段交替进行并且对他们的执行顺序进行全局优化能带来显著的收益.在这篇文章中,我们提出一个“人在回路”的数据融合系统,通过交替询问不同种类的问题来减少获得用户回答的代价.基于这个框架,我们提出了一些不同种类问题能够带来的数据融合质量提升的收益评价模型,以及不同问题需要的用户回答时间的代价评估模型.在这个端到端的“人在回路”数据融合系统中,我们开发出一个问题调度框架来精心选择问题集合以及问题询问的顺序,最终实现利用同等的用户代价让实体合并的精确度从基线方法的70%提升到90%.
关键词
数据融合
实体匹配
实体合并
人在回路
机器学习
相似
查询
代价优化
Keywords
data integration
entity matching
entity consolidation
human-in-the-loop
machine learning
similarity queries
cost optimization
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种面向相似查询的轨迹索引方法
被引量:
3
7
作者
王飞
庞悦
周向东
陈海波
机构
复旦大学计算机科学技术学院
国网上海市电力公司
出处
《计算机应用与软件》
2017年第11期1-5,63,共6页
基金
国家高技术研究发展计划项目(2015AA050203)
国家自然科学基金项目(61370157)
国家电网公司总部科技项目(52094016000A)
文摘
轨迹数据具有重要的应用价值,轨迹索引技术得到广泛的研究与关注。传统索引方法存在节点重叠、缺乏动态划分空间能力和丢失大量原始信息等问题,为此提出一种面向相似查询的轨迹索引方法GeoSAX。该方法将原始轨迹分成若干等长子段并采用基于Geohash的空间编码;对编码后的整条轨迹设计了基于HBase存储的索引架构;实现相似轨迹查询。GeoSAX不仅节点间没有重叠,还能依据数据量的大小对空间动态划分,同时保留指定精度的轨迹信息。在真实的航运和出租车数据集上进行的对比实验表明,与传统方法相比GeoSAX具有更好的轨迹查询性能。
关键词
轨迹索引
相似
查询
Geohash
空间编码
HBASE
Keywords
Track index Similarity search Geohash Spatial coding HBase
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
空间相似查询中MBR边界区域关系研究
被引量:
1
8
作者
闫实
王学良
机构
牡丹江医学院计算机技术与信息中心
黑龙江大学计算机学院
出处
《计算机系统应用》
2009年第1期29-34,共6页
文摘
相似查询是基于向量空间的一种重要查询方法。点、线段、区域是向量空间对空间对象的三种基本表达。本文在不改变结点MBR区域前提下,通过区域扫描对MBR区域重叠面积进行计算。利用R^*树结点MBR允许重叠的特性,在不能消除区域重叠产生的死空间情况下,研究了更为精确的MBR边界的线段关系,并给出线段的最近邻查询算法和相似线段选取算法。实验结果表明该方法的CPU计算代价较低且显著提高了相似查询与更新的效率。
关键词
相似
查询
MBR
最小外包矩形
R~*树
线段
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于相关反馈的微博相似主题时序查询
被引量:
2
9
作者
包红云
李秋丹
宋双永
高珩
机构
中国科学院自动化研究所复杂系统管理与控制国家重点实验室
出处
《计算机科学》
CSCD
北大核心
2013年第4期169-171,198,共4页
基金
国家自然科学基金(61172106)
北京市自然科学基金(4112062)资助
文摘
提出了一种基于相关反馈的微博相似主题时序查询方法。该方法通过考虑用户对不同查询结果是否满意的反馈情况,建立修改度量系数的目标函数,从而实现微博中体现用户兴趣的主题时序相似性计算,为用户提供更满意的相似主题时序查询结果。基于该方法设计了一个可视化的微博相似主题时序查询系统,在微博代表性网站-Twitter数据集上进行的实验,表明了该方法在微博背景下的相似主题时序查询中的有效性。
关键词
微博客
主题时序
相似
查询
相关反馈
Keywords
Micro-blogging
Topic time series
Similarity search
Relevance feedback
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于历史点击数据的集合选择方法
被引量:
2
10
作者
刘颖
陈岭
陈根才
赵江奇
王敬昌
机构
浙江大学计算机科学与技术学院
浙江鸿程计算机系统有限公司
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2013年第1期23-28,161,共7页
基金
国家"核高基"重大科技专项课题资助项目(2010ZX01042-002-003)
国家自然科学基金资助项目(60703040)
+2 种基金
浙江省科技计划重大资助项目(2007C13019)
浙江省重大科技专项资助项目(2011C13042)
杭州市重大科技创新专项资助项目(20112311A20)
文摘
针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利用历史查询中的相似查询估计新查询与各集合的相关度,选择相关度最高的M个集合进行检索,给出要获取前k个文档的情况下各集合应当返回的文档数.采用召回率Rm、前n个检索结果的准确率P@n及平均准确率MAP对集合选择方法的性能进行验证.实验结果表明,采用PCTD-CS方法提高了检索结果的召回率和准确率,能够更准确地定位到包含相关文档多的集合.
关键词
分布式信息检索
集合选择
相似
查询
点击数据
Keywords
distributed information retrieval
collection selection
similar query
click-through data
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于小波变换的数据流快速索引的研究
11
作者
杨颖
陈秋莲
杨磊
机构
广西大学计算机与信息工程学院
广西计算中心
出处
《计算机应用》
CSCD
北大核心
2006年第11期2657-2660,共4页
基金
国家863计划项目(2002AA4Z3430)
广西大学基金资助项目(X061001
X061002)
文摘
提出了一个新颖的方案来概要和索引分布式数据流,通过采用离散小波变换在线提取数据流特征,并插入到高维索引结构序列中,来减少维护索引结构所需的开销。实验表明该方法在分析模式和相关性检测上改进了查询精度和响应时间。
关键词
小波系数
最小边限矩形
相似
查询
内积
查询
Keywords
wavelet coefficients
minimum bound rectangle
similarity query
product query
分类号
TP311.12 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于特征索引的图相似查询过滤算法
12
作者
邹晓红
李甲
郭景峰
柴然
机构
燕山大学信息科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第14期50-52,55,共4页
基金
国家自然科学基金资助项目(60673136)
河北省教育厅自然科学研究计划基金资助项目(2009101)
文摘
分析图相似查询候选集的产生过程以及特征图之间的关系对候选图集的影响,提出一种基于特征索引的图相似查询过滤算法,使用GIndex算法建立特征图索引结构,通过特征图之间的选择性关系给出一个有序的特征集,并借助特征-图矩阵对数据库进行筛选得到候选图集。实验结果证明,该方法能准确地产生候选图集,从而提高图查询的效率。
关键词
相似
查询
图数据库
特征索引
特征图
过滤算法
Keywords
similarity query
graph database
feature index
feature graph
filtering algorithm
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于CHORD系统的多维相似查询处理方法
被引量:
1
13
作者
李智玲
机构
中国人民公安大学计算机物证
出处
《计算机系统应用》
2006年第4期37-40,44,共5页
文摘
如何在对等计算环境下处理多维空间中的相似查询是目前学术界的研究热点之一。本文通过基于代表点的多维空间划分策略,提出了一种对等计算环境下的分布式多维索引技术,实现了一种基于CHORD系统的多维相似查询处理。仿真实验证明了本文提出的方法的有效性。
关键词
对等计算
空间划分
索引
相似
查询
分类号
TP393.02 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于模糊数据模型的智能查询优化算法
14
作者
左利云
机构
茂名学院实验教学部
出处
《微型电脑应用》
2010年第5期9-10,13+72,共4页
基金
广东省科技计划项目(2007B010400042)
广东省自然科学基金(06029274)
+1 种基金
茂名市科技计划项目(20091009)
茂名学院基金项目(203492)
文摘
为实现对数据库信息查询时使用自然语言与计算机交流,提出了一种智能查询优化算法-IIOP算法;首创提出将模糊查询与相似查询结合的思想,其中模糊匹配查询更符合人脑思维特性,更合理有效;为提高查询效率,在进行查询时首先对原始数据序列提取能反映数据变化趋势的特征极值点,然后仅对特征极值点进行相似查询,极大减少了数据存储量,提高了查询计算速度。该算法经实验验证切实有效可行,相对其它算法能明显提高查询速度和准确率。
关键词
模糊
查询
相似
查询
特征极值点
Keywords
Fuzzy Query
Similar Query
Characteristics of Extreme Points
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
无线传感器网络多查询的节能优化
15
作者
申少辉
王晓明
机构
暨南大学计算机系
出处
《微型机与应用》
2011年第6期56-58,共3页
基金
国家自然科学基金(60773083)
广东省自然科学基金(8151063201000022)
文摘
提出了一个无线传感器网络多查询的节能优化方案。该方案通过建立相似查询判断算法把多查询中的相似查询分为一组,并在每一组找一个能使传输能耗达到最小的中继节点作为处理节点。组内节点的数据都传送到该处理节点,并由该节点利用数据处理函数处理数据,然后再传到基站。这样就减少了网络中数据的传输量,从而有效地节省了网络的能量,达到能量的最大化利用。
关键词
无线传感器网络
多
查询
相似
查询
处理节点
能量
Keywords
wireless sensor networks
multi-queries
similar to the query
relay node
energy
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
不确定集值数据的高效相似查询
16
作者
陈珂
洪银杰
陈刚
机构
浙江大学计算机科学与技术系
出处
《软件学报》
EI
CSCD
北大核心
2012年第6期1588-1601,共14页
基金
国家自然科学基金(60803003
60970124)
文摘
基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界的集合期望相似度的度量公式.在期望的度量公式中,如果一对集合(X,Y)的期望相似度大于给定的阈值(0,1),则被称为相似集合对.一般的算法,在基于可能世界的情况下计算不确定集合的期望相似度,其复杂度是指数级的.提出了利用动态规划来计算集合期望相似度的算法,该算法的复杂度是多项式级别,极大地减少了计算时间.实验结果表明了基于该算法查询的可用性和高性能.
关键词
相似
查询
期望
相似
度
动态规划
不确定集值
Keywords
similarity search
expected similarity
dynamic programming
uncertain set
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种多维向量并行查询算法
17
作者
黄海
侯颖
朱圣平
机构
解放军信息工程大学
出处
《微电子学与计算机》
CSCD
北大核心
2010年第8期17-19,共3页
基金
国家"八六三"计划项目(2008AA011001)
文摘
为了解决多维向量数据快速查询问题,在查询范围上限已知的条件下,通过对数据集合采用最近邻准则进行空间划分,构造一种多叉扩展平衡索引树,并设计了索引树的串行和并行查询算法.最后,对并行查询算法的性能进行了分析,测试结果验证了该方法的有效性.
关键词
多维索引结构
并行计算
相似
查询
Keywords
multi-dimensional search structure
parallel computing
similar query
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于B^+-tree索引的多元时间序列相似查询
18
作者
郭小芳
李锋
叶华
机构
江苏科技大学计算机科学与工程学院
江苏科技大学电子信息学院
出处
《计算机工程与应用》
CSCD
2013年第22期139-142,145,共5页
基金
江苏省高校自然科学研究项目(No.10JKB520006)
文摘
为提高多元时间序列相似查询执行效率,采用了基于距离索引结构的相似查询算法。利用主成分分析方法对多元时间序列数据降维并在此基础上进行聚类,以聚类质心为参考点,将各类变换到一维空间,利用B+-tree结构进行索引查询,找到与查询序列最相似的k个MTS序列。实验表明查询效率和准确性都有比较大的提高。
关键词
多元时间序列
主元分析
B+-tree索引
相似
查询
Keywords
Multivariate Time Series
Principal Component Analysis
B+-tree indexing
similarity search
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于B^+-tree索引的有效相似查询算法
19
作者
郭小芳
叶华
机构
江苏科技大学计算机科学与工程学院
江苏科技大学电子信息学院
出处
《西北师范大学学报(自然科学版)》
CAS
北大核心
2012年第4期33-37,共5页
基金
江苏省高校自然科学研究项目(10JKB520006)
文摘
提出了一种多元时间序列相似查询算法.在距离索引结构相似查询算法的基础上,利用主成分分析方法对多元时间序列进行降维,并对主成分进行聚类,在聚类质心与各类之间的范数所构成的一维空间上,对聚类建立B+-tree索引结构,然后利用k近邻查询算法查找出与查询序列最相似的k个MTS序列.实验结果表明,文中算法的候选比率与查询时间明显低于Muse算法,且候选比率与查询时间受聚类个数影响不大,说明文中算法具有一定的优越性.
关键词
多元时间序列
主元分析
B+-tree索引
相似
查询
Keywords
multivariate time series
principal component analysis
B+-tree index
similarity search
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于相似查询树的快速密文检索方法
被引量:
6
20
作者
田雪
朱晓杰
申培松
陈驰
邹洪
机构
信息安全国家重点实验室(中国科学院信息工程研究所)
广东电网有限责任公司信息中心
出处
《软件学报》
EI
CSCD
北大核心
2016年第6期1566-1576,共11页
基金
广东电网有限责任公司信息中心大数据环境下的数据安全研究项目(K-GD2014-1019)
中国科学院战略性先导科技专项(XDA06040601)
新疆维吾尔自治区科技专项(201230121)~~
文摘
随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查询树的密文检索方法(MRSE-SS).该方法通过设置聚类中心和成员之间的最大距离对文档向量进行聚类,并把中心向量看成n维超球体的球心,最大距离作为半径,再逐步将小聚类聚合成大聚类.使用该方法构建的密文文档集合,在查询阶段,仅需检索查询向量相邻的聚类即可获得理想的查询结果集合,从而提高了密文检索的效率.以《软件学报》最近10年的论文作为样本进行了实验,数据集中选取2 900篇文档和4 800个关键词.实验结果显示:当文档集个数呈指数增长时,检索时间仅呈线性增长,并且检索结果的关联性比传统检索方法更强.
关键词
云计算
密文检索
多关键字排序检索
相似
查询
树
云安全
Keywords
cloud computing
ciphertext search
multi-keyword ranked search
similarity search tree
cloud security
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
搜索引擎用户点击行为分析
王继民
彭波
《情报学报》
CSSCI
北大核心
2006
45
下载PDF
职称材料
2
一种高效的多变量时间序列相似查询算法
周大镯
吴晓丽
闫红灿
《计算机应用》
CSCD
北大核心
2008
16
下载PDF
职称材料
3
领域相关多媒体对象的基于内容查询
巩志国
周龙骧
董淑珍
《计算机学报》
EI
CSCD
北大核心
2002
4
下载PDF
职称材料
4
用基于移动均值的索引实现时间序列相似查询
林子雨
杨冬青
王腾蛟
《软件学报》
EI
CSCD
北大核心
2008
4
下载PDF
职称材料
5
基于空间关系的图像检索方法研究
王丽萍
邱飞岳
《计算机工程与应用》
CSCD
北大核心
2003
1
下载PDF
职称材料
6
人在回路的数据融合系统
孙佶
李国良
《计算机学报》
EI
CAS
CSCD
北大核心
2022
2
下载PDF
职称材料
7
一种面向相似查询的轨迹索引方法
王飞
庞悦
周向东
陈海波
《计算机应用与软件》
2017
3
下载PDF
职称材料
8
空间相似查询中MBR边界区域关系研究
闫实
王学良
《计算机系统应用》
2009
1
下载PDF
职称材料
9
基于相关反馈的微博相似主题时序查询
包红云
李秋丹
宋双永
高珩
《计算机科学》
CSCD
北大核心
2013
2
下载PDF
职称材料
10
基于历史点击数据的集合选择方法
刘颖
陈岭
陈根才
赵江奇
王敬昌
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2013
2
下载PDF
职称材料
11
基于小波变换的数据流快速索引的研究
杨颖
陈秋莲
杨磊
《计算机应用》
CSCD
北大核心
2006
0
下载PDF
职称材料
12
基于特征索引的图相似查询过滤算法
邹晓红
李甲
郭景峰
柴然
《计算机工程》
CAS
CSCD
北大核心
2011
0
下载PDF
职称材料
13
一种基于CHORD系统的多维相似查询处理方法
李智玲
《计算机系统应用》
2006
1
下载PDF
职称材料
14
基于模糊数据模型的智能查询优化算法
左利云
《微型电脑应用》
2010
0
下载PDF
职称材料
15
无线传感器网络多查询的节能优化
申少辉
王晓明
《微型机与应用》
2011
0
下载PDF
职称材料
16
不确定集值数据的高效相似查询
陈珂
洪银杰
陈刚
《软件学报》
EI
CSCD
北大核心
2012
0
下载PDF
职称材料
17
一种多维向量并行查询算法
黄海
侯颖
朱圣平
《微电子学与计算机》
CSCD
北大核心
2010
0
下载PDF
职称材料
18
基于B^+-tree索引的多元时间序列相似查询
郭小芳
李锋
叶华
《计算机工程与应用》
CSCD
2013
0
下载PDF
职称材料
19
一种基于B^+-tree索引的有效相似查询算法
郭小芳
叶华
《西北师范大学学报(自然科学版)》
CAS
北大核心
2012
0
下载PDF
职称材料
20
基于相似查询树的快速密文检索方法
田雪
朱晓杰
申培松
陈驰
邹洪
《软件学报》
EI
CSCD
北大核心
2016
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
5
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部