期刊文献+
共找到338篇文章
< 1 2 17 >
每页显示 20 50 100
时间序列数据挖掘综述 被引量:77
1
作者 贾澎涛 何华灿 +1 位作者 刘丽 孙涛 《计算机应用研究》 CSCD 北大核心 2007年第11期15-18,29,共5页
在综合分析近年来时间序列数据挖掘相关文献的基础上,讨论了时间序列数据挖掘的最新进展,对各种学术观点进行了比较归类,并预测了其发展趋势。内容涵盖了时间序列数据变换、相似性搜索、预测、分类、聚类、分割、可视化等方面,为研究者... 在综合分析近年来时间序列数据挖掘相关文献的基础上,讨论了时间序列数据挖掘的最新进展,对各种学术观点进行了比较归类,并预测了其发展趋势。内容涵盖了时间序列数据变换、相似性搜索、预测、分类、聚类、分割、可视化等方面,为研究者了解最新的时间序列数据挖掘研究动态、新技术及发展趋势提供了参考。 展开更多
关键词 时间序列 数据挖掘 相似性搜索 模式发现
下载PDF
基于形态表示的时间序列相似性搜索 被引量:34
2
作者 蒋嵘 李德毅 《计算机研究与发展》 EI CSCD 北大核心 2000年第5期601-608,共8页
时间序列是一类重要的复杂数据 ,时间序列知识发现正成为知识发现的研究热点之一 ,时间序列的相似性搜索是时间序列知识发现的重要方面 .提出一种新的基于形态表示的时间序列相似性搜索机制 .该机制采用逐段线性化技术 ,将复杂的时间序... 时间序列是一类重要的复杂数据 ,时间序列知识发现正成为知识发现的研究热点之一 ,时间序列的相似性搜索是时间序列知识发现的重要方面 .提出一种新的基于形态表示的时间序列相似性搜索机制 .该机制采用逐段线性化技术 ,将复杂的时间序列曲线简化为多个直线段 .同时 ,结合时间序列的符号表示思想 ,构造了基于云模型的形态概念树 ,提出了时间序列的形态描述方法——基于云模型的时间序列表示法 ,并在此基础上采用增强动态编程算法实现了时间序列的相似性搜索 . 展开更多
关键词 知识发现 时间序列 相似性搜索 形态表示
下载PDF
计算机视觉中的图像匹配综述 被引量:22
3
作者 熊凌 《湖北工业大学学报》 2006年第3期171-173,共3页
介绍了图像的变换模型、图像匹配的三要素及图像匹配性能评价指标,分析常用匹配方法的优点和不足之处,探讨了图像匹配中有待进一步研究和解决的问题.
关键词 图像匹配 图像变换 特征空间 相似性度量 搜索策略
下载PDF
一种支持DTW距离的多元时间序列索引结构 被引量:39
4
作者 李正欣 张凤鸣 +1 位作者 李克武 张晓丰 《软件学报》 EI CSCD 北大核心 2014年第3期560-575,共16页
现有的索引结构难以有效地支持DTW距离度量下的多元时间序列相似性搜索.首先给出一种将不等长多元时间序列转换为等长一元时间序列的方法,并证明这种转换满足下界距离引理;以此为基础,提出一种多元时间序列的DTW下界距离,并对其性质进... 现有的索引结构难以有效地支持DTW距离度量下的多元时间序列相似性搜索.首先给出一种将不等长多元时间序列转换为等长一元时间序列的方法,并证明这种转换满足下界距离引理;以此为基础,提出一种多元时间序列的DTW下界距离,并对其性质进行分析;然后,针对给出的下界距离,提出一种支持DTW距离度量的多元时间序列索引结构,对多元时间序列数据库进行有效组织;再给出多元时间序列相似模式搜索算法及流程,并证明该搜索方法具有非漏报性;最后,通过实验对所提方法的有效性进行验证. 展开更多
关键词 多元时间序列 动态时间弯曲 下界距离 索引结构 相似性搜索
下载PDF
基于本体的概念语义相似度计算及其应用 被引量:31
5
作者 陈沈焰 吴军华 《微电子学与计算机》 CSCD 北大核心 2008年第12期96-99,共4页
概念的语义相似度计算是自然语言处理研究的重要组成部分,也是人工智能应用中亟待解决的问题.本体作为共享概念模型的明确的形式化的规范说明,给概念语义相似度的计算带来了新的生机,从而提出了一种基于本体的计算概念间语义相似度的方... 概念的语义相似度计算是自然语言处理研究的重要组成部分,也是人工智能应用中亟待解决的问题.本体作为共享概念模型的明确的形式化的规范说明,给概念语义相似度的计算带来了新的生机,从而提出了一种基于本体的计算概念间语义相似度的方法,综合考虑了语义距离、节点深度和节点密度的影响,并加入了一个可调节的参数,以适应不同场景下的灵活应用,最后简单介绍了语义相似度在搜索引擎领域的应用. 展开更多
关键词 本体 语义相似度 搜索引擎 概念扩充
下载PDF
一种有效的量化交易数据相似性搜索方法 被引量:26
6
作者 杨风召 朱扬勇 《计算机研究与发展》 EI CSCD 北大核心 2004年第2期361-368,共8页
量化交易数据与一般交易数据的不同之处在于它在各个维上的值是数值型而不是二值型的 研究这种数据的有效的相似性搜索方法是一个重要而具有挑战性的课题 提出了一个新的相似性度量函数Hsim() ,这个度量函数可以较好地克服Lp 等传统的... 量化交易数据与一般交易数据的不同之处在于它在各个维上的值是数值型而不是二值型的 研究这种数据的有效的相似性搜索方法是一个重要而具有挑战性的课题 提出了一个新的相似性度量函数Hsim() ,这个度量函数可以较好地克服Lp 等传统的距离函数在高维空间中的缺点 ,并能将二值型和数值型数据距离的计算整合到一个统一的框架中去 结合量化交易数据的特点 ,构造了定义在该函数上的相似性索引结构 ,并对建立在该索引结构上的相似性查询方法进行了阐述 实验表明 ,这种搜索方法对量化交易数据的相似性搜索有较高的修剪率 。 展开更多
关键词 相似性搜索 高维数据 距离函数 量化交易数据 索引结构
下载PDF
基于语义的网络大数据组织与搜索 被引量:29
7
作者 吴纯青 任沛阁 王小峰 《计算机学报》 EI CSCD 北大核心 2015年第1期1-17,共17页
随着信息技术的飞速发展,网络空间中出现海量异构的数据资源,网络大数据逐渐引起了人们的关注.从网络大数据中发现并获取用户所需的数据资源,需要对网络大数据进行有效地组织管理并进行基于数据语义的相似搜索.为此,需要从网络数据资源... 随着信息技术的飞速发展,网络空间中出现海量异构的数据资源,网络大数据逐渐引起了人们的关注.从网络大数据中发现并获取用户所需的数据资源,需要对网络大数据进行有效地组织管理并进行基于数据语义的相似搜索.为此,需要从网络数据资源中抽取其特征/属性构造高维语义空间,并将数据资源及用户查询信息抽象为语义空间中的特征向量或高维点,进而通过比较特征向量间夹角余弦值或高维点之间的距离来衡量语义相似性.高维索引技术可以对高维语义空间中的数据资源进行有效组织管理,实现基于数据语义的相似性搜索;而降维技术可以消除语义空间维数过高所引发的"维灾"影响.文中对现有的高维数据索引及降维技术进行了系统的综述,然后介绍了现有的基于分布式技术实现高维数据语义相似性搜索的研究工作,最后并展望了未来工作. 展开更多
关键词 语义空间 高维索引 降维 相似性查询 P2P 大数据
下载PDF
基于最小二乘支持向量机的系统边际电价预测 被引量:20
8
作者 贾嵘 蔡振华 康睿 《高电压技术》 EI CAS CSCD 北大核心 2006年第11期145-148,共4页
系统边际电价是电力工业改革的关键因素之一,是电力市场的杠杆和核心内容。为克服神经网络预测法易陷入局部极小,隐层数不易确定,训练速度慢等问题,提出一种基于相似搜索和最小二乘支持向量机的系统边际电价预测方法,该方法对相似搜索... 系统边际电价是电力工业改革的关键因素之一,是电力市场的杠杆和核心内容。为克服神经网络预测法易陷入局部极小,隐层数不易确定,训练速度慢等问题,提出一种基于相似搜索和最小二乘支持向量机的系统边际电价预测方法,该方法对相似搜索得到的相似日的负荷—电价数据用最小二乘支持向量机建立电价预测模型,同时利用网格搜索和交叉验证自动选取最小二乘支持向量机相关参数。用美国加州电力市场的真实数据做实例验证结果表明该方法可有效提高预测精度。 展开更多
关键词 系统边际电价 电价预测 相似搜索 最小二乘支持向量机 网格搜索 交叉验证
下载PDF
时态数据挖掘研究进展 被引量:15
9
作者 张保稳 何华灿 《计算机科学》 CSCD 北大核心 2002年第2期124-126,103,共4页
在现实生活中,大量数据集之中的数据都带有时间特征.时态数据随处可见,遍及经济、气象、通信、医疗等等多个领域.股市每日(或月)指数、交换机的每小时的业务量、某一患者的脑电波和Web页的日访问量,这些都是比较常见的例子.对这些时态... 在现实生活中,大量数据集之中的数据都带有时间特征.时态数据随处可见,遍及经济、气象、通信、医疗等等多个领域.股市每日(或月)指数、交换机的每小时的业务量、某一患者的脑电波和Web页的日访问量,这些都是比较常见的例子.对这些时态数据进行分析,从中获取蕴含的系统演化规律,从而完成对系统的未来行为的预测,具有重要的价值和意义. 展开更多
关键词 时态数据挖掘 知识发现 数据库 数据挖掘 关联规则
下载PDF
大规模时间序列数据库降维及相似搜索 被引量:20
10
作者 李爱国 覃征 《计算机学报》 EI CSCD 北大核心 2005年第9期1467-1475,共9页
提出一种基于分段多项式表示(PPR)的时间序列数据库相似查询的系统化方法.PPR是一类基于线性多项式回归的正交变换.用PPR变换索引时间序列数据在理论上具备非漏报性质.文中分析了PPR的计算复杂性以及查询阈值的下界,并提出了一种衡量时... 提出一种基于分段多项式表示(PPR)的时间序列数据库相似查询的系统化方法.PPR是一类基于线性多项式回归的正交变换.用PPR变换索引时间序列数据在理论上具备非漏报性质.文中分析了PPR的计算复杂性以及查询阈值的下界,并提出了一种衡量时间序列相似查询算法之查询效率的定量指标.与基于离散傅立叶变换(DFT)和离散小波变换(DWT)的时间序列相似查询算法所作的对比实验表明,所提算法可以用低的索引结构维数获得高的查询效率. 展开更多
关键词 数据库 时间序列 相似搜索 数据挖掘 查询
下载PDF
药物重定位——网络药理学的重要应用领域 被引量:24
11
作者 张永祥 程肖蕊 周文霞 《中国药理学与毒理学杂志》 CAS CSCD 北大核心 2012年第6期779-786,共8页
药物重定位是指发现已上市药物的新适应症,是网络药理学的重要应用领域。药物重定位策略是目前已知的药物研发策略中风险与效益比最好的策略之一,也是一种解决新药开发高投入低成功率困境的有效方法之一。目前已成功进行重定位的药物已... 药物重定位是指发现已上市药物的新适应症,是网络药理学的重要应用领域。药物重定位策略是目前已知的药物研发策略中风险与效益比最好的策略之一,也是一种解决新药开发高投入低成功率困境的有效方法之一。目前已成功进行重定位的药物已超过百余种(国内有老药新用专著收载123种),药物重定位研究已超越了随机发现药物新适应症的阶段,进入了基于计算机技术的崭新研究阶段。现有研究方法主要有基于小分子(或配体)特征的方法、基于蛋白靶点(或受体)特征的方法、基于表型(或网络)特征的方法。随着对防治重大疾病有效药物需求的不断增加,以及系统生物学、计算生物学、网络药理学等相关学科的快速发展,面对新药研发难度越来越大的严峻形势,药物重定位已成为世界范围内关注的热点,在药物研发领域占据重要地位。 展开更多
关键词 药物重定位 网络药理学 相似性扰动 相似性搜索
下载PDF
基于知识图谱与语义计算的智能信息搜索技术研究 被引量:23
12
作者 高龙 张涵初 杨亮 《情报理论与实践》 CSSCI 北大核心 2018年第7期42-47,共6页
面向信息搜索的智能需求,分析智能信息搜索的特征,研究面向应用领域表征的知识图谱构建,提出一种带约束的语义相似模型和隐性反馈修正机制,探索特定条件下智能信息搜索的实现途径。通过地理环境应用领域的原型实验数据分析,发现基于知... 面向信息搜索的智能需求,分析智能信息搜索的特征,研究面向应用领域表征的知识图谱构建,提出一种带约束的语义相似模型和隐性反馈修正机制,探索特定条件下智能信息搜索的实现途径。通过地理环境应用领域的原型实验数据分析,发现基于知识图谱与语义计算的信息搜索准确率可达85%,具有较强的实用性,可为垂直搜索应用领域的技术优化提供参考思路。 展开更多
关键词 知识图谱 语义相似 隐性反馈 信息搜索 语义计算 智能信息搜索
原文传递
基于化学信息学方法预测药物靶点的研究进展 被引量:22
13
作者 方坚松 刘艾林 杜冠华 《药学学报》 CAS CSCD 北大核心 2014年第10期1357-1364,共8页
网络药理学与多向药理学等新兴学科的出现迫使科学家们重新认识与探索已有药物新的作用机制。药物靶点的预测对阐释药物分子作用机制和老药新用等领域都具有重大意义。本文结合近年来国内外多个课题组的研究成果,主要综述了当前几种基... 网络药理学与多向药理学等新兴学科的出现迫使科学家们重新认识与探索已有药物新的作用机制。药物靶点的预测对阐释药物分子作用机制和老药新用等领域都具有重大意义。本文结合近年来国内外多个课题组的研究成果,主要综述了当前几种基于化学信息学方法预测小分子潜在靶点的方法,包括基于配体结构特征的预测方法、基于蛋白结构特征的预测方法以及基于数据挖掘技术的预测方法,通过应用实例,说明这些方法的优势,并提出今后的发展方向。 展开更多
关键词 化学信息学 靶点预测 数据挖掘 相似性搜索
原文传递
基于搜索引擎的词汇语义相似度计算方法 被引量:21
14
作者 陈海燕 《计算机科学》 CSCD 北大核心 2015年第1期261-267,共7页
词汇语义相似度的计算在网页浏览和查询推荐等网络相关工作中起着重要的作用。传统的基于分类的方法不能处理持续出现的新词。由于网络数据中隐藏着大量的噪音和冗余,鲁棒性和准确性仍然是一个挑战,因此提出了一种基于搜索引擎的词汇语... 词汇语义相似度的计算在网页浏览和查询推荐等网络相关工作中起着重要的作用。传统的基于分类的方法不能处理持续出现的新词。由于网络数据中隐藏着大量的噪音和冗余,鲁棒性和准确性仍然是一个挑战,因此提出了一种基于搜索引擎的词汇语义相似度计算方法。语义片段和检索结果的页数被用来去除词汇语义相似度计算过程中的噪音和冗余。此外,还提出了一种方法来整合查询结果页数、语义片段和显示的搜索结果的数量,该方法不需要任何先验知识与本体。实验结果显示,所提出的方法在Rubenstein-Goodenough测试集的相关系数为0.851,优于现有的基于网络的词汇语义相似度计算方法,同时在搜索引擎的查询扩展任务中具有较为良好的应用效果。 展开更多
关键词 语义相似度 信息检索 查询建议 网络检索
下载PDF
基于相似搜索和加权回归技术的短期电价预测 被引量:8
15
作者 李邦云 袁贵川 丁晓群 《电力自动化设备》 EI CSCD 北大核心 2004年第1期42-45,共4页
在电力市场环境下,进行准确的电价预测对市场中的各参与者有极其重要的意义。提出一种基于数据挖掘中的相似搜索技术和加权回归技术的短期电价预测方法,该方法简单、方便,对临近日和相似搜索所得到的相似日的负荷-电价数据用加权回归进... 在电力市场环境下,进行准确的电价预测对市场中的各参与者有极其重要的意义。提出一种基于数据挖掘中的相似搜索技术和加权回归技术的短期电价预测方法,该方法简单、方便,对临近日和相似搜索所得到的相似日的负荷-电价数据用加权回归进行电价预测。最后用美国加州电能交易所(CalPX)公布的真实数据得到的预测结果验证了该方法的有效性。 展开更多
关键词 电力市场 电价预测 相似搜索 数据挖掘
下载PDF
时间序列相似性搜索算法研究 被引量:11
16
作者 杨敏 王志坚 尹燕敏 《山东师范大学学报(自然科学版)》 CAS 2001年第4期373-377,共5页
时间序列分析正成为数据挖掘研究的热点 ,时间序列的相似性搜索是时间序列研究的重要方面 .介绍了时间序列相似性搜索研究的现状 ,详细分析了两类具有代表性的时间序列相似性搜索算法及各自特点 .
关键词 相似性搜索 时间序列 数据挖掘
下载PDF
基于形状特征k-d树的多维时间序列相似搜索 被引量:11
17
作者 黄河 史忠植 郑征 《软件学报》 EI CSCD 北大核心 2006年第10期2048-2056,共9页
多维时间序列是信息系统中一类重要的数据对象,相似搜索是其应用的一个核心.两个序列(子序列)相似度加以比较的常用方法是:将序列(子序列)转换成空间中的曲线,然后计算曲线间的欧几里德距离.这种方法的主要缺陷是它仅考虑了序列(子序列... 多维时间序列是信息系统中一类重要的数据对象,相似搜索是其应用的一个核心.两个序列(子序列)相似度加以比较的常用方法是:将序列(子序列)转换成空间中的曲线,然后计算曲线间的欧几里德距离.这种方法的主要缺陷是它仅考虑了序列(子序列)间的整体距离关系,而不能体现它们自身的局部变化.针对此问题,提出了一种新的可应用于多维时间序列的快速相似搜索方法.该方法将序列(子序列)的局部变化特性与检索结构(k-d树)结合起来,使得在搜索k-d树的同时实现了序列(子序列)的局部变化匹配,从而极大地提高了查询效率和正确率.实验结果表明了算法的有效性. 展开更多
关键词 时间序列 相似搜索 欧氏距离 检索结构 K-D树
下载PDF
基于领域本体和Lucene的语义检索系统研究 被引量:20
18
作者 王欢 孙瑞志 《计算机应用》 CSCD 北大核心 2010年第6期1655-1657,1660,共4页
语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系... 语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系统,该系统对提交的关键词组进行查询扩展后,将扩展关键词组导入文本检索引擎Lucene中,并把语义相似度作为检索结果排序算法的关键因素。实验结果表明,该语义相似度模型得出的相似度值更加接近专家经验值,系统的查询准确率与未加入查询扩展的Lucene系统相比有较大的提高。 展开更多
关键词 查询扩展 本体 LUCENE 语义相似度 语义检索
下载PDF
一种高效的多变量时间序列相似查询算法 被引量:16
19
作者 周大镯 吴晓丽 闫红灿 《计算机应用》 CSCD 北大核心 2008年第10期2541-2543,2552,共4页
为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+-... 为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+-树结构进行索引查询;MTS序列比较相似采用的是扩展的Frobenius范数(Eros)。通过对股票数据集实验验证了Dbis算法的高效性。 展开更多
关键词 多变量时间序列 聚类 相似查询
下载PDF
融合《知网》和搜索引擎的词汇语义相似度计算 被引量:16
20
作者 张硕望 欧阳纯萍 +2 位作者 阳小华 刘永彬 刘志明 《计算机应用》 CSCD 北大核心 2017年第4期1056-1060,共5页
针对当前《知网》的词语语义描述与人们对词汇的主观认知之间存在诸多不匹配的问题,在充分利用丰富的网络知识的背景下,提出了一种融合《知网》和搜索引擎的词汇语义相似度计算方法。首先,考虑了词语与词语义原之间的包含关系,利用改进... 针对当前《知网》的词语语义描述与人们对词汇的主观认知之间存在诸多不匹配的问题,在充分利用丰富的网络知识的背景下,提出了一种融合《知网》和搜索引擎的词汇语义相似度计算方法。首先,考虑了词语与词语义原之间的包含关系,利用改进的概念相似度计算方法得到初步的词语语义相似度结果;然后,利用基于搜索引擎的相关性双重检测算法和点互信息法得出进一步的语义相似度结果;最后,设计了拟合函数并利用批量梯度下降法学习权值参数,融合前两步的相似度计算结果。实验结果表明,与单纯的基于《知网》和基于搜索引擎的改进方法相比,融合方法的斯皮尔曼系数和皮尔逊系数均提升了5%,同时提升了具体词语义描述与人们对词汇的主观认知之间的匹配度,验证了将网络知识背景融入到概念相似度计算方法中能有效提高中文词汇语义相似度的计算性能。 展开更多
关键词 语义相似度 知网 搜索引擎 权重 网络
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部