期刊文献+
共找到5,853篇文章
< 1 2 250 >
每页显示 20 50 100
离群点挖掘方法综述 被引量:69
1
作者 薛安荣 姚林 +2 位作者 鞠时光 陈伟鹤 马汉达 《计算机科学》 CSCD 北大核心 2008年第11期13-18,27,共7页
离群点挖掘可揭示稀有事件和现象、发现有趣的模式,有着广阔的应用前景,因此引起广泛关注。首先介绍离群点的定义、引起离群的原因和离群点挖掘算法的分类,对基于距离和基于密度的离群点挖掘算法进行了比较详细的讨论,指出了其优缺点和... 离群点挖掘可揭示稀有事件和现象、发现有趣的模式,有着广阔的应用前景,因此引起广泛关注。首先介绍离群点的定义、引起离群的原因和离群点挖掘算法的分类,对基于距离和基于密度的离群点挖掘算法进行了比较详细的讨论,指出了其优缺点和发展方向,重点对当前研究的热点——高维大数据量的挖掘、空间数据挖掘、时序离群点挖掘和离群点挖掘技术的应用进行了讨论,指出了进一步研究方向。 展开更多
关键词 离群点挖掘 局部离群点 子空间 剪枝 空间离群点 高维数据 数据流
下载PDF
Android手机访问服务器的一种数据交互方法 被引量:76
2
作者 刘平 《电子设计工程》 2010年第9期96-98,102,共4页
通过对Android手机访问Web服务器的API的分析和实践,提出了一种解决手机终端和Web服务器交互提取各种类型数据的清晰有效的方法,扩展了Android平台在访问Web服务器进行交互时的解析数据能力,给移动商务软件开发人员在开发数据交互实践... 通过对Android手机访问Web服务器的API的分析和实践,提出了一种解决手机终端和Web服务器交互提取各种类型数据的清晰有效的方法,扩展了Android平台在访问Web服务器进行交互时的解析数据能力,给移动商务软件开发人员在开发数据交互实践过程提供了参考。 展开更多
关键词 Android 手机终端 3G 数据流 过滤 SERVLET SSH架构 POST方法 GET方法 XML 数据
下载PDF
基于数据流的任意形状聚类算法 被引量:51
3
作者 朱蔚恒 印鉴 谢益煌 《软件学报》 EI CSCD 北大核心 2006年第3期379-387,共9页
详细分析了数据流聚类算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等,并针对这些不足之处提出了一种采用空间分割、组合以及按密度聚类的算法ACluStream.实验结果表明,ACluStream在准确度和... 详细分析了数据流聚类算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等,并针对这些不足之处提出了一种采用空间分割、组合以及按密度聚类的算法ACluStream.实验结果表明,ACluStream在准确度和速度上都比CluStream有较大的提高. 展开更多
关键词 数据流 聚类 数据挖掘
下载PDF
基于视频的改进帧差法在车流量检测中的应用 被引量:46
4
作者 张玲 陈丽敏 +1 位作者 何伟 郭磊民 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第5期31-33,73,共4页
如何有效去除背景、消除按车道开固定窗检测车辆的方法中,由于车辆换道或相邻车道的车辆部分覆盖了被检测车道检测窗而引起的误检,是车辆检测系统需要解决的一大难题。针对上述问题提出了一种基于视频的改进的帧差法,在检测带内由车辆... 如何有效去除背景、消除按车道开固定窗检测车辆的方法中,由于车辆换道或相邻车道的车辆部分覆盖了被检测车道检测窗而引起的误检,是车辆检测系统需要解决的一大难题。针对上述问题提出了一种基于视频的改进的帧差法,在检测带内由车辆信息生成数据流,根据数据流的变化进行车辆检测、计数并估计平均车速。从而实现对过往车辆的准确计数,更可靠地收集各车道的车流信息,为智能交通提供实时交通参数。 展开更多
关键词 视频 量检测 邻域比较 检测带 动态开窗 数据流
下载PDF
RFID复杂事件处理技术 被引量:54
5
作者 谷峪 于戈 张天成 《计算机科学与探索》 CSCD 2007年第3期255-267,共13页
随着RFID技术的发展,RFID应用正无所不在。通过对RFID数据的深入处理和分析,可以发现更复杂的复合事件和隐含知识,从而有效地支持事件监控、事件预警等先进应用。由于RFID的特殊性,依靠现有的主动数据库技术和数据流管理技术难以实现高... 随着RFID技术的发展,RFID应用正无所不在。通过对RFID数据的深入处理和分析,可以发现更复杂的复合事件和隐含知识,从而有效地支持事件监控、事件预警等先进应用。由于RFID的特殊性,依靠现有的主动数据库技术和数据流管理技术难以实现高效的RFID事件检测和处理。分析了RFID数据的特点,归纳和总结了RFID复杂事件处理的最新技术,讨论了一些亟待解决的新问题,主要有RFID数据清洗方法、以数据为中心的检测技术、以事件为中心的检测技术,以及复杂事件处理系统等,并对今后的研究重点进行了展望。 展开更多
关键词 事件处理 数据库技术 检测技术 中心 应用 隐含知识 事件预警 事件检测 事件监控 清洗方法 管理技术 复合事件 处理系统 新技术 数据流
下载PDF
面向对象软件回归测试技术研究 被引量:31
6
作者 方菲 孙家骕 +1 位作者 王立福 杨芙清 《软件学报》 EI CSCD 北大核心 2001年第3期372-376,共5页
回归测试的目标之一是在程序修改后 ,只对进行修改的部分重新测试 ,从而达到与完全测试相同的测试覆盖 .利用数据流或部分数据流技术 ,对结构化程序进行回归测试的技术已相继提出 .随着面向对象方法的逐渐成熟 ,对面向对象软件测试技术... 回归测试的目标之一是在程序修改后 ,只对进行修改的部分重新测试 ,从而达到与完全测试相同的测试覆盖 .利用数据流或部分数据流技术 ,对结构化程序进行回归测试的技术已相继提出 .随着面向对象方法的逐渐成熟 ,对面向对象软件测试技术的研究有了迫切的需求 .通过分析对象系统的特性 ,定义了对象之间的依赖关系 ,通过这个依赖关系 ,导出测试对象的方法序列 ,并应用程序切片技术 ,标识那些受到程序修改影响的测试用例 ,只有这些测试用例才需要在回归测试中重新执行 .最后给出了一完整的对象系统的回归测试解决方案 . 展开更多
关键词 面向对象 程序切片 数据流 回归测试 软件测试 软件开发
下载PDF
基于工作流引擎的构件组装体系结构 被引量:38
7
作者 李海波 战德臣 徐晓飞 《软件学报》 EI CSCD 北大核心 2006年第6期1401-1410,共10页
近年来,软件体系结构(SA)、基于构件的软件开发技术(CBSD)等开始在软件开发中发挥出重要的作用.CBSD应用的成功主要体现在自底向上构造系统的方法上.目前,对SA的研究还缺乏一种自顶向下的构件动态组装方法,尤其是过程构件的组装.以工作... 近年来,软件体系结构(SA)、基于构件的软件开发技术(CBSD)等开始在软件开发中发挥出重要的作用.CBSD应用的成功主要体现在自底向上构造系统的方法上.目前,对SA的研究还缺乏一种自顶向下的构件动态组装方法,尤其是过程构件的组装.以工作流技术为基础,以基于Web应用为背景,研究了基于工作流引擎的构件组装方法.从业务过程的基本要素——业务对象、控制流和数据流入手,详细分析了这些要素在构件环境下的特点和交互模式,并以此为基础提出了一种基于工作流的引擎的过程构件组装体系结构.该体系结构中除了考虑常规的控制流驱动的构件组装外,还深入研究了文档型的数据流驱动的构件组装机制,能够为其他研究者将文档型工作流技术应用于软件构件组装提供借鉴和参考. 展开更多
关键词 工作 工作引擎 构件组装 过程构件 控制 数据流
下载PDF
实时大数据处理技术在状态监测领域中的应用 被引量:55
8
作者 周国亮 朱永利 +1 位作者 王桂兰 宋亚奇 《电工技术学报》 EI CSCD 北大核心 2014年第S1期432-437,共6页
随着智能电网建设和研究的不断推进,对输变电设备状态监测的广度和深度不断加强,状态监测过程中收集的数据量呈指数级增长。然而,电力系统要求对生产、管理、运营能够实时监控,对在线监测系统的实时性要求很高。现有的大数据处理技术(如... 随着智能电网建设和研究的不断推进,对输变电设备状态监测的广度和深度不断加强,状态监测过程中收集的数据量呈指数级增长。然而,电力系统要求对生产、管理、运营能够实时监控,对在线监测系统的实时性要求很高。现有的大数据处理技术(如Map Reduce等适合离线大数据分析)应用于在线状态监测系统时,其性能很难保证。根据状态监测数据特点,利用Storm实时处理监测数据流,设计了数据流处理拓扑结构和消息树;利用Spark内存集群计算技术,提高状态评价和数据分析算法的性能,设计了k-means的聚类算法,实现数据的聚类划分。最后提出了结合大数据处理、实时流数据处理和内存批处理技术的状态监测数据实时分析框架。 展开更多
关键词 在线状态监测 数据流 内存批处理技术 实时分析框架
下载PDF
数据挖掘取样方法研究 被引量:54
9
作者 胡文瑜 孙志挥 吴英杰 《计算机研究与发展》 EI CSCD 北大核心 2011年第1期45-54,共10页
取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取... 取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取样算法分类框架.在指出了均匀取样局限性的基础上阐述了某些应用场景中选用偏倚取样方法的必要性,综述了取样技术在数据挖掘领域的应用研究与应用发展,最后对数据流挖掘取样方法面临的挑战和发展方向进行了展望. 展开更多
关键词 数据挖掘 均匀取样 偏倚取样 数据流 概要数据结构
下载PDF
数据归一化方法综述 被引量:49
10
作者 杨寒雨 赵晓永 王磊 《计算机工程与应用》 CSCD 北大核心 2023年第3期13-22,共10页
当今,人工智能已经广泛应用到各个领域中,并取得了显著的效果。数据归一化是人工智能应用落地中的一个重要环节,它有助于避免神经网络因数据量纲的复杂性对数据进行错误建模。在大数据场景下,相当一部分数据是以流的形式先后到达训练点... 当今,人工智能已经广泛应用到各个领域中,并取得了显著的效果。数据归一化是人工智能应用落地中的一个重要环节,它有助于避免神经网络因数据量纲的复杂性对数据进行错误建模。在大数据场景下,相当一部分数据是以流的形式先后到达训练点,所以在流场景下数据归一化研究是当前亟待解决的关键问题。目前关于归一化研究的综述较多,大多仅仅针对于批数据的归一化研究,而缺乏对流数据的归一化方法的总结,不具参考性。在批数据归一化研究基础之上,系统化整理并详尽分析了流数据归一化的相关文献,凝练提出了基于流数据的归一化分类方法,并将数据归一化方法划分为批数据的归一化方法和流数据的归一化方法。同时,对这些方法的原理、优势和可以解决的主要问题进行了对比分析,在不同场景下对数据归一化的未来研究方向进行了展望。 展开更多
关键词 归一化 数据流 深度学习 数据挖掘
下载PDF
数据流频繁模式挖掘研究进展 被引量:34
11
作者 潘云鹤 王金龙 徐从富 《自动化学报》 EI CSCD 北大核心 2006年第4期594-602,共9页
现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战.如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价值和实践意义,已经引... 现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战.如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价值和实践意义,已经引起了国内外研究者的广泛关注.本文深入分析数据流中的频繁模式挖掘,对其特点和算法进行较为全面的总结和分类论述,并讨论了存在的主要问题和未来的研究方向. 展开更多
关键词 数据挖掘 数据流 频繁模式 近似算法
下载PDF
流数据挖掘综述 被引量:36
12
作者 孙玉芬 卢炎生 《计算机科学》 CSCD 北大核心 2007年第1期1-5,11,共6页
作为一种新的数据形态,流数据对数据挖掘提出了诸多挑战。学者们已提出大量处理流数据的挖掘算法。本文对这些算法进行了综述。首先介绍了多个不同的数据流模型,这些模型对算法设计有着不同的要求。然后,总结了流数据挖掘算法的特点,并... 作为一种新的数据形态,流数据对数据挖掘提出了诸多挑战。学者们已提出大量处理流数据的挖掘算法。本文对这些算法进行了综述。首先介绍了多个不同的数据流模型,这些模型对算法设计有着不同的要求。然后,总结了流数据挖掘算法的特点,并给出了算法中常用的技术。最后,分析了各个流数据挖掘任务中的代表性算法。 展开更多
关键词 数据流 数据挖掘 时空复杂度 滑动窗口
下载PDF
大规模用电数据流的快速聚类和异常检测技术 被引量:51
13
作者 王桂兰 周国亮 +1 位作者 赵洪山 米增强 《电力系统自动化》 EI CSCD 北大核心 2016年第24期27-33,共7页
对近年来在电力系统中出现的大规模数据流进行了探讨,目的是利用流式计算技术提高系统的实时性和安全性。针对大规模用电信息采集中用电数据流的快速聚类和异常检测技术展开研究。结合分布式流式计算平台Spark Streaming,基于用电行为... 对近年来在电力系统中出现的大规模数据流进行了探讨,目的是利用流式计算技术提高系统的实时性和安全性。针对大规模用电信息采集中用电数据流的快速聚类和异常检测技术展开研究。结合分布式流式计算平台Spark Streaming,基于用电行为在纵向时间和横向空间上表现出的聚类特性,即同类用户具有相似用电模式和同一用户历史数据具有相似性,设计并实现了流式DBSCAN聚类算法,以实现对大规模用电数据流的快速异常检测。设计并搭建了支持大规模数据流处理的实验环境,证明了算法的有效性。 展开更多
关键词 数据流 聚类 异常检测 式计算 用电行为
下载PDF
挖掘数据流任意滑动时间窗口内频繁模式 被引量:45
14
作者 李国徽 陈辉 《软件学报》 EI CSCD 北大核心 2008年第10期2585-2596,共12页
由于数据流的流动性与连续性,数据流所蕴含的知识会随着时间的推移而发生变化.因此,在绝大多数数据流的应用中,用户往往对新产生的流数据所包含的知识要比对历史流数据所包含的知识感兴趣得多.提出了一种挖掘数据流任意大小滑动时间窗... 由于数据流的流动性与连续性,数据流所蕴含的知识会随着时间的推移而发生变化.因此,在绝大多数数据流的应用中,用户往往对新产生的流数据所包含的知识要比对历史流数据所包含的知识感兴趣得多.提出了一种挖掘数据流任意大小滑动时间窗口内频繁模式的方法MSW(mining sliding window).当数据流流过时,该方法使用滑动窗口树SW-tree在单遍扫描流数据的条件下及时捕获数据流上最新的模式信息.同时,该方法还周期性地删除滑动窗口树上过期的及不频繁的模式分支,从而降低滑动窗口树的空间复杂度与维护代价.此外,该方法还应用时间衰减模型逐步降低历史事务模式支持数的权重,并由此来区分最近产生事务与历史事务的模式.大量仿真实验的结果表明,算法MSS具有较高的效率与优良的可扩展性,同时也优于其他同类算法. 展开更多
关键词 数据流 频繁模式挖掘 滑动时间窗口 时间衰减模型
下载PDF
分布式流处理技术综述 被引量:50
15
作者 崔星灿 禹晓辉 +1 位作者 刘洋 吕朝阳 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期318-332,共15页
随着计算机和网络技术的迅猛发展以及数据获取手段的不断丰富,在越来越多的领域出现了对海量、高速数据进行实时处理的需求.由于此类需求往往超出传统数据处理技术的能力,分布式流处理模式应运而生.首先回顾分布式流处理技术产生的背景... 随着计算机和网络技术的迅猛发展以及数据获取手段的不断丰富,在越来越多的领域出现了对海量、高速数据进行实时处理的需求.由于此类需求往往超出传统数据处理技术的能力,分布式流处理模式应运而生.首先回顾分布式流处理技术产生的背景以及技术演进过程,然后将其与其他相关大数据处理技术进行对比,以界定分布式流数据处理的外延.进而对分布式流处理所需要考虑的数据模型、系统模型、存储管理、语义保障、负载控制、系统容错等主要问题进行深入分析,指出现有解决方案的优势和不足.随后,介绍S4,Storm,Spark Streaming等几种具有代表性的分布式流处理系统,并对它们进行系统地对比.最后,给出分布式流处理在社交媒体处理等领域的几种典型应用,并探讨分布式流处理领域进一步的研究方向. 展开更多
关键词 数据 数据流 分布式处理 实时处理 分布式系统
下载PDF
数据流挖掘分类技术综述 被引量:41
16
作者 王涛 李舟军 +1 位作者 颜跃进 陈火旺 《计算机研究与发展》 EI CSCD 北大核心 2007年第11期1809-1815,共7页
数据流挖掘作为从连续不断的数据流中挖掘有用信息的技术,近年来正成为数据挖掘领域的研究热点,并有着广泛的应用前景.数据流具有数据持续到达、到达速度快、数据规模巨大等特点,因此需要新颖的算法来解决这些问题.而数据流挖掘的分类... 数据流挖掘作为从连续不断的数据流中挖掘有用信息的技术,近年来正成为数据挖掘领域的研究热点,并有着广泛的应用前景.数据流具有数据持续到达、到达速度快、数据规模巨大等特点,因此需要新颖的算法来解决这些问题.而数据流挖掘的分类技术更是当前的研究热点.综述了当前国际上关于数据流挖掘分类算法的研究现状,并从数据平稳分布和带概念漂移两个方面对这些方法进行了系统的介绍与分析,最后对数据流挖掘分类技术当前所面临的问题和发展趋势进行了总结和展望. 展开更多
关键词 数据流 挖掘 分类 稳态分布 概念漂移
下载PDF
数据流挖掘算法研究综述 被引量:21
17
作者 蒋盛益 李庆华 李新 《计算机工程与设计》 CSCD 北大核心 2005年第5期1130-1132,1169,共4页
流数据挖掘是数据挖掘的一个新的研究方向,已逐渐成为许多领域的有用工具。在介绍数据流的基本特点以及数据流挖掘的意义的基础上,对现有数据流挖掘算法的主要思想方法进行了总结,并指出了这些方法的局限性。最后对数据流挖掘的发展方... 流数据挖掘是数据挖掘的一个新的研究方向,已逐渐成为许多领域的有用工具。在介绍数据流的基本特点以及数据流挖掘的意义的基础上,对现有数据流挖掘算法的主要思想方法进行了总结,并指出了这些方法的局限性。最后对数据流挖掘的发展方向进行了展望。 展开更多
关键词 数据流 挖掘算法 聚类 分类 频繁模式
下载PDF
挖掘数据流中的频繁模式 被引量:25
18
作者 刘学军 徐宏炳 +2 位作者 董逸生 王永利 钱江波 《计算机研究与发展》 EI CSCD 北大核心 2005年第12期2192-2198,共7页
发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·... 发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘·通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε·分析和实验表明算法有较好的性能· 展开更多
关键词 数据流 频繁模式 FP—DS算法 数据挖掘
下载PDF
一种有效的挖掘数据流近似频繁项算法 被引量:33
19
作者 王伟平 李建中 +1 位作者 张冬冬 郭龙江 《软件学报》 EI CSCD 北大核心 2007年第4期884-892,共9页
数据流频繁项是指在数据流中出现频率超出指定阈值的数据项.查找数据流频繁项在网络故障监测、流数据分析以及流数据挖掘等多个领域有着广泛的应用.在数据流模型下,算法只能一遍扫描数据,并且可用的存储空间远远小于数据流的规模,因此,... 数据流频繁项是指在数据流中出现频率超出指定阈值的数据项.查找数据流频繁项在网络故障监测、流数据分析以及流数据挖掘等多个领域有着广泛的应用.在数据流模型下,算法只能一遍扫描数据,并且可用的存储空间远远小于数据流的规模,因此,挖掘出所有准确的数据流频繁项通常是不可能的.提出一种新的挖掘数据流近似频繁项的算法.该算法的空间复杂性为O(ε^(-1)),每个数据项的平均处理时间为O(1),输出结果的频率误差界限为ε(1-s+ε)N,在目前已有的同类算法中均为最优. 展开更多
关键词 数据流 数据挖掘 频繁项 ε-近似
下载PDF
基于负载感知的数据流动态负载均衡策略 被引量:41
20
作者 李梓杨 于炯 +2 位作者 卞琛 王跃飞 鲁亮 《计算机应用》 CSCD 北大核心 2017年第10期2760-2766,2772,共8页
针对大数据流式计算平台中存在节点间负载不均衡、节点性能评估不全面的问题,提出基于负载感知算法的动态负载均衡策略,并将算法应用于Flink数据流计算平台中。首先通过有向无环图的深度优先搜索算法获取节点的计算延迟时间作为评估节... 针对大数据流式计算平台中存在节点间负载不均衡、节点性能评估不全面的问题,提出基于负载感知算法的动态负载均衡策略,并将算法应用于Flink数据流计算平台中。首先通过有向无环图的深度优先搜索算法获取节点的计算延迟时间作为评估节点性能的依据,并制定负载均衡策略;然后基于数据分块管理策略实现流式数据的节点间负载迁移技术,通过反馈实现全局和局部的负载调优;最后通过实验评估时空代价论证算法的可行性,并讨论重要参数对算法执行效果的影响。经实验验证算法通过优化流式计算任务的负载分配提高了任务的执行效率,与采用Flink平台现有的负载均衡策略相比,任务执行时间平均缩短6.51%。 展开更多
关键词 数据流 负载均衡 深度优先搜索 负载感知 APACHE Flink
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部