期刊文献+
共找到154篇文章
< 1 2 8 >
每页显示 20 50 100
大规模配电网负荷数据在线清洗与修复方法研究 被引量:49
1
作者 刁赢龙 盛万兴 +2 位作者 刘科研 何开元 孟晓丽 《电网技术》 EI CSCD 北大核心 2015年第11期3134-3140,共7页
为减少数据缓存成本,提高负荷数据在配电网规划设计、智能分析等领域的可用性,充分有效地对大规模、混杂、不精确的监测或采集负荷数据进行在线清洗,保证每个周期的时序数据得到一致的偏差检测和精确修复,在分析不同类型异常负荷数据产... 为减少数据缓存成本,提高负荷数据在配电网规划设计、智能分析等领域的可用性,充分有效地对大规模、混杂、不精确的监测或采集负荷数据进行在线清洗,保证每个周期的时序数据得到一致的偏差检测和精确修复,在分析不同类型异常负荷数据产生原因和分布特点的基础上,提出一种面向大规模配电网负荷数据的在线清洗与修复方法,包括基于密度的负荷数据流异常辨识方法和基于协同过滤推荐算法的负荷数据修复方法。为突破配电网负荷大数据在线分析性能瓶颈,还在Hadoop平台上给出相应的分布式并行解决方案,通过使用实际配电网运行中的负荷数据进行验证,结果表明所提算法和框架能够有效预处理配电网负荷数据,具有实际应用价值。 展开更多
关键词 数据清洗 流数据 大规模配电网 在线清洗
下载PDF
基于长短期记忆网络和滑动窗口的流数据异常检测方法 被引量:23
2
作者 仇媛 常相茂 +2 位作者 仇倩 彭程 苏善婷 《计算机应用》 CSCD 北大核心 2020年第5期1335-1339,共5页
针对目前流数据存在数量巨大、生成迅速和概念漂移的特点,提出了一种基于长短期记忆(LSTM)网络和滑动窗口的流数据异常检测方法。首先采用LSTM网络进行数据预测,之后计算预测值与实际值的差值。对于每个数据,选择合适的滑动窗口,将滑动... 针对目前流数据存在数量巨大、生成迅速和概念漂移的特点,提出了一种基于长短期记忆(LSTM)网络和滑动窗口的流数据异常检测方法。首先采用LSTM网络进行数据预测,之后计算预测值与实际值的差值。对于每个数据,选择合适的滑动窗口,将滑动窗口区间内的所有差值进行分布建模,再根据每个差值在当前分布的概率密度来计算数据异常可能性。LSTM网络不仅可以进行数据预测,还可以边预测边学习,实时更新调整网络,保证模型的有效性;而利用滑动窗口可以使得异常分数的分配更为合理。最后使用在真实数据基础上制造的模拟数据进行了实验。实验结果验证了所提方法在低噪声环境下比直接利用差值进行检测和异常数据分布建模法(ADM)方法的平均曲线下面积(AUC)值分别提高了0.187和0.05。 展开更多
关键词 流数据 异常检测 滑动窗口 长短期记忆网络 神经网络
下载PDF
流数据概念漂移的检测算法 被引量:16
3
作者 张杰 赵峰 《控制与决策》 EI CSCD 北大核心 2013年第1期29-35,共7页
鉴于流数据具有实时、连续、有序和无限等特点,使用近似方法便可检测连续分时段的流数据序列,基于此,运用目标分布数据,结合相似分布理论,提出了利用Tr-OEM算法对流数据中的概念漂移现象进行检测.该算法能够动态地判断流数据概念漂移的... 鉴于流数据具有实时、连续、有序和无限等特点,使用近似方法便可检测连续分时段的流数据序列,基于此,运用目标分布数据,结合相似分布理论,提出了利用Tr-OEM算法对流数据中的概念漂移现象进行检测.该算法能够动态地判断流数据概念漂移的发生,自适应地优化概念漂移的检测值,适用于不同类型的流数据.通过分析和实验仿真可以表明,该算法在处理流数据概念漂移时具有较好的适应性. 展开更多
关键词 流数据 概念漂移 检测 数据挖掘
原文传递
面向流数据的决策树分类算法并行化 被引量:16
4
作者 季一木 张永潘 +2 位作者 郎贤波 张殿超 王汝传 《计算机研究与发展》 EI CSCD 北大核心 2017年第9期1945-1957,共13页
随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于电信、互联网、金融等领域.与传统静态数据相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.同时数据流的隐含分布变化会带来概念漂移问题.为了... 随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于电信、互联网、金融等领域.与传统静态数据相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.同时数据流的隐含分布变化会带来概念漂移问题.为了适应大数据环境下流数据分类算法的要求,必须对传统的静态离线数据分类算法进行改进,提出基于分布式计算平台Storm的P-HT并行化算法.算法在满足Storm流处理平台要求基础上,通过滑动窗口机制、替代子树机制和并行化处理,提高了算法的灵活性和通用性,并且能良好地适应数据流的概念漂移.最后通过实验验证该算法的有效性和高效性,结果表明在与传统C4.5算法相比精度没有降低的情况下,改进的P-HT算法具有更大的吞吐量和更快的处理速度. 展开更多
关键词 流数据 分类算法 Storm平台 滑动窗口 C4.5算法 并行化算法
下载PDF
大数据结构化与数据驱动的复杂系统维修决策 被引量:11
5
作者 韩中 程林 +1 位作者 熊金泉 刘满君 《自动化学报》 EI CSCD 北大核心 2020年第2期385-396,共12页
现代大型机电系统组成结构越来越复杂、智能化程度越来越高,然而系统维修工作却越来越困难;另外,尽管快速发展的信息技术使得系统内部的各种流数据得到了有效的保存,但却缺乏对这类大数据的有效利用、实现复杂系统的维修控制与决策.为此... 现代大型机电系统组成结构越来越复杂、智能化程度越来越高,然而系统维修工作却越来越困难;另外,尽管快速发展的信息技术使得系统内部的各种流数据得到了有效的保存,但却缺乏对这类大数据的有效利用、实现复杂系统的维修控制与决策.为此,提出了大数据结构化与数据驱动的复杂系统维修决策方法.大数据结构化使用了层次分析法(Analytic hierarchy process, AHP)的思想,依次建立系统维修的各个层级模型;基于模型抽象出支持系统维修的数据变量、提炼出各层级变量的表达函数;研究进一步实现了维护决策的数据驱动技术,在模型和函数之上定义了数据状态块矩阵,通过设计矩阵的特殊运算算法完成维修决策的数据驱动.最后,使用一个具体的例子来说明提出方法的可用性,结果证明提出的方法是可行的,符合设备维修决策建设目标,即维修方法经济、高效与实用. 展开更多
关键词 大数据 数据驱动 维修决策 AHP 流数据
下载PDF
基于聚类假设的数据流分类算法 被引量:11
6
作者 李南 《模式识别与人工智能》 EI CSCD 北大核心 2017年第1期1-10,共10页
获取数据流上样本的真实类别的代价很高,因此标记所有样本的方式缺乏实用性,而随机标记部分样本又会导致模型的不稳定.针对上述问题,文中提出基于聚类假设的数据流分类算法.基于通过聚类算法分到同类中的样本可能具有相同类别这一聚类假... 获取数据流上样本的真实类别的代价很高,因此标记所有样本的方式缺乏实用性,而随机标记部分样本又会导致模型的不稳定.针对上述问题,文中提出基于聚类假设的数据流分类算法.基于通过聚类算法分到同类中的样本可能具有相同类别这一聚类假设,利用训练数据集上的聚类结果拟合样本的分布情况,在分类阶段有目的性地选取很难分类或潜在概念漂移的样本更新模型.为了训练数据集上每个类别的样本,建立各自对应的基础分类器,当数据流中样本的类别消失或重现时,只需要冻结或激活与之对应的基础分类器,而无需再重新学习之前已经掌握的知识.实验表明,文中算法能够在适应概念漂移的前提下,减少更新模型需要的样本数量,并且取得和当前数据流上的分类算法相当或更好的分类效果. 展开更多
关键词 概念漂移 数据流 分类 聚类
下载PDF
流数据处理中负载突发感知的弹性资源分配 被引量:9
7
作者 李丽娜 魏晓辉 +1 位作者 李翔 王兴旺 《计算机学报》 EI CSCD 北大核心 2018年第10期2193-2208,共16页
在分布式并行数据流处理中,面向实时变化且具有突发性的流数据负载,固定的资源分配将造成资源浪费或服务质量降低,因此,可伸缩的弹性资源分配是一个亟待解决的关键问题.然而,由于资源分配延迟和负载预测模型存在误差,已有的弹性资源分... 在分布式并行数据流处理中,面向实时变化且具有突发性的流数据负载,固定的资源分配将造成资源浪费或服务质量降低,因此,可伸缩的弹性资源分配是一个亟待解决的关键问题.然而,由于资源分配延迟和负载预测模型存在误差,已有的弹性资源分配策略无法准确地提供与突发负载相匹配的资源,且存在不必要的资源调整反复,增加了系统开销.该文主要解决弹性资源分配的调整延迟和调整颠簸问题.针对上述问题,主要的挑战在于突发负载的准确预测和节点间的协作.为此,该文提出了一个上、下游节点协同的弹性资源分配策略,最优化数据质量和资源使用率,兼顾考虑调整代价.在该策略中,基于数据负载关联模型和双向的控制机制,下游节点能够实时感知和预测上游节点产生的突发负载和负载的变化趋势,预先调整资源并避免调整颠簸;同时,上游节点能够基于反馈机制,动态调节数据处理速率以抑制下游节点的负载波动,降低其资源调整的可能性.实验结果表明,当负载变化较大时,该策略平均减少数据丢失达85%,并显著降低了系统资源调整开销,同时,提高了资源使用率. 展开更多
关键词 流数据 流数据处理 突发感知 资源分配 弹性调整
下载PDF
基于流数据频繁项挖掘的可疑金融交易识别研究 被引量:8
8
作者 尹为 张成虎 杨彬 《西安交通大学学报(社会科学版)》 CSSCI 北大核心 2011年第5期86-90,共5页
针对目前基于静态数据挖掘的可疑交易识别方法在处理该类交易数据时所面临的困难与局限性,结合可疑金融交易的特征,设计了基于流数据频繁项挖掘的可疑金融交易识别算法。该算法改进了有损计数法,利用实时保留的具有较高重复度的历史数... 针对目前基于静态数据挖掘的可疑交易识别方法在处理该类交易数据时所面临的困难与局限性,结合可疑金融交易的特征,设计了基于流数据频繁项挖掘的可疑金融交易识别算法。该算法改进了有损计数法,利用实时保留的具有较高重复度的历史数据项解决了数据处理过程中的过度删除问题,实现了对频度列表中项的及时更新,并依据从数据流中识别出的频繁项来发现可疑金融交易线索。仿真实验结果验证了该算法的可行性和有效性。 展开更多
关键词 反洗钱 可疑金融交易 流数据 频繁模式 有损计数法
下载PDF
基于多种群协同微粒群优化的流数据聚类算法 被引量:8
9
作者 张勇 夏长红 +1 位作者 巩敦卫 荣淼 《控制与决策》 EI CSCD 北大核心 2016年第10期1879-1883,共5页
针对流数据的实时、有序和维数高等特点,提出一种基于多种群协同微粒群优化的流数据聚类算法.该算法利用变量分而治之的思想,多个种群协同优化多个类中心,进而求出问题完整的类中心集合.给出一种类中心变化趋势的预估策略,以快速追踪环... 针对流数据的实时、有序和维数高等特点,提出一种基于多种群协同微粒群优化的流数据聚类算法.该算法利用变量分而治之的思想,多个种群协同优化多个类中心,进而求出问题完整的类中心集合.给出一种类中心变化趋势的预估策略,以快速追踪环境变化.为防止多个子微粒群同时优化一个类中心,提出一种相似子微粒群的合并策略.最后将所提出的算法用于多个数据集,实验结果验证了算法的有效性. 展开更多
关键词 流数据 协同微粒群 聚类 预估
原文传递
一种流数据实时写入保障下的数据查询方法 被引量:7
10
作者 侯荣军 房俊 张建静 《计算机应用研究》 CSCD 北大核心 2014年第9期2736-2740,共5页
各类流式传感数据的实时接收与处理是物联网智能应用的基本要求。针对某城市车辆实时监管系统暴露出的数据实时接收与高效数据查询互相制约的问题,提出一种适用于物联网数据管理的结构化数据查询优化方法,在保障流数据实时写入的同时提... 各类流式传感数据的实时接收与处理是物联网智能应用的基本要求。针对某城市车辆实时监管系统暴露出的数据实时接收与高效数据查询互相制约的问题,提出一种适用于物联网数据管理的结构化数据查询优化方法,在保障流数据实时写入的同时提供高效的数据查询能力。该方法采用数据库集群应对数据并发访问时的性能需求;通过主从延迟复制技术减少数据查询对数据写入性能的影响;采用数据分区和数据缓存技术提升单数据节点的查询性能。实验结果表明,该方法能在一定程度上减少查询对数据写入的影响,提高数据的查询效率。 展开更多
关键词 流数据 实时写入 数据查询 数据库集群 主从延迟复制 数据分区 数据缓存
下载PDF
流数据和传统数据存储及管理方法比较研究 被引量:6
11
作者 李子杰 郑诚 《计算机技术与发展》 2009年第4期101-104,共4页
传统数据或静态数据是指来自关系数据库、数据仓库和事务数据库里面的数据,与之对应的流数据,是一种具有实时、快速和连续到达特点的动态数据。由于流数据的上述特点,使得应用于传统数据挖掘的技术和方法不能很好地适应流数据。对传统... 传统数据或静态数据是指来自关系数据库、数据仓库和事务数据库里面的数据,与之对应的流数据,是一种具有实时、快速和连续到达特点的动态数据。由于流数据的上述特点,使得应用于传统数据挖掘的技术和方法不能很好地适应流数据。对传统数据进行存储、查询和管理,使用成熟的DBMS完成,对流数据的类似操作,必须开发出具体的DSMS加以实现。提出了一个对流数据进行管理的系统框架,并在管理系统和存储方式两方面对两种数据进行综合比较。 展开更多
关键词 数据挖掘 流数据 传统数据
下载PDF
基于距离的数据流在线检测算法研究 被引量:6
12
作者 李少波 魏中贺 孟伟 《计算机应用研究》 CSCD 北大核心 2015年第12期3579-3581,共3页
针对传统的数据流检测中存在的时间复杂度高、准确度低等问题,提出了一种基于滑动时间窗口和k-距离剪枝的信息熵异常检测算法。该算法引用滑动时间窗口将动态的数据流静态化,当数据流填满当前窗口后,在当前窗口中用k-距离剪枝方法对数... 针对传统的数据流检测中存在的时间复杂度高、准确度低等问题,提出了一种基于滑动时间窗口和k-距离剪枝的信息熵异常检测算法。该算法引用滑动时间窗口将动态的数据流静态化,当数据流填满当前窗口后,在当前窗口中用k-距离剪枝方法对数据进行初步检测,从而剔除绝大部分的正常数据。最后再对筛选出疑似异常的数据用信息熵的检测方法进行检测,输出信息熵值大于设定阈值EA的数据点。通过实验验证,该算法比传统的检测算法在时间复杂度和准确度上都有一定的优越性。 展开更多
关键词 数据流 滑动窗口 k-距离 异常检测 信息熵
下载PDF
云环境下的流式空间信息服务 被引量:6
13
作者 丰江帆 朱毅 《重庆邮电大学学报(自然科学版)》 北大核心 2012年第6期693-698,共6页
随着物联网、传感器技术与应用的发展,对大规模多维空间数据集成与服务的需求愈加迫切。如何实现基于大规模、多维空间数据流的实时计算成为空间数据处理领域的难点。结合云计算的特点,提出针对高速、大流量空间数据的实时处理方法。通... 随着物联网、传感器技术与应用的发展,对大规模多维空间数据集成与服务的需求愈加迫切。如何实现基于大规模、多维空间数据流的实时计算成为空间数据处理领域的难点。结合云计算的特点,提出针对高速、大流量空间数据的实时处理方法。通过对多维、异构空间数据进行智能处理,生成结构化、简洁化的中间属性集;利用针对高速数据流的大规模数据实时处理方法,解决Map/Reduce难以满足此类计算实时性要求的不足。在此基础上,设计了流式空间信息组织模型与云端适配方法,对方法中的关键技术问题进行了描述。实践表明,该方法可显著提高动态空间信息的服务质量与运行性能。 展开更多
关键词 地理信息系统 云计算 空间信息服务 流数据
原文传递
基于LSTMs-Autoencoder的流数据异常检测算法 被引量:6
14
作者 时磊 《仪表技术与传感器》 CSCD 北大核心 2021年第10期120-125,共6页
与传统的异常检测任务不同,流数据具有容量庞大、到达迅速和概念漂移等特点,致使单个平稳模型难以满足数据异常检测需求。在递归神经网络的基础上引入多个LSTM单元,构成一个深层递归神经网络,再与自动编码器相结合,提出了基于LSTMs-Auto... 与传统的异常检测任务不同,流数据具有容量庞大、到达迅速和概念漂移等特点,致使单个平稳模型难以满足数据异常检测需求。在递归神经网络的基础上引入多个LSTM单元,构成一个深层递归神经网络,再与自动编码器相结合,提出了基于LSTMs-Autoencoder的流数据异常检测算法。该算法不仅可以对流数据进行实时检测,还能够有效应对概念漂移现象,实时适应流上的数据演化,保证检测结果准确、有效。最后通过基于实际数据的仿真实验,验证了该算法在应对在线更新、实时检测以及概念漂移方面的优势,得到了比ADM算法训练准确性高0.07%、检测误差低0.004%的对比优势。 展开更多
关键词 异常检测 流数据 长短期记忆网络 自动编码器 异常分数
下载PDF
大规模浮动车流数据并行地图匹配方法 被引量:5
15
作者 谢金运 涂伟 +4 位作者 李清泉 常晓猛 马承林 李追日 黄练 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2017年第5期697-703,共7页
提出了一种并行地图匹配方法,高效处理海量浮动车流数据。该方法顾及交通网络拓扑,指出网格过滤、距离过滤和方向过滤等策略减少邻近候选节点的数量,利用预先生成的最短路径列表减少最短路径计算量。基于非关系型分布式数据库实现了高... 提出了一种并行地图匹配方法,高效处理海量浮动车流数据。该方法顾及交通网络拓扑,指出网格过滤、距离过滤和方向过滤等策略减少邻近候选节点的数量,利用预先生成的最短路径列表减少最短路径计算量。基于非关系型分布式数据库实现了高效率的浮动车流数据并行地图匹配,利用武汉市的浮动车流数据进行了实验。实验结果表明,本文方法正确率为90.6%,计算效率能满足大规模浮动车流数据实时处理的需要。 展开更多
关键词 浮动车 流数据 地图匹配 并行计算 GPS轨迹数据
原文传递
一种基于信息熵的多维流数据噪声检测算法 被引量:5
16
作者 李文忠 左万利 赫枫龄 《计算机科学》 CSCD 北大核心 2012年第2期191-194,共4页
流数据噪声检测是一个比较困难的领域。由于流数据的一些特殊性,使得以前的一些处理静态数据的算法对于流数据的处理而言都不理想。在局部离群点(LOF)思想的基础上,引入信息熵来计算数据各维属性的信息增益,并根据各维属性的增益来计算... 流数据噪声检测是一个比较困难的领域。由于流数据的一些特殊性,使得以前的一些处理静态数据的算法对于流数据的处理而言都不理想。在局部离群点(LOF)思想的基础上,引入信息熵来计算数据各维属性的信息增益,并根据各维属性的增益来计算数据的局部离群度,提出一种多维流数据数据噪声点检测算法EDLOF。实验结果表明,该算法对于多维流数据有较好的适应性,而且具有一定的泛化能力。 展开更多
关键词 噪声检测 流数据 数据挖掘 信息熵
下载PDF
基于学习型哈希的在线近邻查找算法 被引量:4
17
作者 钱江波 胡伟 +1 位作者 陈华辉 董一鸿 《控制与决策》 EI CSCD 北大核心 2019年第12期2567-2575,共9页
基于哈希的近邻查找技术在图像检索、文本匹配、数据挖掘等信息检索领域均有广泛应用.该技术将原始数据通过哈希函数压缩成低维的二进制编码,然后在海明距离下排序检索,具有快速高效且维度不敏感的优势.但是,目前学术界针对流数据的实... 基于哈希的近邻查找技术在图像检索、文本匹配、数据挖掘等信息检索领域均有广泛应用.该技术将原始数据通过哈希函数压缩成低维的二进制编码,然后在海明距离下排序检索,具有快速高效且维度不敏感的优势.但是,目前学术界针对流数据的实时在线哈希学习方法的研究很少,而且基本没有讨论哈希函数的更新频率和稳定性问题.针对这一问题,通过增加置信区间来减少更换哈希函数的频率,并构造在线学习的目标函数,使得算法尽可能保持稳定,且快速收敛.为了验证所提出算法的效率和有效性,在公开数据集上与同类的OSH、OKH在线哈希算法进行比较,比较结果表明,所提出的算法在平均准确率和训练时间上有一定优势. 展开更多
关键词 高维数据 数据流 信息检索 近邻查找 在线哈希学习 监督学习
原文传递
基于大规模流式车牌识别数据的即时伴随车辆发现 被引量:4
18
作者 朱美玲 王雄斌 +2 位作者 张守利 刘晨 韩燕波 《中国科学技术大学学报》 CAS CSCD 北大核心 2016年第1期47-55,共9页
提出了一种基于流式大规模车牌识别数据集的伴随车辆(伴随车辆是指在一段持续的时间内一起移动的车辆组群)即时发现方法,可实现即时发现疑似伴随车辆并将其按伴随概率排序.该方法充分利用了云基础设施的并行计算能力,基于整数划分思想... 提出了一种基于流式大规模车牌识别数据集的伴随车辆(伴随车辆是指在一段持续的时间内一起移动的车辆组群)即时发现方法,可实现即时发现疑似伴随车辆并将其按伴随概率排序.该方法充分利用了云基础设施的并行计算能力,基于整数划分思想建立并行发现的负载均衡模型,优化了伴随车辆的发现性能,可用于对时间敏感的交通应用场景,如发现并监控运钞车等特殊车辆的跟踪车辆等.实验证明,该方法能够有效处理大规模的流式车牌识别数据,并实时地输出发现结果. 展开更多
关键词 伴随车辆 车牌识别数据 流数据 即时性 点伴随
下载PDF
一种基于语义的轨迹流数据清洗方法研究 被引量:3
19
作者 姜雅雯 余建坤 陆镜弛 《云南民族大学学报(自然科学版)》 CAS 2020年第3期243-249,共7页
数据清洗的主要任务是将数据中的脏数据检测出来并进行修正,提高数据质量,减小数据质量问题给数据应用带来的影响.由于流数据的特点是数据量大且增长快速,所以针对流数据的清洗研究除了要考虑到数据质量的提高,还需要考虑到数据体积的... 数据清洗的主要任务是将数据中的脏数据检测出来并进行修正,提高数据质量,减小数据质量问题给数据应用带来的影响.由于流数据的特点是数据量大且增长快速,所以针对流数据的清洗研究除了要考虑到数据质量的提高,还需要考虑到数据体积的压缩以缩减成本.现有的方法不能很好的兼顾数据质量的提高和成本的缩减问题,因此在已有的研究基础上提出一种基于语义的轨迹流数据清洗方法--将裸数据转化为语义轨迹,同时将语义作为动态指标去除重复采样和修复异常数据.实验证明,该方法能有效地缩减数据体积以降低保存成本,同时数据的质量密度得到了明显的提高. 展开更多
关键词 数据清洗 语义 流数据 数据质量 数据成本
下载PDF
基于动态样本选择的概念漂移自适应预测方法
20
作者 代劲 李昊 王国胤 《电子学报》 EI CAS CSCD 北大核心 2024年第9期3228-3239,共12页
概念漂移是影响流数据挖掘性能的重要因素,当前主要通过增量更新或重训练模型进行处理,但对已有知识并未充分利用.从综合利用全体样本出发,本文构建了一种基于动态样本选择的概念漂移自适应分类方法.该方法在新样本到来时进行基于局部... 概念漂移是影响流数据挖掘性能的重要因素,当前主要通过增量更新或重训练模型进行处理,但对已有知识并未充分利用.从综合利用全体样本出发,本文构建了一种基于动态样本选择的概念漂移自适应分类方法.该方法在新样本到来时进行基于局部一致性的漂移检测,在发现漂移发生时去除区域内的噪声样本,当检测到新概念出现时,对历史相似概念进行重用.最后,对区域内不同类别样本进行多代表点归纳,并同步更新预测模型.本文在含有不同漂移类型的合成数据集上进行去噪效果验证,并在真实数据集上进行预测任务.实验结果表明,该方法可以有效去除因概念漂移而形成的漂移噪声,有效提升了预测模型性能,整体预测表现优于流行的概念漂移自适应模型. 展开更多
关键词 概念漂移 局部漂移检测 流数据 样本选择 样本去噪 自适应预测
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部