期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
大数据技术在电力大用户用电特征分类中的应用 被引量:12
1
作者 沈建良 陆春光 +2 位作者 袁健 倪琳娜 张岩 《浙江电力》 2017年第12期37-41,共5页
随着电力行业市场化改革的深入,对用电客户进行细分并提供差异化服务已经成为必然趋势。针对电力用户的用电负荷数据特点,提出了一种基于大数据技术的用电特征相似性挖掘方法。采用DTW算法对负荷曲线相似度进行度量,并利用K-means算法对... 随着电力行业市场化改革的深入,对用电客户进行细分并提供差异化服务已经成为必然趋势。针对电力用户的用电负荷数据特点,提出了一种基于大数据技术的用电特征相似性挖掘方法。采用DTW算法对负荷曲线相似度进行度量,并利用K-means算法对DTW距离矩阵进行聚类分析,实现用户负荷曲线的聚类和负荷特性分析。最后,以纺织印染业大工业用户的负荷数据为例进行验证,结果表明,该算法组合能够较好地反映负荷曲线的相似度,负荷曲线特征呈现显著差异。 展开更多
关键词 售电市场 大数据技术 用电特征分类 动态时间规整算法 K-MEANS算法
下载PDF
基于聚类的能量自持续可见光定位算法 被引量:5
2
作者 原程林 路慧敏 +1 位作者 黄嘉成 王建萍 《光学学报》 EI CAS CSCD 北大核心 2021年第10期48-54,共7页
将Kmeans聚类算法和传统的K近邻(KNN)算法相结合,提出一种适用于能量自持续室内可见光定位(VLP)系统的融合算法。该算法兼顾低复杂度和高精度,在使用Kmeans聚类算法对专门设计的指纹库进行划分实现粗定位的基础上,使用KNN定位算法进行... 将Kmeans聚类算法和传统的K近邻(KNN)算法相结合,提出一种适用于能量自持续室内可见光定位(VLP)系统的融合算法。该算法兼顾低复杂度和高精度,在使用Kmeans聚类算法对专门设计的指纹库进行划分实现粗定位的基础上,使用KNN定位算法进行精准定位。将所提Kmeans-KNN融合算法引入到搭建的能量自持续VLP系统,分析不同条件下系统的定位性能。结果表明,与传统KNN定位算法相比,采用Kmeans-KNN融合算法后,系统的平均定位误差位为0.141 m,定位精度明显提高,同时算法计算量减少了94.7%,系统耗能因此大幅降低,利于VLP系统高精度能量自持续定位的实现。 展开更多
关键词 光通信 自由空间光通信 能量自持续 指纹定位 kmeans聚类算法 K近邻算法
原文传递
SURF特征及预处理RANSAC算法在人脸识别中的应用 被引量:5
3
作者 蒋凌志 《计算机科学》 CSCD 北大核心 2015年第B11期209-212,共4页
针对人脸识别问题,提出了一种基于SURF特征的人脸图像快速识别方法。首先,对经预处理后的人脸图像提取SURF特征点,采用最近邻匹配法对特征点进行粗匹配;其次,利用KMeans聚类算法对粗匹配的特征点进行预处理来过滤明显不合适的匹配点,再... 针对人脸识别问题,提出了一种基于SURF特征的人脸图像快速识别方法。首先,对经预处理后的人脸图像提取SURF特征点,采用最近邻匹配法对特征点进行粗匹配;其次,利用KMeans聚类算法对粗匹配的特征点进行预处理来过滤明显不合适的匹配点,再利用RANSAC算法对过滤后的特征点实现精匹配,以达到对人脸的特征点比较准确地识别匹配。实验结果表明,该方法适用于手机终端的人脸图像的快速匹配,具有较强的鲁棒性及一定的实用价值。 展开更多
关键词 SURF 特征点 RANSAC 人脸匹配 预处理 聚类算法 kmeans
下载PDF
基于机器学习的UD布弹道冲击有限元结果分析 被引量:1
4
作者 何洁 徐平华 +2 位作者 袁子舜 陆振乾 徐望 《轻工机械》 CAS 2024年第4期7-15,共9页
由于目前主要采用的分析复合材料有限元模型图像结果的定性对比观察法分析不够深入和全面,可能会忽略某些重要信息,故而需要一种能够快速进行图像量化处理的客观分析方法。课题组结合机器学习,提出了基于k-Means聚类算法的有限元图像结... 由于目前主要采用的分析复合材料有限元模型图像结果的定性对比观察法分析不够深入和全面,可能会忽略某些重要信息,故而需要一种能够快速进行图像量化处理的客观分析方法。课题组结合机器学习,提出了基于k-Means聚类算法的有限元图像结果分析方法;以分析Dyneema■单向(unidirectional, UD)布以普通对齐堆叠和准各向同性堆叠的弹道冲击有限元模型的应力分布结果为例,利用k-Means聚类算法对所截取的应力云图进行基于颜色特征的像素点聚类和区域分割,分割的区域可以实现快速统计和面积计算。结果表明:该方法能够快速准确地量化不同应力范围的面积差距,从而得出更为客观明了的结果,便于深入地分析。该方法还可以推广应用于其他需要分析云图结果的领域。 展开更多
关键词 机器学习 单向织物 K-MEANS聚类算法 有限元分析 应力分析 弹道冲击
下载PDF
改进YOLOv5s的清洁船水面漂浮垃圾识别算法
5
作者 周波 袁和平 +1 位作者 刘必劲 陈水宣 《厦门理工学院学报》 2024年第5期40-50,共11页
为解决水上漂浮垃圾种类繁多、移动端算力有限、现有识别模型较复杂等原因导致的水上清洁船识别垃圾精度低、速度慢等问题,提出一种基于YOLOv5s(you only look once version5 small)网络模型的水上漂浮垃圾识别算法。该算法采用K-means... 为解决水上漂浮垃圾种类繁多、移动端算力有限、现有识别模型较复杂等原因导致的水上清洁船识别垃圾精度低、速度慢等问题,提出一种基于YOLOv5s(you only look once version5 small)网络模型的水上漂浮垃圾识别算法。该算法采用K-means聚类算法调整边界框比例,提高检测精度;以渐进式学习方式EfficientNetv2模型替代YOLOv5s的主干部分,融合高效通道注意力(efficient channel attention,ECA)机制,减少模型复杂度,提高检测速度,同时增强模型的特征提取能力;引入平衡因子φ和归一化高斯Wasserstein距离(normalized Gaussian Wasserstein distance,NWD)度量对YOLOv5s的损失函数优化,降低模型对水上远距离漂浮垃圾的检测敏感性。自制数据集的测试实验结果显示,改进算法的mAP比YOLOv5s算法提高2.2%,模型的参数量下降20.34%,检测速度提高30.84%,表明改进算法具有优越性。 展开更多
关键词 清洁船 水面漂浮垃圾 识别算法 YOLOv5s算法 K⁃means聚类算法 EfficientNetv2 注意力机制 损失函数
下载PDF
K-means+SSA-Elman网络可见光室内位置感知算法 被引量:4
6
作者 李宝玉 张峰 +1 位作者 彭侠 刘叶楠 《应用光学》 CAS CSCD 北大核心 2022年第3期453-459,共7页
由于室内环境复杂,基于Elman神经网络的可见光位置感知存在收敛速度慢、定位精度低等缺点。论文提出基于麻雀搜索算法(sparrow search algorithm,SSA)优化Elman神经网络,同时融合K-means聚类的一种可见光室内位置感知算法。对采集到的... 由于室内环境复杂,基于Elman神经网络的可见光位置感知存在收敛速度慢、定位精度低等缺点。论文提出基于麻雀搜索算法(sparrow search algorithm,SSA)优化Elman神经网络,同时融合K-means聚类的一种可见光室内位置感知算法。对采集到的数据建立数据库,利用SSA对Elman的拓扑结构和连接权阈值进行优化,建立训练模型,解决基于Elman神经网络室内位置感知算法易陷入局部最优的问题,提高收敛速度和稳健性;利用K-means对数据库优化分类,将处理好的数据代入模型训练得初步预测结果;将初步预测结果代入子类二次训练得预测点的最终坐标,进一步提高定位精度。基于0.8 m×0.8 m×0.8 m的立体空间进行实验,结果表明:论文算法平均定位误差3.22 cm,定位误差小于6 cm,概率达到90%,相较SSA-Elman算法定位精度提高7.5%;相较Elman网络算法定位精度提高16%。 展开更多
关键词 可见光 室内位置感知 麻雀搜索算法 ELMAN神经网络 K-MEANS聚类算法
下载PDF
基于MapReduce的Canopy-Kmeans算法的并行化 被引量:2
7
作者 张友海 李锋刚 《辽宁科技学院学报》 2017年第1期4-5,13,共3页
数据挖掘的聚类算法Canopy-Kmeans是分析数据内在价值的常用工具之一,传统的基于集中控制的方式算法执行效率,在今天大数据环境下,有待改进。文章数据源为某省运营商在2014年7月经过脱敏后的话单信令数据,通过传统的集中控制方式和基于M... 数据挖掘的聚类算法Canopy-Kmeans是分析数据内在价值的常用工具之一,传统的基于集中控制的方式算法执行效率,在今天大数据环境下,有待改进。文章数据源为某省运营商在2014年7月经过脱敏后的话单信令数据,通过传统的集中控制方式和基于MapReduce的方式。通过实验,我们可以看出使用MapReduce方式具有良好的可行性,而且执行效率也得到明显改善[1]。 展开更多
关键词 聚类算法 Canopy-kmeans MAPREDUCE
下载PDF
基于ARIA的K均值聚类算法研究 被引量:1
8
作者 王雷 刘小芳 赵良军 《四川理工学院学报(自然科学版)》 CAS 2019年第2期65-70,共6页
针对传统K均值聚类算法对初始聚类中心敏感,易陷入局部最优和对大数据集聚类速度慢的缺点,将ARIA与Kmeans算法相结合,提出了一种ARIA-Kmeans算法,即基于自适应半径免疫的K均值聚类算法。首先利用自适应半径免疫算法对数据进行预处理,产... 针对传统K均值聚类算法对初始聚类中心敏感,易陷入局部最优和对大数据集聚类速度慢的缺点,将ARIA与Kmeans算法相结合,提出了一种ARIA-Kmeans算法,即基于自适应半径免疫的K均值聚类算法。首先利用自适应半径免疫算法对数据进行预处理,产生能够代表原始数据分布以及密度信息的内部镜像数据;然后用K均值聚类算法对其进行多次聚类,获得最佳聚类中心,并将其作为初始聚类中心,推广到全部数据优化聚类效果;最后对其结果进行评价。实验结果表明,相对于传统Kmeans算法,新算法在保证聚类准确度的前提下,提高了算法运行的时间效率和稳定性。 展开更多
关键词 聚类分析 局部最优 自适应半径免疫算法 K均值聚类算法 聚类中心 优化
下载PDF
面向建设期铁路大数据的分级存储方法研究 被引量:2
9
作者 廉小亲 杨凯 +2 位作者 程智博 王万齐 吴艳华 《铁路计算机应用》 2022年第2期17-22,共6页
我国铁路网包含众多建设期和运营期路段,均会产生大量业务数据,然而传统的单节点大数据存储方式存在访问速度慢和时效性低等局限性,无法有效缓解数据存储压力。文章基于数据分级存储的思想,设计一种分布式大数据分级存储架构;综合考虑... 我国铁路网包含众多建设期和运营期路段,均会产生大量业务数据,然而传统的单节点大数据存储方式存在访问速度慢和时效性低等局限性,无法有效缓解数据存储压力。文章基于数据分级存储的思想,设计一种分布式大数据分级存储架构;综合考虑建设期铁路大数据的业务属性和存储数据库的固有属性,建立一套数据价值评价体系;基于专家评价法计算各数据表在不同评价维度下的价值,并通过K-means聚类算法判定各数据表相应的存储级别;以某建设期铁路大数据为实验样本进行验证,实验结果表明,文章提出的价值评价体系能够有效地对铁路建设期大数据进行存储级别判定,实现了面向建设期铁路大数据的分级存储。 展开更多
关键词 建设期铁路大数据 数据价值 分级存储 专家评价法 K-MEANS聚类算法
下载PDF
一种基于无监督学习的社交网络流量快速识别方法 被引量:1
10
作者 裘晨曦 徐雅斌 +1 位作者 李艳平 李卓 《数学的实践与认识》 CSCD 北大核心 2014年第3期100-107,共8页
在分析了社交网络的发展和研究现状后,结合现有的网络流量识别方法和社交网络流量特征属性,提出了一种基于KMeans聚类算法的无监督学习社交网络流量识别方法.为了提高处理的高效性、实时性,利用开源云计算平台如doop上提供的M印Reduce... 在分析了社交网络的发展和研究现状后,结合现有的网络流量识别方法和社交网络流量特征属性,提出了一种基于KMeans聚类算法的无监督学习社交网络流量识别方法.为了提高处理的高效性、实时性,利用开源云计算平台如doop上提供的M印Reduce架构进行分布式并行处理.对比实验结果表明,提出的方法能快速、高效的识别社交网络流量,并且识别准确率有显著提高. 展开更多
关键词 社交网络 流量特征 kmeans聚类算法 MAPREDUCE
原文传递
方形件组批优化模型
11
作者 冉桂玲 《科学技术创新》 2023年第17期224-228,共5页
随着现代制造技术的发展,生产成本和效率已经成为企业生产的关键问题。而方形件产品的订单组批和排样优化是提高企业生产效率和降低成本的重要手段,因此研究订单组批和排样优化问题具有重要的理论研究价值和实际工程意义,本文用kmeans+... 随着现代制造技术的发展,生产成本和效率已经成为企业生产的关键问题。而方形件产品的订单组批和排样优化是提高企业生产效率和降低成本的重要手段,因此研究订单组批和排样优化问题具有重要的理论研究价值和实际工程意义,本文用kmeans++的聚类算法求得订单批次最优,进一步建立了多目标约束混合整数规划模型求解最优板材数和利用率。 展开更多
关键词 订单组批 排样优化 混合整数规划模型 kmeans++聚类算法
下载PDF
云计算平台上的Canopy-Kmeans并行聚类算法研究
12
作者 孙秀娟 《现代电子技术》 北大核心 2019年第19期78-81,共4页
针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明... 针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明,所设计的并行聚类算法具有良好的加速比、数据伸缩率及扩展率等特点,能够在海量数据挖掘及分析中使用。 展开更多
关键词 云计算平台 Canopy-kmeans算法 并行聚类算法 大数据挖掘 集群数据 数据分析
下载PDF
基于改进的Cascade-RCNN网络的人员检测算法
13
作者 吉鹏飞 《智能计算机与应用》 2021年第8期107-111,117,共6页
为解决人员密集情景下行人检测存在大量的目标误检、漏检的情况,本文提出了一种改进的基于Cascade-RCNN的目标检测网络,提高了人员检测的准确率。对目前检测效果较好的Cascade-RCNN做了一些改进:选用ResNeXt101代替ResNet作为骨干网络,... 为解决人员密集情景下行人检测存在大量的目标误检、漏检的情况,本文提出了一种改进的基于Cascade-RCNN的目标检测网络,提高了人员检测的准确率。对目前检测效果较好的Cascade-RCNN做了一些改进:选用ResNeXt101代替ResNet作为骨干网络,以便提取更加充分的特征;为了获得更好的标记框,用kmeans聚类算法得到更符合目标形态的anchor长宽比例,通过WBF算法融合多个模型的结果得到更精确的边界框,同时引入多尺度训练以提高对小尺度目标的检测能力。实验结果表明,在CrowdHuman公开数据集上,用ResNeXt101提取特征其得分提高了3.7%,用kmeans聚类算法生成anchor比例和WBF算法融合多预测框其准确率提升了0.7%和1.2%,最终整体性能较基础Cascade-RCNN提升近6%。 展开更多
关键词 行人检测 Cascade-RCNN kmeans聚类算法 WBF算法 多尺度训练
下载PDF
下一代互联网:OpenFlow-Kmeans流表聚类算法
14
作者 张冠峰 《价值工程》 2014年第26期231-232,共2页
互联网的发展,对传输质量要求越来愈高,本文针对OpenFlow流表转发,提出并实现OpenFlow-Kmeans流表聚类转发算法,该算法提升准确率27.64%,实验表明,该算法能够满足复杂环境下,对流表的分类转发需求。
关键词 OpenFlow kmeans 聚类算法
下载PDF
CEO特征与股价崩盘风险预警——基于Gradient-Boosting模型的研究
15
作者 赵甜甜 尉昊 李昊泽 《福建商学院学报》 2022年第5期42-49,共8页
选取2010—2020年沪深A股企业样本,构建梯度提升树模型评估CEO先天特征、人生经历、认知水平与公司组织结构四个特征维度对股价崩盘风险的预警和识别效果。研究发现:CEO特征对于股价崩盘风险预测效果显著;CEO特征与股价崩盘风险之间存... 选取2010—2020年沪深A股企业样本,构建梯度提升树模型评估CEO先天特征、人生经历、认知水平与公司组织结构四个特征维度对股价崩盘风险的预警和识别效果。研究发现:CEO特征对于股价崩盘风险预测效果显著;CEO特征与股价崩盘风险之间存在多重内在预测机制;采用Kmeans聚类算法对CEO类型进行划分,“领导型”与“改革型”CEO对股价崩盘风险的影响与预测效果存在显著差异。应完善高管遴选制度与激励机制设计,提高公司治理水平,促进资本市场健康发展。 展开更多
关键词 CEO特征 股价崩盘风险 梯度提升树模型 kmeans聚类算法
下载PDF
基于小批量Kmeans++聚类算法的液闪探测器n/γ甄别方法研究
16
作者 王飞鹏 杨明翰 +2 位作者 夏冬琴 洪兵 汪建业 《核电子学与探测技术》 CAS 北大核心 2022年第6期1073-1081,共9页
提出一种基于小批量Kmeans++聚类算法的液体闪烁体探测器n/γ信号甄别方法.在^(252)Cf中子源混合辐射场中,分别使用小批量Kmeans++聚类算法和电荷比较法进行n/γ信号甄别,并将二者的分类结果进行对比与分析.实验结果表明,在400~600 keV... 提出一种基于小批量Kmeans++聚类算法的液体闪烁体探测器n/γ信号甄别方法.在^(252)Cf中子源混合辐射场中,分别使用小批量Kmeans++聚类算法和电荷比较法进行n/γ信号甄别,并将二者的分类结果进行对比与分析.实验结果表明,在400~600 keV、600~800 keV、800~1000 keV和>1000 keV能量区间,小批量Kmeans++聚类算法的甄别品质因子分别为0.96、1.06、1.24和1.31,这优于电荷比较法的甄别结果,在中子探测领域该研究可作为脉冲形状甄别的一种参考方法. 展开更多
关键词 液闪探测器 脉冲形状甄别 kmeans++聚类算法 电荷比较法
下载PDF
基于改进Mask R-CNN的刮板输送机铁质异物多目标检测 被引量:10
17
作者 史凌凯 耿毅德 +1 位作者 王宏伟 王洪利 《工矿自动化》 北大核心 2022年第10期55-61,共7页
刮板输送机是煤矿井下的关键运输设备,铁质异物进入刮板输送机会引发磨损、断链等,甚至会造成停产、伤人等严重事故。现有刮板输送机异物识别方法存在对井下图像的适应性较差、无法区分异物类别与数量等问题。针对上述问题,提出了一种... 刮板输送机是煤矿井下的关键运输设备,铁质异物进入刮板输送机会引发磨损、断链等,甚至会造成停产、伤人等严重事故。现有刮板输送机异物识别方法存在对井下图像的适应性较差、无法区分异物类别与数量等问题。针对上述问题,提出了一种基于改进掩码区域卷积神经网络(Mask R-CNN)的刮板输送机铁质异物多目标检测方法。采用基于Laplace算子的图像增强算法对井下低照度、高粉尘环境下采集的图像进行预处理,对增强后的图像进行标注,制作数据集。采用Mask R-CNN模型的ResNet-50特征提取器获取铁质异物图像特征;采用特征金字塔网络进行特征融合,保证同时拥有高层的语义特征(如类别、属性等)和低层的轮廓特征(如颜色、轮廓、纹理等),以提高小尺度铁质异物识别精度;针对Mask R-CNN模型生成的锚点与待检测的铁质异物尺寸不对应的问题,对Mask R-CNN模型进行改进,采用k-meansⅡ聚类算法代替原来的锚点生成方案,通过遍历数据集中标注框的长宽信息得到聚类中心点,实现刮板输送机铁质异物多目标检测。实验结果表明,改进Mask R-CNN模型对单张图像的平均检测时间为0.732 s,与Mask R-CNN,YOLOv5相比,分别缩短0.093,0.002 s;平均精度为91.7%,与Mask R-CNN,YOLOv5相比,分别提高11.4%,2.9%。 展开更多
关键词 刮板输送机 铁质异物 多目标检测 深度学习 Mask R-CNN k-meansⅡ聚类算法
下载PDF
基于深度学习及改进模糊KMeans的寻常型银屑病智能诊断方法 被引量:1
18
作者 石丽平 杜笑青 +2 位作者 李静 刘丽娟 张国强 《中国医学物理学杂志》 CSCD 2024年第2期253-257,共5页
为了解决寻常型银屑病在样本分布不平衡的数据中可能会导致的深度学习模型诊断效果下降等问题,通过结合改进模糊KMeans聚类算法对高聚类复杂度数据的处理能力以及Visual Geometry Group 13(VGG13)深度卷积神经网络模型的预测能力,提出... 为了解决寻常型银屑病在样本分布不平衡的数据中可能会导致的深度学习模型诊断效果下降等问题,通过结合改进模糊KMeans聚类算法对高聚类复杂度数据的处理能力以及Visual Geometry Group 13(VGG13)深度卷积神经网络模型的预测能力,提出一种基于改进模糊KMeans聚类算法的VGG13深度卷积神经网络(VGG13-KMeans)模型,并将其应用于寻常型银屑病的诊断任务中。实验结果表明,相较于VGG13以及ResNet18两种方法,本文方法更适用于对银屑病特征的识别。 展开更多
关键词 寻常型银屑病 改进模糊kmeans聚类算法 VGG13 深度卷积神经网络模型
下载PDF
基于无监督聚类分析的激进换道行为识别方法
19
作者 王婉琦 程国柱 徐亮 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期166-178,共13页
为有效指导驾驶人采取更安全的换道行为,本文提出基于改进的自组织映射神经网络(SOM-Kmeans)聚类分析的激进换道行为识别方法。通过模拟驾驶设备和眼动仪获取驾驶数据和眼动状态,运用变点检测算法结合方向盘转角和横向注视位置从多模态... 为有效指导驾驶人采取更安全的换道行为,本文提出基于改进的自组织映射神经网络(SOM-Kmeans)聚类分析的激进换道行为识别方法。通过模拟驾驶设备和眼动仪获取驾驶数据和眼动状态,运用变点检测算法结合方向盘转角和横向注视位置从多模态数据集中提取换道行为事件数据,进而提取驾驶人换道行为关键特征参数,运用SOM-Kmeans聚类分析识别激进换道行为。将SOM-Kmeans聚类方法分别与基于密度的聚类算法(DBSCAN)及模糊C均值聚类算法(FCM)比较,分析激进换道行为的识别效果。研究结果表明:SOM-Kmeans能够将激进换道行为划分为紧急换道和挤车换道两种类型,并建立相应的行为指标和阈值,当换道过程中加速度波动大于8.22 m·s^(-3)且方向盘转角大于0.83 (°)·s^(-1),识别此次换道为激进换道行为;在激进换道行为的基础上,当换道间隙小于7.5 m且换道持续时间大于10.3 s时,识别此次换道为挤车换道,否则,为紧急换道行为。挤车换道行为多出现在拥堵较严重的强制换道中,紧急换道行为多出现在交通流环境较好的自由换道中。本文提出的识别方法的准确率为92.5%,与传统聚类分析相比,本文提出的激进换道行为识别方法能够更加细致地识别激进换道行为的种类,研究结果可作为评估驾驶人是否存在危险换道行为和衡量驾驶人换道习惯的参考标准,同时,该两次聚类结果可作为激进型换道行为的参考标准。 展开更多
关键词 智能交通 激进换道行为识别 SOM-kmeans聚类算法 城市道路 模拟驾驶
下载PDF
针对非平衡警情数据改进的K-Means-Boosting-BP模型 被引量:4
20
作者 李卫红 童昊昕 《中国图象图形学报》 CSCD 北大核心 2017年第9期1314-1324,共11页
目的掌握警情的时空分布规律,通过机器学习算法建立警情时空预测模型,制定科学的警务防控方案,有效抑制犯罪的发生,是犯罪地理研究的重点。已有研究表明,警情时空分布多集中在中心城区或居民密集区,在时空上属于非平衡数据,这种数据的... 目的掌握警情的时空分布规律,通过机器学习算法建立警情时空预测模型,制定科学的警务防控方案,有效抑制犯罪的发生,是犯罪地理研究的重点。已有研究表明,警情时空分布多集中在中心城区或居民密集区,在时空上属于非平衡数据,这种数据的非平衡性通常导致在该数据上训练的模型成为弱学习器,预测精度较低。为解决这种非平衡数据的回归问题,提出一种基于KMeans均值聚类的Boosting算法。方法该算法以Boosting集成学习算法为基础,应用GA-BP神经网络生成基分类器,借助KMeans均值聚类算法进行基分类器的集成,从而实现将弱学习器提升为强学习器的目标。结果与常用的解决非平衡数据回归问题的Synthetic Minority Oversampling Technique Boosting算法,简称SMOTEBoosting算法相比,该算法具有两方面的优势:1)在降低非平衡数据中少数类均方误差的同时也降低了数据的整体均方误差,SMOTEBoosting算法的整体均方误差为2.14E-04,KMeans-Boosting算法的整体均方误差达到9.85E-05;2)更好地平衡了少数类样本识别的准确率和召回率,KMeans-Boosting算法的召回率约等于52%,SMOTEBoosting算法的召回率约等于91%;但KMeans-Boosting算法的准确率等于85%,远高于SMOTEBoosting算法的19%。结论 KMeans-Boosting算法能够显著的降低非平衡数据的整体均方误差,提高少数类样本识别的准确率和召回率,是一种有效地解决非平衡数据回归问题和分类问题的算法,可以推广至其他需要处理非平衡数据的领域中。 展开更多
关键词 非平衡数据 Synthetic MINORITY OVERSAMPLING Technique算法 BOOSTING算法 kmeans聚类算法 警情时空预测
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部