期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于SPARK与随机森林的短信诈骗用户识别研究 被引量:12
1
作者 杨杰超 许江淳 +2 位作者 岳秋燕 曾德斌 陆万荣 《计算机工程与科学》 CSCD 北大核心 2019年第6期1136-1144,共9页
当今数据时代电信诈骗现象日益增多,为了在短信诈骗份子实施诈骗前及时识别出其身份,根据目前电信行业需求及研究现状,在SPARK并行处理框架上,针对性地提出了分层子空间的加权随机森林算法。面对短信用户种类繁杂导致的数据类别不平衡... 当今数据时代电信诈骗现象日益增多,为了在短信诈骗份子实施诈骗前及时识别出其身份,根据目前电信行业需求及研究现状,在SPARK并行处理框架上,针对性地提出了分层子空间的加权随机森林算法。面对短信用户种类繁杂导致的数据类别不平衡带来的随机森林性能低下的问题,采用改进的分层子空间的方法,并根据评估出的每棵树的分类能力给决策树加权,相较于其他分类算法,改进的随机森林表现得更优异;针对电信行业海量数据的特点,选择分布式SPARK作为数据处理平台,并行化的平台缩短了模型训练和测试时间,提高了效率,实时、准确地识别电信短信诈骗用户,其准确率达到90%以上。 展开更多
关键词 SPARK 随机森林 分层子空间 加权 短信诈骗用户识别
下载PDF
面向高维小样本数据的层次子空间ReliefF特征选择算法 被引量:1
2
作者 程凤伟 王文剑 张珍珍 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期928-936,共9页
高维小样本数据的特征维数远远高于样本数,因为其通常包含大量的冗余特征,ReliefF算法在处理这类数据时存在以下挑战:传统ReliefF算法无法剔除冗余特征,而现有的改进ReliefF算法大多通过启发式地计算特征与特征之间的互信息来剔除冗余特... 高维小样本数据的特征维数远远高于样本数,因为其通常包含大量的冗余特征,ReliefF算法在处理这类数据时存在以下挑战:传统ReliefF算法无法剔除冗余特征,而现有的改进ReliefF算法大多通过启发式地计算特征与特征之间的互信息来剔除冗余特征,不适用于高维数据;通过截取与标记相关性最大的若干特征来进行分类,可能不是最优选择,因其没有考虑不同特征组合对分类性能的影响.为了解决以上问题,提出一种基于层次子空间的ReliefF特征选择算法,将原始特征集划分为具有层次结构的子空间,并利用邻域粗糙集理论来计算低层子空间的局部依赖度,能在高维小样本数据上高效率地批量剔除冗余特征.此外,为了考量不同特征组合对结果的影响,引入“局部领导力”的概念,保留部分子空间中“带队”能力较强的特征,从局部和全局的角度共同给予特征更加客观的评价.在六个微阵列基因数据集上的实验表明,与现有方法相比,提出的方法更高效,而且能保持良好的分类性能. 展开更多
关键词 高维小样本数据 特征选择 RELIEFF 层次子空间 邻域粗糙集
下载PDF
一种基于分布式子空间的共享单车定位算法
3
作者 何涛 张健 +1 位作者 徐鹤 姜彦男 《现代电子技术》 北大核心 2018年第18期17-21,27,共6页
共享单车逐步成为中国规模最大的城市交通代步解决方案,为城市人群提供更加快捷、环保的城市出行服务。为了进一步提高共享单车的利用率和安全性,分析在城市复杂环境下影响定位的主要因素,结合现有的共享单车的定位方式,提出一种基于层... 共享单车逐步成为中国规模最大的城市交通代步解决方案,为城市人群提供更加快捷、环保的城市出行服务。为了进一步提高共享单车的利用率和安全性,分析在城市复杂环境下影响定位的主要因素,结合现有的共享单车的定位方式,提出一种基于层次分布式子空间的定位算法。通过各点之间的接收信号强度指示以及标准点坐标定位实现共享单车的精准定位。仿真结果表明,所提出的算法较现有的方法具有较高精度的定位,能够提高单车的使用率以及实现对单车状态的实时反馈。 展开更多
关键词 共享单车 节点定位 层次分布式子空间 定位算法 城市出行 信号强度指示
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部