-
题名大数据下监控网络混合入侵信息检索仿真
被引量:18
- 1
-
-
作者
何保荣
-
机构
河南牧业经济学院软件学院
-
出处
《沈阳工业大学学报》
EI
CAS
北大核心
2019年第6期654-658,共5页
-
基金
河南省科技攻关计划项目(142102210607)
河南省高等学校重点科研项目(15A520002)
-
文摘
针对传统的监控入侵信息检索方法存在检索精度低、召回率高、检索耗时长等问题,提出一种大数据下监控网络混合入侵信息检索方法.采用遗传算法对特征集进行优化选择,引入偏F检验对选择最优子集,组成优化特征集,并构建冗余信息消除模型,消除混合入侵信息中的冗余信息.以信息检索理论为依据,引用LDA模型对文档的话题进行建模,构建入侵信息检索模型,完成大数据下监控网络混合入侵信息检索.结果表明,所提方法的检索精度较高,能够有效提高入侵信息检索效率,降低检索耗时,且召回率平均值约为24%,优于其他方法,具有一定可行性.
-
关键词
大数据
监控网络
混合入侵信息
冗余
检索
特征集
LDA模型
召回率
-
Keywords
big data
monitoring network
hybrid invading information
redundancy
retrieval
feature set
LDA model
recall rate
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于粗糙集与人工蜂群算法的动态特征选择
被引量:6
- 2
-
-
作者
高薇
解辉
-
机构
闽南理工学院信息管理学院
清华大学计算机科学与技术系
-
出处
《计算机工程与设计》
北大核心
2019年第9期2697-2703,共7页
-
基金
福建省教育厅2015年高等学校创新创业教育改革基金项目(闽教高〔2015〕41号)
福建省科技厅2018年引导性基金项目(2018H0028)
-
文摘
为提高动态数据流特征提取的计算效率与性能,设计一种基于粗糙集与人工蜂群算法的动态数据流特征选择算法。修改人工蜂群算法中雇佣蜂阶段与侦查蜂阶段的位置更新方程,降低人工蜂群算法早熟收敛的几率,增强人工蜂群算法的鲁棒性,使其满足动态特征选择算法的稳定性需要。使用粗糙集定义数据流增量数据的适应度函数,人工蜂群算法从旧特征子集与增量数据提取新的全局特征子集。基于10个公开的数据集分别进行特征提取与分类实验,实验结果表明,该算法在保持较高分类准确率的前提下,明显减少了特征数量,实现了较高的动态特征计算效率。
-
关键词
数据流
大数据
特征选择
粗糙集
人工蜂群算法
-
Keywords
data stream
big data
feature selection
rough set
artificial bee colony algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于多模型融合的客户投诉风险预测方法
被引量:5
- 3
-
-
作者
辛永
刘燕秋
黄文思
罗义旺
-
机构
国网信通亿力科技有限责任公司
-
出处
《电力大数据》
2018年第11期31-37,共7页
-
文摘
客户服务工作作为电力企业的一项重要经营活动,不仅关系到电力客户的切身利益,也关系到电力企业的经营效益。但目前国网面对客户的能力与整个社会群体高度的维权意识和其他行业完善的服务体验相比仍处在落后水平。针对这个问题,基于大数据技术,提出了一种多模型融合的客户投诉预测模型。文章分析了客户历史诉求和停电相关数据,在特征工程中对样本集进行了特征选取和数据预处理,针对样本不平衡问题采用SMOTE方法对正样本进行过采样处理。此外,文章选用神经网络算法、随机森林算法、SVM(支持向量机)算法、Adaboost算法和朴素贝叶斯算法分别建立客户投诉预测模型,并对5种模型进行了加权融合。实验结果表明:多模型融合算法的表现比单一模型更好,模型分辨能力更优秀,预测精度更高,更适用于对客户投诉风险的预测。
-
关键词
客户投诉
大数据
模型融合
特征工程
不平衡数据集
-
Keywords
customer complaints
big data
multi-model ensemble
feature engineering
unbalanced data set
-
分类号
TM74
[电气工程—电力系统及自动化]
-
-
题名加密环境下大数据特征集并行存储方法研究
被引量:1
- 4
-
-
作者
李蓉蓉
-
机构
广东科技学院
-
出处
《现代电子技术》
北大核心
2019年第18期69-72,共4页
-
基金
广东省自然科学基金项目(E17094)
广东省高校重大科研项目(青年创新人才类项目)(2017KQNCX226)~~
-
文摘
针对传统方法存在数据存储速度慢,容量小的问题,提出一种加密环境下大数据特征集并行存储方法.采用MMSE算法对大数据特征集进行优化处理,以获得并行的大数据特征集.在加密环境下,当内存中保留数据记录达到一定数量时,在并行处理后的数据中插入批量Hash索引.以此为基础,基于Map函数对数据进行映射处理,进而完成对大数据特征集的并行存储.实验结果表明,利用所提方法的存储过程中数据分布通道具有较好的一致性,且存储速度约为传统方法的3倍,存储容量大.
-
关键词
大数据特征集
并行存储
MMSE算法
Hash索引
结果分析
映射处理
-
Keywords
big data feature set
parallel storage
MMSE algorithm
Hash index
result analysis
mapping processing
-
分类号
TN918.4.34
[电子电信—通信与信息系统]
TP311.13
[电子电信—信息与通信工程]
-
-
题名统计与大数据思维在窃电识别中的应用
- 5
-
-
作者
胡荣辉
-
机构
河南信息统计职业学院统计与大数据学院
-
出处
《电工技术》
2024年第4期92-95,共4页
-
文摘
针对用户用电负荷数据利用率不高和样本极度不均衡导致窃电用户识别不准的现实问题,从统计与大数据思维角度指导历史用电负荷数据挖掘,并提出一套窃电识别特征集。
-
关键词
窃电识别
统计与大数据思维
窃电识别特征集
-
Keywords
electricity theft identification
statistics and big data thinking
electricity theft identification feature set
-
分类号
TM72
[电气工程—电力系统及自动化]
-