期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于粗糙集的不完备谣言信息系统的知识获取与决策
1
作者 王标 卫红权 +2 位作者 王凯 刘树新 江昊聪 《信息安全学报》 CSCD 2024年第2期19-35,共17页
网络谣言可能扰乱人们的思想、心理和行为,引发社会震荡、危害公共安全,而微博等社交平台的广泛应用使得谣言造成的影响与危害变得更大,因此,谣言检测对于网络空间的有序健康发展具有重要的意义。当前谣言的自动检测技术更多关注检测模... 网络谣言可能扰乱人们的思想、心理和行为,引发社会震荡、危害公共安全,而微博等社交平台的广泛应用使得谣言造成的影响与危害变得更大,因此,谣言检测对于网络空间的有序健康发展具有重要的意义。当前谣言的自动检测技术更多关注检测模型的构建和输入数据的表现形式,而在改善数据质量以提高谣言识别效果方面的研究很少。基于此,本文将粗糙集理论应用于不完备谣言信息系统进行知识获取与决策,实质上是通过粗糙集理论解决不完备谣言信息系统的不确定性度量,冗余性以及不完备性等问题,以获得高质量的数据,改善谣言检测效果。首先系统总结了粗糙集理论中不确定性度量的方法,包括香农熵、粗糙熵、Liang熵以及信息粒度等四种不确定度量方法,并整理和推导了这四种不确定度量方法从完备信息系统到不完备信息系统的一致性拓展。基于上述总结的四种不确定度量方法,提出了基于最大相关最小冗余(MCMR,Maximum Correlation Minimum Redundancy)的知识约简算法。该方法基于熵度量方式,能够综合考量决策信息与冗余噪音,在UCI及Weibo等8个数据集上实验验证,结果表明本文算法优于几种基线算法,能够有效解决信息系统的冗余性。另外,提出了一种基于极大相容块的不完备决策树算法,在不同缺失程度数据上实验验证,结果表明本文算法能够有效解决信息系统的不完备性。 展开更多
关键词 谣言检测 粗糙集 不完备信息系统 最大相关最小冗余 极大相容块
下载PDF
基于MRMR-SSA-BP的PM_(2.5)浓度预测模型
2
作者 张一准 颜七笙 《计算机仿真》 北大核心 2023年第8期511-517,共7页
PM_(2.5)的浓度预测对治理空气和改善环境起着至关重要的作用。以济南市2019年的空气质量数据和气象数据作为研究对象,提出基于最大相关最小冗余算法(MRMR)和麻雀搜索算法(SSA)优化的BP神经网络模型。该模型通过麻雀搜索算法对BP神经网... PM_(2.5)的浓度预测对治理空气和改善环境起着至关重要的作用。以济南市2019年的空气质量数据和气象数据作为研究对象,提出基于最大相关最小冗余算法(MRMR)和麻雀搜索算法(SSA)优化的BP神经网络模型。该模型通过麻雀搜索算法对BP神经网络的初始权值和阈值优化,仿真出BP神经网络初始的最优权值和阈值。把最大相关最小冗余算法选出的最优的特征值作为模型的输入,完成PM_(2.5)浓度的预测。仿真结果表明,与MRMR-BP,SSA-BP,BP等模型相比,MRMR-SSA-BP模型预测效果最佳,为PM_(2.5)浓度的预测提供了一种新的参考方法。 展开更多
关键词 最大相关最小冗余 麻雀搜索算法 神经网络 空气污染
下载PDF
基于互信息和半监督学习的入侵检测研究 被引量:1
3
作者 石凯 《现代计算机》 2019年第23期18-23,共6页
针对不同攻击需要检测的数据量较大而有标记数据较少导致检测效率低,特征定性分析不准确而导致检测精度较低的问题,提出一种新型的基于相关性和冗余度的半监督入侵检测方案。在标记流量数据样本较少的情况下,采用半监督学习方法。该方... 针对不同攻击需要检测的数据量较大而有标记数据较少导致检测效率低,特征定性分析不准确而导致检测精度较低的问题,提出一种新型的基于相关性和冗余度的半监督入侵检测方案。在标记流量数据样本较少的情况下,采用半监督学习方法。该方法利用少量已标记样本得到其他未标记大量样本的标记,从而获得大量有标记样本;由于标签数据包的特征隐含信息多样,不同特征包含的分类信息量不同,导致准确率降低。引入相关性和冗余度的度量,尽可能保留有效特征,增加对已知和未知攻击的检测效率。实验结果表明:该方案能够利用少量标记的数据,在网络流量中区分未知攻击和已知攻击,并且有较高的检测准确率和检测效率。 展开更多
关键词 入侵检测 特征选择 半监督学习 最大相关最小冗余
下载PDF
基于多机器学习模型的逐小时PM_(2.5)浓度预测对比 被引量:8
4
作者 陈建坤 牟凤云 +2 位作者 张用川 田甜 王俊秀 《南京林业大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第5期152-160,共9页
【目的】比较分析XGBoost模型、LightGBM模型、随机森林模型(RF)、K最近邻模型(KNN)、长短期记忆神经网络(LSTM)、决策树模型(DT)共6个PM_(2.5)浓度预测模型,以准确、及时预测环境PM_(2.5)浓度。【方法】基于重庆市合川区2020年全年空... 【目的】比较分析XGBoost模型、LightGBM模型、随机森林模型(RF)、K最近邻模型(KNN)、长短期记忆神经网络(LSTM)、决策树模型(DT)共6个PM_(2.5)浓度预测模型,以准确、及时预测环境PM_(2.5)浓度。【方法】基于重庆市合川区2020年全年空气质量监测数据和气象数据,通过最大相关最小冗余算法(MRMR)进行数据降维选择最优特征子集,作为模型的输入,逐一进行PM_(2.5)浓度预测;考虑到不同季节PM_(2.5)浓度差异较大,故分季节预测了PM_(2.5)浓度;为了探究各模型预测性能,计算了各模型运行时间和内存占用,并基于PM_(2.5)与特征变量的相关性和特征变量的重要性探讨了模型预测性能季节性差异原因。【结果】模型总体预测精度从高到低排序为XGBoost、RF、LightGBM、LSTM、KNN、DT模型;预测性能方面,6个模型均表现为秋冬季节预测精度高于春夏季节;LightGBM模型可在保证模型精度的情况下,大幅减少模型训练时间和内存占用;特征重要性显示PM_(10)浓度、气温和气压的重要性高,O_(3)浓度、风向和NO_(2)浓度重要性相对较弱。【结论】采取MRMR方法进行数据降维选取的最优特征子集能较好地预测PM_(2.5)浓度;相比较而言,XGBoost、RF、LightGBM、LSTM模型在PM_(2.5)浓度预测上具有较优性能,其中综合性能较好的为LightGBM模型。 展开更多
关键词 PM_(2.5)预测 机器学习 最大相关最小冗余(MRMR) 气象因子
原文传递
一种基于最大相关-最小冗余算法的输电线路故障定位方法 被引量:23
5
作者 卢诗华 孙密 +3 位作者 谢景海 郭嘉 贾祎轲 苏东禹 《电测与仪表》 北大核心 2020年第3期79-85,共7页
针对传统输电线路故障定位精度较低且易受故障后暂态分量影响的问题,提出一种基于数据驱动的输电线路故障定位方法。构建基于系统状态和故障位置的电力系统运行数据集,基于最大相关-最小冗余准则,在此数据集中挖掘关键特征与故障位置之... 针对传统输电线路故障定位精度较低且易受故障后暂态分量影响的问题,提出一种基于数据驱动的输电线路故障定位方法。构建基于系统状态和故障位置的电力系统运行数据集,基于最大相关-最小冗余准则,在此数据集中挖掘关键特征与故障位置之间的隐含关系,提取与故障位置最大相关且变量之间最小冗余的关键信息,构建与故障位置最相关的核心变量集,应用曲线拟合技术获取运行变量与故障位置之间的数学解析关系,综合多个特征信息给出准确的故障定位结果。仿真验证结果表明,与传统基于阻抗的故障定位方法相比,所提方法具有更高的故障定位精度,同时对故障后出现的暂态分量也有良好的适应能力,是一种准确快速的输电线路故障定位新方法。 展开更多
关键词 输电线路 故障定位 数据驱动 最大相关-最小冗余
下载PDF
基于mRMR-RF特征选择和XGBoost模型的钓鱼网站检测 被引量:11
6
作者 毕青松 梁雪春 陈舒期 《计算机应用与软件》 北大核心 2020年第9期296-301,共6页
针对大量冗余数据带来的钓鱼网站检测准确率不够、误判率较高等问题,提出一种基于最大相关最小冗余(mRMR)和随机森林(RF)相结合的特征选择方法(mRMR-RF),并利用极端梯度提升(XGBoost)算法构建钓鱼网站检测模型。利用mRMR和RF算法分别对... 针对大量冗余数据带来的钓鱼网站检测准确率不够、误判率较高等问题,提出一种基于最大相关最小冗余(mRMR)和随机森林(RF)相结合的特征选择方法(mRMR-RF),并利用极端梯度提升(XGBoost)算法构建钓鱼网站检测模型。利用mRMR和RF算法分别对特征进行排序;综合两种特征排序得出最终的排序结果,并根据实验得出的最佳特征数选出XGBoost模型所需的最优特征子集;使用最优特征子集对XGBoost分类模型进行训练。实验结果表明,该方法相比其他分类方法可以提高钓鱼网站检测的准确率,具有实际意义。 展开更多
关键词 特征选择 最大相关最小冗余 随机森林 XGBoost 钓鱼网站
下载PDF
基于特征选择与Transformer的涡扇发动机剩余使用寿命预测 被引量:1
7
作者 刘耕鑫 董辛旻 +1 位作者 张瑞博 陈阳 《机床与液压》 北大核心 2024年第7期208-213,共6页
针对传统剩余使用寿命预测模型难以解决长时依赖问题以及不同特征组合对模型预测精度影响大的问题,提出一种基于特征选择与Transformer的剩余使用寿命预测模型。首先利用以互信息为理论基础的最大相关最小冗余特征选择算法,捕获特征与... 针对传统剩余使用寿命预测模型难以解决长时依赖问题以及不同特征组合对模型预测精度影响大的问题,提出一种基于特征选择与Transformer的剩余使用寿命预测模型。首先利用以互信息为理论基础的最大相关最小冗余特征选择算法,捕获特征与标签、特征与特征的关系,得到最佳特征组合;然后以Transformer的编码器为主体并加入门控卷积单元组成预测模型,使模型可以充分捕捉全局信息且提高运算效率的基础上也更加注重局部信息;通过网格搜索与粒子群算法确定模型超参数。最后将最优特征组合的变量数据输入模型实现涡扇发动机剩余使用寿命预测。利用此方法在C-MAPSS数据集进行验证,并进行对比实验,结果表明预测误差与模型效率均有一定改进。 展开更多
关键词 剩余使用寿命 最大相关最小冗余 特征选择 互信息 Transformer模型
下载PDF
最大相关最小冗余两阶段文本特征选择方法
8
作者 冷婷 叶仁玉 徐思蓉 《安徽理工大学学报(自然科学版)》 CAS 2024年第3期83-89,共7页
目的为解决传统卡方统计法(CHI)仅考虑文本特征与文本类别的相关性进行特征选择,未考虑特征之间的冗余性,导致文本分类的性能不佳的问题。方法使用最大相关最小冗余原则,对CHI法初次选择的特征子集,利用强相关低冗余思想有目的地筛选低... 目的为解决传统卡方统计法(CHI)仅考虑文本特征与文本类别的相关性进行特征选择,未考虑特征之间的冗余性,导致文本分类的性能不佳的问题。方法使用最大相关最小冗余原则,对CHI法初次选择的特征子集,利用强相关低冗余思想有目的地筛选低冗余特征,提升文本特征选择效果,提出一种基于最大相关最小冗余的两阶段文本特征选择方法(CHI_impMI)。结果对复旦大学新闻文本语料进行分类,相比于CHI和CHI_MI特征选择方法,CHI_impMI方法的性能指标均为最优,文本分类效果最好。结论CHI_impMI方法在相关度与冗余度之间达到了很好的平衡,从而有效提升文本分类性能。 展开更多
关键词 卡方统计方法 最大相关最小冗余原则 互信息 文本分类 特征选择
下载PDF
基于模糊聚类算法的高维大数据增量处理方法 被引量:1
9
作者 张思松 张明 《蚌埠学院学报》 2022年第2期55-59,共5页
现有高维数据增量处理方法由于没有完全抵消类间中心点的相互排斥,导致处理增量数据的缓冲有效比较低,为此,提出了基于模糊聚类算法的高维大数据增量处理方法。利用时间窗口构建了可变增量数据抽取模型,针对抽取数据采用最大相关最小冗... 现有高维数据增量处理方法由于没有完全抵消类间中心点的相互排斥,导致处理增量数据的缓冲有效比较低,为此,提出了基于模糊聚类算法的高维大数据增量处理方法。利用时间窗口构建了可变增量数据抽取模型,针对抽取数据采用最大相关最小冗余的特征选择方法,过滤增量数据;基于模糊聚类算法抵消类间节点的相互排斥,通过优化中心聚类节点完成对增量数据的聚类处理。测试结果表明,所提算法的数据处理速度差异性较小,当增量变化比小于8%时,三种方法的缓冲有效比P之间的差异性较小;当增量变化比为20%和42%时,所提方法的P值比其他两组方法分别高了6.28%、8.4%和13.61%、14.67%。可见所提方法利用模糊聚类算法,更好地消除了类间中心点相互排斥的问题。 展开更多
关键词 模糊聚类算法 高维大数据 增量数据 时间窗口 最大相关最小冗余 类间差异
下载PDF
基于最大相关-最小冗余的动作识别算法 被引量:2
10
作者 龚静 李英杰 黄欣阳 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第6期158-167,共10页
为了提高动作的识别精度与鲁棒性,降低冗余特征,提高算法效率,设计了一种基于最大相关-最小冗余(Max-Correlation and Min-Redundancy,MCMR)的动作识别算法.首先,为了消除噪声影响,减少计算成本,利用符号聚集近似(SAX)技术将连续图像序... 为了提高动作的识别精度与鲁棒性,降低冗余特征,提高算法效率,设计了一种基于最大相关-最小冗余(Max-Correlation and Min-Redundancy,MCMR)的动作识别算法.首先,为了消除噪声影响,减少计算成本,利用符号聚集近似(SAX)技术将连续图像序列转换为离散符号;其次,为避免出现时间漂移问题,利用动态时间归整(Dynamic Time Warping,DTW)来计算符号特征的距离,提取符号序列的特征;然后,为了消除冗余的特征,定义了一个特征权重,根据权重对特征进行降序排列,引入最大相关-最小冗余技术消除相关性弱的特征,筛选出具有高相关性和低冗余的特征;最后,为了完成动作识别,根据筛选出的特征,利用k-近邻(K-Nearest Neighbor,KNN)进行分类器学习.结果表明:与当前动作识别算法相比,本文算法能够有效完成动作的识别与理解,具有较高的识别率,有效地降低了冗余特征,提高了算法的效率和鲁棒性. 展开更多
关键词 动作识别 最大相关-最小冗余 符号表示 动态时间归整 K-近邻
下载PDF
基于mRMR-BP算法的辛烷值损失预测模型研究 被引量:1
11
作者 姬子恒 朱建伟 陈海江 《智能计算机与应用》 2022年第3期169-172,179,共5页
化工过程建模一般通过数据关联或机理建模的方法来实现,但由于炼油工艺过程的复杂性以及设备的多样性,其操作变量之间具有高度非线性和相互强耦联的关系。在传统的数据关联模型中,变量相对较少、机理建模对原料的分析要求较高,对过程优... 化工过程建模一般通过数据关联或机理建模的方法来实现,但由于炼油工艺过程的复杂性以及设备的多样性,其操作变量之间具有高度非线性和相互强耦联的关系。在传统的数据关联模型中,变量相对较少、机理建模对原料的分析要求较高,对过程优化的响应不及时,效果并不理想。本文为了降低模型求解的复杂性,使用互信息法和mRMR算法,对367个变量进行降维处理,筛选出同时满足与辛烷值之间具有最大相关性,彼此之间又有最小的冗余性的主要变量。引入BP神经网络模型对辛烷值损失建立预测模型,经过数据训练与学习,产生辛烷值损失的预测结果,并分析主要操作变量对辛烷值损失的影响。 展开更多
关键词 辛烷值 互信息法 最大相关-最小冗余(mRMR)算法 BP神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部