期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
一种基于区域划分的数据流子空间聚类方法 被引量:15
1
作者 于翔 印桂生 +1 位作者 许宪东 王建伟 《计算机研究与发展》 EI CSCD 北大核心 2014年第1期88-95,共8页
数据流子空间聚类的主要目的是在合理的时间段内准确找到数据流特征子空间中的聚类.现有的数据流子空间聚类算法受参数影响较大,通常要求预先给出聚类数目或特征子空间,且聚类结果不能及时反映数据流的变化情况.针对以上缺陷,提出一种... 数据流子空间聚类的主要目的是在合理的时间段内准确找到数据流特征子空间中的聚类.现有的数据流子空间聚类算法受参数影响较大,通常要求预先给出聚类数目或特征子空间,且聚类结果不能及时反映数据流的变化情况.针对以上缺陷,提出一种新的数据流子空间聚类算法SC-RP,SC-RP无需预先给出聚类数目或特征子空间,对孤立点不敏感,可实现快速聚类,通过区域树结构记录数据流的变化并及时更新统计信息,进而根据数据流的变化调整聚类结果.通过在真实数据集与仿真数据集上的实验,证明了SC-RP在聚类精度和速度上优于现有的数据流子空间聚类算法,且对聚类数目及数据维度均具有良好的伸缩性. 展开更多
关键词 数据挖掘 数据流 子空间聚类 特征选择 维度约简
下载PDF
基于词频的优化互信息文本特征选择方法 被引量:13
2
作者 刘海峰 姚泽清 苏展 《计算机工程》 CAS CSCD 2014年第7期179-182,共4页
互信息(MI)是一种常用的文本特征选择方法,经典MI方法未考虑同一个特征项在不同类别内频数的差异性,也未考虑同一个特征在同一类别内的不同文本之间分布上的差异性。针对上述不足,以特征项的频数为依据,分别从特征项的类内分布、类间分... 互信息(MI)是一种常用的文本特征选择方法,经典MI方法未考虑同一个特征项在不同类别内频数的差异性,也未考虑同一个特征在同一类别内的不同文本之间分布上的差异性。针对上述不足,以特征项的频数为依据,分别从特征项的类内分布、类间分布上的差异以及类内不同文本之间分布上的差异等角度,通过引入特征项的类内频数因子、类内位置分布因子以及类间分布因子,提出一种改进的MI文本特征选择方法,使得特征项的频数信息在MI模型中得到有效利用,合理改善互信息模型在文本特征选择方面的不足。文本分类实验结果表明,改进MI文本特征选择方法的平均准确率、召回率分别提高约5.2%及4.6%,平均综合评价指标值提高约4.9%,有效提高了模型的文本分类效率。 展开更多
关键词 文本分类 特征选择 互信息 特征频率 特征降维 类内分布
下载PDF
超高维数据特征筛选方法综述 被引量:7
3
作者 牛勇 李华鹏 +3 位作者 刘阳惠 熊世峰 於州 张日权 《应用概率统计》 CSCD 北大核心 2021年第1期69-110,共42页
随着数据收集和存储能力的大幅提高,超高维数据[9],即数据维数伴随着样本呈指数增长,频繁出现在许多科学邻域.此时,惩罚类变量选择方法普遍遭遇三个方面的挑战:计算的复杂性,统计的准确性以及算法的稳定性.Fan和Lv[9]首先提出超高维特... 随着数据收集和存储能力的大幅提高,超高维数据[9],即数据维数伴随着样本呈指数增长,频繁出现在许多科学邻域.此时,惩罚类变量选择方法普遍遭遇三个方面的挑战:计算的复杂性,统计的准确性以及算法的稳定性.Fan和Lv[9]首先提出超高维特征筛选的方法,并在近十多年取得大量研究成果,成为当今统计最热点的研究邻域.本文主要从带模型假设,包含参数、非参数半参数模型假定的筛选方法、无模型假设的筛选以及特殊数据的筛选方法四个角度来介绍超高维筛选相关工作,并简要探讨目前超高维筛选方法存在的问题以及未来可能的研究方向. 展开更多
关键词 超高维 特征筛选 可加模型 非参数独立筛选 确保筛选性质 线性模型 变量选择 组变量选择 充分降维 纵向数据 稀疏性
下载PDF
特征自表达和图正则化的鲁棒无监督特征选择 被引量:6
4
作者 陈彤 陈秀宏 《智能系统学报》 CSCD 北大核心 2022年第2期286-294,共9页
为了在揭示数据全局结构的同时保留其局部结构,本文将特征自表达和图正则化统一到同一框架中,给出了一种新的无监督特征选择(unsupervised feature selection,UFS)模型与方法。模型使用特征自表达,用其余特征线性表示每一个特征,以保持... 为了在揭示数据全局结构的同时保留其局部结构,本文将特征自表达和图正则化统一到同一框架中,给出了一种新的无监督特征选择(unsupervised feature selection,UFS)模型与方法。模型使用特征自表达,用其余特征线性表示每一个特征,以保持特征的局部结构;用基于L_(2,1)范数的图正则化项,在保留数据的局部几何结构的同时可以降低噪声数据对特征选择的影响;除此之外,在权重矩阵上施加了低秩约束,保留数据的全局结构。在6个不同的公开数据集上的实验表明,所给算法明显优于其他5个对比算法,表明了所提出的UFS框架的有效性。 展开更多
关键词 特征选择 鲁棒 图拉普拉斯 特征自表达 低秩约束 无监督 L_(2 1)范数 降维
下载PDF
结合语义与统计的特征降维短文本聚类 被引量:7
5
作者 杨婉霞 孙理和 黄永峰 《计算机工程》 CAS CSCD 2012年第22期171-175,共5页
为解决文本聚类时文本的高维稀疏性问题,提出一种语义和统计特征相结合的短文本聚类算法。该算法通过语义词典对词汇的语义相关性分析实现一次降维,结合统计方法进行特征选择实现二次降维,并融合二次降维特征实现短文本聚类。实验结果表... 为解决文本聚类时文本的高维稀疏性问题,提出一种语义和统计特征相结合的短文本聚类算法。该算法通过语义词典对词汇的语义相关性分析实现一次降维,结合统计方法进行特征选择实现二次降维,并融合二次降维特征实现短文本聚类。实验结果表明,该算法具有较好的短文本聚类效果和效率。 展开更多
关键词 特征选择 聚类 短文本 向量空间模型 语义 降维
下载PDF
融合过滤和封装方式的特征选择算法 被引量:6
6
作者 代旺 方昱春 李杨 《计算机工程》 CAS CSCD 2012年第24期166-170,共5页
已有特征选择算法不能有效降低特征维数,且稳定性较低。为此,提出一种融合过滤和封装方式的特征选择算法。在封装式算法中,设计能保持图像之间拓扑结构的特征选择判据,在过滤式算法中,以Fisher Score为判据,采用单独最优的特征搜索策略... 已有特征选择算法不能有效降低特征维数,且稳定性较低。为此,提出一种融合过滤和封装方式的特征选择算法。在封装式算法中,设计能保持图像之间拓扑结构的特征选择判据,在过滤式算法中,以Fisher Score为判据,采用单独最优的特征搜索策略。实验结果表明,将算法应用于人脸识别中,能提高识别率,降低特征维数,且具有较好的稳定性。 展开更多
关键词 特征选择 过滤式方法 封装式方法 FisherScore判据 人脸识别 降维
下载PDF
基于差分进化的两阶段文本特征选择算法 被引量:6
7
作者 肖晓丽 吴瑶 +1 位作者 周锡玲 廖卓凡 《计算机工程》 CAS CSCD 北大核心 2019年第2期303-309,314,共8页
为降低文本特征空间维度,提高数据挖掘处理数据的效率,提出两阶段文本特征选择算法。结合方差和平均中位数2种方法构建高相关性的特征子集进行初步降维,并将其作为差分进化算法的初始特征种群。利用特征词的累计词频和文档频率设计适应... 为降低文本特征空间维度,提高数据挖掘处理数据的效率,提出两阶段文本特征选择算法。结合方差和平均中位数2种方法构建高相关性的特征子集进行初步降维,并将其作为差分进化算法的初始特征种群。利用特征词的累计词频和文档频率设计适应度函数,将多个特征差向量和局部最优特征引入变异操作中,增加特征子集的扰动性,加快差分进化算法的收敛速度,获得最优特征子集。在WebKB和Reuters-21578数据集上进行实验,结果表明,该算法在准确率、召回率和F1值上均优于TDM5、MADAC等算法,能够降低文本特征空间的维度,提高文本聚类效果。 展开更多
关键词 混合特征选择 降维 差分进化算法 方差 平均中位数 文本聚类
下载PDF
基于模拟退火的多标记数据特征选择 被引量:6
8
作者 张永波 游录金 陈杰新 《计算机工程与设计》 CSCD 北大核心 2011年第7期2494-2496,2500,共4页
多标记数据有很多的冗余特征和数据,为了解决多标记数据中冗余和无关特征,提高多标记学习算法的泛化能力。提出一个基于模拟退火的卷积式特征选择方法——SAML(simulated annealing based feature selection for multi-label data),已... 多标记数据有很多的冗余特征和数据,为了解决多标记数据中冗余和无关特征,提高多标记学习算法的泛化能力。提出一个基于模拟退火的卷积式特征选择方法——SAML(simulated annealing based feature selection for multi-label data),已有的算法只是使用了遗传算法来进行优化,新算法采用模拟退火来寻找最优子集,其效果在已有的工作中表现出比前者遗传算法更好的效果。在用于公开评测的Yahoo网页分类数据集上的实验结果表明,SAML算法的性能优于新近提出的一些流行的多标记特征选择方法。 展开更多
关键词 多标记学习 特征选择 模拟退火 维数约简 YAHOO网页
下载PDF
一种新的最大相关最小冗余特征选择算法 被引量:6
9
作者 李顺勇 王改变 《智能系统学报》 CSCD 北大核心 2021年第4期649-661,共13页
传统的基于特征选择的分类算法中,由于其采用的冗余度和相关度评价标准单一,从而使得此类算法应用范围受限。针对这个问题,本文提出一种新的最大相关最小冗余特征选择算法,该算法在度量特征之间冗余度的评价准则中引入了两种不同的评价... 传统的基于特征选择的分类算法中,由于其采用的冗余度和相关度评价标准单一,从而使得此类算法应用范围受限。针对这个问题,本文提出一种新的最大相关最小冗余特征选择算法,该算法在度量特征之间冗余度的评价准则中引入了两种不同的评价准则;在度量特征与类别之间的相关度中引入了4种不同的评价准则,衍生出8种不同的特征选择算法,从而使得该算法应用范围增大。此外,由于传统的最大相关最小冗余特征选择算法不能根据用户实际需求的数据维度进行特征选择。所以,引入了指示向量λ来刻画用户实际的数据维度需求,提出了一种新的目标函数来求解最优特征子集,利用支持向量机对4个UCI数据集的特征子集进行了实验,最后,利用分类正确率、成对单边T检验充分验证了该算法的有效性。 展开更多
关键词 特征选择 冗余度 相关度 降维 分类 分类正确率 支持向量机 T检验
下载PDF
基于F范数群组效应和谱聚类的无监督特征选择
10
作者 林清水 田鹏飞 张旺 《计算机系统应用》 2024年第7期201-212,共12页
基于谱聚类的无监督特征选择主要涉及相关系数矩阵和聚类指示矩阵,在以往的研究中,学者们主要关注于相关系数矩阵,并为此设计了一系列约束和改进,但仅关注相关系数矩阵并不能充分学习到数据内在结构.考虑群组效应,本文向聚类指示矩阵施... 基于谱聚类的无监督特征选择主要涉及相关系数矩阵和聚类指示矩阵,在以往的研究中,学者们主要关注于相关系数矩阵,并为此设计了一系列约束和改进,但仅关注相关系数矩阵并不能充分学习到数据内在结构.考虑群组效应,本文向聚类指示矩阵施加F范数,并结合谱聚类以使相关系数矩阵学习更为准确的聚类指示信息,通过交替迭代法求解两个矩阵.不同类型的真实数据集实验表明文中方法的有效性,此外,实验表明F范数还可以使方法更加鲁棒. 展开更多
关键词 无监督特征选择 谱聚类 群组效应 F范数 降维
下载PDF
基于多特征组合优化的汉语数字语音识别研究 被引量:5
11
作者 蔡敏 《电子器件》 CAS 北大核心 2013年第2期282-284,共3页
研究了一种汉语数字语音识别方案,首先提取汉语数字语音线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC)及其一阶差分,并组合成新特征。通过求取其系数矩阵的均值和方差的方式进行一次降维,然后采用基于关联规则的特征选择算法进行二... 研究了一种汉语数字语音识别方案,首先提取汉语数字语音线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC)及其一阶差分,并组合成新特征。通过求取其系数矩阵的均值和方差的方式进行一次降维,然后采用基于关联规则的特征选择算法进行二次降维,并采用C4.5决策树算法进行识别。通过实验表明提出的方法能够有效降低特征维度,去除了无用的冗余信息,提高了语音识别率。 展开更多
关键词 语音识别 线性预测倒谱系数 梅尔频率倒谱系数 特征选择 降维
下载PDF
融合序列后向选择与支持向量机的混合式特征选择算法 被引量:5
12
作者 吴清寿 刘长勇 林丽惠 《计算机系统应用》 2019年第7期174-179,共6页
维度灾难是机器学习任务中的常见问题,特征选择算法能够从原始数据集中选取出最优特征子集,降低特征维度.提出一种混合式特征选择算法,首先用卡方检验和过滤式方法选择重要特征子集并进行标准化缩放,再用序列后向选择算法(SBS)与支持向... 维度灾难是机器学习任务中的常见问题,特征选择算法能够从原始数据集中选取出最优特征子集,降低特征维度.提出一种混合式特征选择算法,首先用卡方检验和过滤式方法选择重要特征子集并进行标准化缩放,再用序列后向选择算法(SBS)与支持向量机(SVM)包裹的SBS-SVM算法选择最优特征子集,实现分类性能最大化并有效降低特征数量.实验中,将包裹阶段的SBS-SVM与其他两种算法在3个经典数据集上进行测试,结果表明,SBS-SVM算法在分类性能和泛化能力方面均具有较好的表现. 展开更多
关键词 混合式特征选择 序列后向选择 支持向量机 降维
下载PDF
基于谱聚类算法的高速网络数据流快速分类方法研究 被引量:1
13
作者 张震 胡贵恒 +1 位作者 盖昊宇 任远林 《齐齐哈尔大学学报(自然科学版)》 2023年第5期24-30,共7页
当前高速网络数据流分类处理时,忽略了冗余数据对分类结果的影响,使得分类结果 F1值较低。因此,提出了基于谱聚类算法的高速网络数据流快速分类方法。采用主成分分析法对高速网络数据流进行降维处理。对所有数据流相关性特征进行选择,... 当前高速网络数据流分类处理时,忽略了冗余数据对分类结果的影响,使得分类结果 F1值较低。因此,提出了基于谱聚类算法的高速网络数据流快速分类方法。采用主成分分析法对高速网络数据流进行降维处理。对所有数据流相关性特征进行选择,去除冗余特征,保留有效的特征信息。应用支持向量机算法构建网络数据流快速分类模型,结合谱聚类算法对多数类样本进行聚类,组成新的数据集并将其输入到分类模型中得出相关的分类结果。实验结果表明,所提方法的平均F1值为0.95,F1值越大分类结果越准确,说明该方法能够满足高速网络数据流快速准确分类,具有优越的数据分类性能,应用价值更高。 展开更多
关键词 谱聚类算法 网络数据流 分类 特征选择 降维 支持向量机
下载PDF
基于机器学习的肿瘤智能辅助诊断方法 被引量:4
14
作者 程顺达 程颖 孙士江 《电子科技》 2022年第5期56-59,共4页
在肿瘤诊断领域,人工智能辅助诊断系统可对肿瘤属性、恶性肿瘤分期进行准确地判别,从而延长患者的生存时间。文中以乳腺肿瘤为例,针对特征提取过程中数据量过大所导致的过拟合问题,提出了一种基于监督学习的人工智能辅助诊断模型。在提... 在肿瘤诊断领域,人工智能辅助诊断系统可对肿瘤属性、恶性肿瘤分期进行准确地判别,从而延长患者的生存时间。文中以乳腺肿瘤为例,针对特征提取过程中数据量过大所导致的过拟合问题,提出了一种基于监督学习的人工智能辅助诊断模型。在提取特征时,通过引入层次聚类分析来完成有效的特征降维,并将分类后的特征数据作为人工神经网络模型的特征输入,以此实现分类器的有效训练。实验结果显示,所提算法的准确率和AUC值相比对照算法有所提升,表明该模型不仅能解决海量特征区域描述造成的过拟合问题,还增强了人工智能辅助诊断系统的泛化能力,可以完成对钼靶乳腺肿瘤的高精度区分。 展开更多
关键词 机器学习 恶性肿瘤 辅助诊断 特征选择 特征降维 分类器 层次聚类 神经网络
下载PDF
基于D-score与支持向量机的混合特征选择方法 被引量:5
15
作者 谢娟英 雷金虎 +1 位作者 谢维信 高新波 《计算机应用》 CSCD 北大核心 2011年第12期3292-3296,共5页
F-score作为特征评价准则时,没有考虑不同特征的不同测量量纲对特征重要性的影响。为此,提出一种新的特征评价准则D-score,该准则不仅可以衡量样本特征在两类或多类之间的辨别能力,而且不受特征测量量纲对特征重要性的影响。以D-score... F-score作为特征评价准则时,没有考虑不同特征的不同测量量纲对特征重要性的影响。为此,提出一种新的特征评价准则D-score,该准则不仅可以衡量样本特征在两类或多类之间的辨别能力,而且不受特征测量量纲对特征重要性的影响。以D-score为特征重要性评价准则,结合前向顺序搜索、前向顺序浮动搜索以及后向浮动搜索三种特征搜索策略,以支持向量机分类正确率评价特征子集的分类性能得到三种混合的特征选择方法。这些特征选择方法结合了Filter方法和Wrapper方法的各自优势实现特征选择。对UCI机器学习数据库中9个标准数据集的实验测试,以及与基于改进F-score与支持向量机的混合特征选择方法的实验比较,表明D-score特征评价准则是一种有效的样本特征重要性,也即特征辨别能力衡量准则。基于该准则与支持向量机的混合特征选择方法实现了有效的特征选择,在保持数据集辨识能力不变情况下实现了维数压缩。 展开更多
关键词 D-score F-score 支持向量机 特征选择 评估准则 维压缩
下载PDF
基于特征优化的高光谱遥感影像降维算法 被引量:5
16
作者 王小宁 宋伟东 《遥感信息》 CSCD 北大核心 2020年第6期122-128,共7页
高光谱影像数据量大、波段间相关性强、信息冗余度高等特点为地物高效识别与分类带来挑战。鉴于降低维度在有效利用高光谱数据方面的重要性,文章提出高光谱影像特征优化降维算法。相关系数矩阵用以确定初始子空间,以此作为先验确定聚类... 高光谱影像数据量大、波段间相关性强、信息冗余度高等特点为地物高效识别与分类带来挑战。鉴于降低维度在有效利用高光谱数据方面的重要性,文章提出高光谱影像特征优化降维算法。相关系数矩阵用以确定初始子空间,以此作为先验确定聚类个数及初始聚类中心。依据相似性度量准则,应用K-means算法进行波段聚类,取不同准则下聚类结果交集,实现子空间的自动划分,并利用PCA变换提取第一主成分作为子空间降维结果。对于未被子空间覆盖的剩余波段,采用BSMM算法进行降维处理。叠加2次降维结果,实现最终降维。通过对华盛顿哥伦比亚特区和帕维亚大学2幅影像降维结果的定性定量评价,验证本文算法的可行性与有效性。实验表明,该算法能够在更好实现影像降维的同时极大限度地保留原始影像信息,为后续高光谱影像快速解译提供可能。 展开更多
关键词 高光谱影像 特征优化 PCA变换 波段选择 降维 子空间
下载PDF
基于最大信息系数的关联性特征选择算法:MICCFS
17
作者 罗幼喜 谢昆明 +1 位作者 胡超竹 李翰芳 《华中师范大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期777-785,共9页
针对基于关联性特征选择算法(CFS)对于回归任务只能识别变量线性关系和分类任务使用对称不确定性度量的不足,提出一种基于最大信息系数(MIC)的CFS特征选择算法:MICCFS.将回归任务中衡量变量间的线性相关系数和分类任务中的对称不确定性... 针对基于关联性特征选择算法(CFS)对于回归任务只能识别变量线性关系和分类任务使用对称不确定性度量的不足,提出一种基于最大信息系数(MIC)的CFS特征选择算法:MICCFS.将回归任务中衡量变量间的线性相关系数和分类任务中的对称不确定性度量改进为MIC度量方式.运用最佳优先搜索算法搜索特征子集,以UCI机器学习数据库中11个回归数据集和10个分类数据集为实验对象,采用支持向量机、k近邻算法、朴素贝叶斯模型、决策树四种分类器,比较了MICCFS和CFS以及常用特征选择方法SVMRFE、Lasso、MIM、Relief F、Chi-Square的效果,结果表明MICCFS具有一定优势. 展开更多
关键词 关联性特征选择 最大信息系数 特征选择 分类 降维
下载PDF
基于特征参量优选与多算法联合的局部放电模式识别方法 被引量:4
18
作者 王世强 薛建议 +2 位作者 胡海燕 刘全桢 穆海宝 《高压电器》 CAS CSCD 北大核心 2018年第10期112-119,共8页
电力设备中,不同类型的放电因放电功率、能量的差异对设备绝缘的损害能力存在差异,即对绝缘的危害程度不同,确定局部放电类型是放电危险度评估的基础。文中对典型缺陷条件下的局部放电谱图提取了基本参量及统计参量等多种特征指纹;为了... 电力设备中,不同类型的放电因放电功率、能量的差异对设备绝缘的损害能力存在差异,即对绝缘的危害程度不同,确定局部放电类型是放电危险度评估的基础。文中对典型缺陷条件下的局部放电谱图提取了基本参量及统计参量等多种特征指纹;为了降低识别参量的维度,定义了特征向量可分性评估准则,并使用浮动前向搜索算法选取了可分性最优的9组特征参量;分别使用主成分分析、线性可分性分析、核主成分分析及通用可分性分析4种方法将特征向量降为2维,结果表明,使用通用可分性分析降维后特征参量可分性最优。之后,提出了多算法联合的模式识别分类器,通过对比最小距离法、人工神经网络及支持向量机,3种方法确定最终识别结果,实验结果表明,该分类器识别准确率达95.8%。最后将所提出模式识别方法应用于现场局部放电缺陷类型识别,通过设备实验结果对比验证了识别结果的准确性。 展开更多
关键词 局部放电 模式识别 特征参量 典型缺陷 特征优选与降维
下载PDF
离散型增强烟花算法和kNN在特征选择中的研究 被引量:4
19
作者 黄欣 莫海淼 +1 位作者 赵志刚 曾敏 《计算机工程与应用》 CSCD 北大核心 2020年第16期112-117,共6页
特征选择是从原始特征集中选取特征子集,并且降低特征维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,提出了新的特征选择算法。该算法使用经过离散化处理之后的增强烟花算法来搜索特征子集,同时将特征子集和经过惩... 特征选择是从原始特征集中选取特征子集,并且降低特征维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,提出了新的特征选择算法。该算法使用经过离散化处理之后的增强烟花算法来搜索特征子集,同时将特征子集和经过惩罚因子处理之后约束条件融入到目标函数中,然后将搜索到的特征子集的数据放到kNN分类器进行训练和预测,最后使用十折交叉验证来检验分类的准确性。使用UCI数据进行仿真实验,仿真结果表明:与引导型烟花算法、烟花算法、蝙蝠算法、乌鸦算法、自适应粒子群算法相比,所提算法的总体性能优于其他五种算法。 展开更多
关键词 离散型增强烟花算法 特征选择 降维 分类 k近邻(kNN)
下载PDF
基于特征选择的学生成绩预测方法研究
20
作者 刘晓雲 刘鸿雁 +1 位作者 李劲松 王冠帮 《信息技术》 2023年第10期17-22,共6页
学习成绩是反映学习效果和教学质量的重要指标,对成绩进行预测可改进学习和教学方法,进而提高教学质量,如何准确地预测成绩已成为教育数据挖掘领域的一个热点研究课题。为提高预测的准确度,提出了基于特征选择的成绩预测方法。首先利用... 学习成绩是反映学习效果和教学质量的重要指标,对成绩进行预测可改进学习和教学方法,进而提高教学质量,如何准确地预测成绩已成为教育数据挖掘领域的一个热点研究课题。为提高预测的准确度,提出了基于特征选择的成绩预测方法。首先利用序列前向选择算法对样本数据进行特征选择,从而选出最优特征子集来构建多元线性回归预测模型,再利用模型对成绩进行预测。为检验方法的有效性,在真实数据集上进行了验证,实验结果表明:文中方法具有更高的预测精度,可以为改进教学方法和教学质量提供数据支持。 展开更多
关键词 数据挖掘 特征选择 数据降维 多元线性回归 成绩预测
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部