期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于变量选择-神经网络模型的复杂路网短时交通流预测 被引量:13
1
作者 蒋士正 许榕 陈启美 《上海交通大学学报》 EI CAS CSCD 北大核心 2015年第2期281-286,共6页
针对传统交通流预测模型正在由单断面历史数据处理向多断面、多时刻历史数据处理转变,但在考虑各断面间的影响时,多变的交通状况往往会使预测模型复杂化的问题,引入一种多元线性回归最小绝对收缩和选择算子方法(Lasso),并利用其优秀的... 针对传统交通流预测模型正在由单断面历史数据处理向多断面、多时刻历史数据处理转变,但在考虑各断面间的影响时,多变的交通状况往往会使预测模型复杂化的问题,引入一种多元线性回归最小绝对收缩和选择算子方法(Lasso),并利用其优秀的变量选择能力,在复杂路网多断面中选出相关性较高的断面;结合神经网络(NN)的非线性特性,提出了Lasso-NN组合模型.结果表明:Lasso-NN模型在路网交叉口对未来15min交通流数据预测的误差率低于9.2%;在非交叉口的误差率低于6.7%,总体优于各自单独使用得出的结果. 展开更多
关键词 短时交通流预测 最小绝对收缩和选择算子 变量选择 神经网络
下载PDF
针对Lasso问题的多维权重求解算法 被引量:8
2
作者 陈善雄 刘小娟 +1 位作者 陈春蓉 郑方园 《计算机应用》 CSCD 北大核心 2017年第6期1674-1679,共6页
最小绝对收缩和选择算子(Lasso)在数据维度约减、异常检测方面有着较强的计算优势。针对Lasso用于异常检测中检测精度不高的问题,提出了一种基于多维度权重的最小角回归(LARS)算法解决Lasso问题。首先考虑每个回归变量在回归模型中所占... 最小绝对收缩和选择算子(Lasso)在数据维度约减、异常检测方面有着较强的计算优势。针对Lasso用于异常检测中检测精度不高的问题,提出了一种基于多维度权重的最小角回归(LARS)算法解决Lasso问题。首先考虑每个回归变量在回归模型中所占权重不同,即此属性变量在整体评价中的相对重要程度不同,故在LARS算法计算角分线时,将各回归变量与剩余变量的联合相关度纳入考虑,用来区分不同属性变量对检测结果的影响;然后在LARS算法中加入主成分分析(PCA)、独立权数法、基于Intercriteria相关性的指标的重要度评价(CRITIC)法这三种权重估计方法,并进一步对LARS求解的前进方向和前进变量选择进行优化。最后使用Pima Indians Diabetes数据集验证算法的优良性。实验结果表明,在更小阈值的约束条件下,加入多维权重后的LARS算法对Lasso问题的解具有更高的准确度,能更好地用于异常检测。 展开更多
关键词 最小绝对收缩和选择算子 变量选择 最小角回归 多元线性回归 加权
下载PDF
基于弹性网络模型的月度用电量预测方法 被引量:8
3
作者 胡春凤 田世明 苏航 《电力工程技术》 2020年第3期166-172,共7页
由于现有月度用电量预测所选影响因素较少,无法较为全面地反映与用电量强关联的因素,同时针对高维数据变量筛选和高精度预测等突出难题,文中提出了一种弹性网络用电量预测模型。为了考虑更为全面的影响因素,建立了用电量、气象、经济、... 由于现有月度用电量预测所选影响因素较少,无法较为全面地反映与用电量强关联的因素,同时针对高维数据变量筛选和高精度预测等突出难题,文中提出了一种弹性网络用电量预测模型。为了考虑更为全面的影响因素,建立了用电量、气象、经济、交通4类,共340个变量的数据集。首先对8年96个点的高维变量数据进行弹性网络因子筛选,然后使用Granger因果关系分析找出了用电量数据与其它数据的关联关系,对一年范围内的全社会月度用电量使用弹性网络进行预测,预测结果的平均绝对百分误差为3.07%。为验证该模型的有效性,对比向量自回归(VAR)模型,反向传播(BP)模型和最小绝对值收缩和选择算子(Lasso)预测的效果,验证了文中所提方法预测精度较高。 展开更多
关键词 弹性网络 最小绝对值收缩和选择算子 GRANGER因果关系 因子筛选 用电量预测
下载PDF
基于池的无监督线性回归主动学习 被引量:7
4
作者 刘子昂 蒋雪 伍冬睿 《自动化学报》 EI CAS CSCD 北大核心 2021年第12期2771-2783,共13页
在许多现实的机器学习应用场景中,获取大量未标注的数据是很容易的,但标注过程需要花费大量的时间和经济成本.因此,在这种情况下,需要选择一些最有价值的样本进行标注,从而只利用较少的标注数据就能训练出较好的机器学习模型.目前,主动... 在许多现实的机器学习应用场景中,获取大量未标注的数据是很容易的,但标注过程需要花费大量的时间和经济成本.因此,在这种情况下,需要选择一些最有价值的样本进行标注,从而只利用较少的标注数据就能训练出较好的机器学习模型.目前,主动学习(Active learning)已广泛应用于解决这种场景下的问题.但是,大多数现有的主动学习方法都是基于有监督场景:能够从少量带标签的样本中训练初始模型,基于模型查询新的样本,然后迭代更新模型.无监督情况下的主动学习却很少有人考虑,即在不知道任何标签信息的情况下最佳地选择要标注的初始训练样本.这种场景下,主动学习问题变得更加困难,因为无法利用任何标签信息.针对这一场景,本文研究了基于池的无监督线性回归问题,提出了一种新的主动学习方法,该方法同时考虑了信息性、代表性和多样性这三个标准.本文在3个不同的线性回归模型(岭回归、LASSO(Least absolute shrinkage and selection operator)和线性支持向量回归)和来自不同应用领域的12个数据集上进行了广泛的实验,验证了其有效性. 展开更多
关键词 主动学习 无监督学习 线性回归 支持向量回归 lasso 岭回归
下载PDF
基于LASSO算法的光谱变量选择方法研究 被引量:6
5
作者 王恺怡 杨盛 +1 位作者 郭彩云 卞希慧 《分析测试学报》 CAS CSCD 北大核心 2022年第3期398-402,408,共6页
光谱分析技术由于具有简单、快速、无损等优势,在复杂体系的定性和定量分析中得到了广泛应用。然而光谱中往往包含成百上千的波长点,有些波长点与研究的目标性质并不相关,加大了计算量并降低了模型的预测准确度。因此,在建立模型前需要... 光谱分析技术由于具有简单、快速、无损等优势,在复杂体系的定性和定量分析中得到了广泛应用。然而光谱中往往包含成百上千的波长点,有些波长点与研究的目标性质并不相关,加大了计算量并降低了模型的预测准确度。因此,在建立模型前需要进行变量选择。最小绝对收缩与选择算子(LASSO)可将回归系数收缩为0,进而达到变量选择的目的。该研究将LASSO用于三元调和油样品近红外光谱和生物样品拉曼光谱的变量选择,基于偏最小二乘(PLS)和多元线性回归(MLR)模型,分别对香油和肌氨酸的含量进行定量分析,并与无信息变量消除-PLS(UVE-PLS)、蒙特卡罗结合UVE-PLS(MCUVE-PLS)和随机检验-PLS(RT-PLS)3种变量选择方法进行比较。结果表明,基于LASSO的变量选择方法保留的变量数最少,运算速度最快。对三元调和油样品,LASSO-PLS预测的准确度最高;对生物样品,LASSO-MLR预测的准确度最高。因此,基于LASSO的变量选择算法有望在光谱分析领域中得到良好应用。 展开更多
关键词 多元校正 变量选择 最小绝对收缩与选择算子(lasso) 光谱分析
下载PDF
多传感器信息融合的轴承故障迁移诊断方法 被引量:2
6
作者 包从望 江伟 +1 位作者 张彩红 周大帅 《机电工程》 CAS 北大核心 2024年第5期878-885,共8页
在重型装备低速、重载、强噪声环境下,采用单一传感器难以全面获取轴承的故障诊断信息,导致故障识别率低、识别不稳定,致使变工况下轴承故障迁移诊断失效。针对以上问题,提出了一种多传感器信息融合的轴承故障迁移诊断方法。首先,结合... 在重型装备低速、重载、强噪声环境下,采用单一传感器难以全面获取轴承的故障诊断信息,导致故障识别率低、识别不稳定,致使变工况下轴承故障迁移诊断失效。针对以上问题,提出了一种多传感器信息融合的轴承故障迁移诊断方法。首先,结合传感器的通道数,构建了堆叠卷积神经网络(MCNNs)提取各个通道的故障特征;然后,在MCNNs中引入最小绝对收缩与选择算子(Lasso),并通过网络反向传播完成了特征权值的更新,从而获得了多通道特征的融合;最后,利用源域数据对模型进行了训练,提取了故障特征,并完成了特征融合,采用损失函数完成了模型参数的优化,将源域训练得到的模型结果作为目标域的初始模型,利用目标域样本对初始模型的参数进行了微调,从而完成了模型迁移;并进行了信息融合效果、方法对比以及传感器信息采集属性的性能实验。研究结果表明:传感器的安装位置对信息融合影响较大,MCNNs+Lasso方法具有较好的特征融合效果,平均迁移诊断精度为99.03%,部分精度可达99.97%,在多个变工况的迁移任务中表现出较高迁移精度和良好的泛化性能。 展开更多
关键词 滚动轴承 故障诊断 多传感器信息融合 堆叠卷积神经网络 最小绝对收缩与选择算子 迁移学习
下载PDF
LASSO回归和SARIMAX模型联合应用对广州市肾综合征出血热发病的预测效果研究 被引量:1
7
作者 祁娟 康燕 +2 位作者 陈海燕 许聪辉 魏跃红 《中国媒介生物学及控制杂志》 CAS 2024年第1期49-55,共7页
目的 比较3种时间序列模型对肾综合征出血热(HFRS)发病的预测效果,探索最小绝对值收缩与选择算子算法回归(LASSO)联合引入自变量的季节性差分自回归移动平均(SARIMAX)模型对HFRS的预测效果。方法 系统收集2006-2022年广州市HFRS发病数... 目的 比较3种时间序列模型对肾综合征出血热(HFRS)发病的预测效果,探索最小绝对值收缩与选择算子算法回归(LASSO)联合引入自变量的季节性差分自回归移动平均(SARIMAX)模型对HFRS的预测效果。方法 系统收集2006-2022年广州市HFRS发病数、鼠密度、气象及社会经济学数据,采用指数平滑法、SARIMAX以及通过LASSO-SARIMAX模型进行发病预测,通过自相关函数(ACF)、平均百分比误差(MPE)和平均绝对百分比误差(MAPE)评价模型的预测效果,通过MAPE对比3种模型不同预测时长的预测效果。结果 2006-2022年广州市HFRS年均发病率0.06/10万,指数平滑法(ETS)模型训练集的MAPE为45.066,SARIMA模型训练集的MAPE为51.403,LASSO-SARIMAX模型训练集的MAPE为39.466,除预测24月时低于ETS模型外,LASSO-SARIMAX模型训练数据集、预测12月的MAPE均最低。结论 LASSO回归联合SARIMAX模型在广州市HFRS发病的中短期预测中有较好效果。 展开更多
关键词 肾综合征出血热 预测 指数平滑法 季节性差分自回归滑动平均模型 最小绝对值收缩与选择算子算法回归
原文传递
基于粒化-融合的海量高维数据特征选择算法 被引量:4
8
作者 冀素琴 石洪波 +1 位作者 吕亚丽 郭珉 《模式识别与人工智能》 EI CSCD 北大核心 2016年第7期590-597,共8页
基于粒计算视角,提出粒化-融合框架下的海量高维数据特征选择算法.运用BLB(Bag of Little Bootstrap)的思想,首先将原始海量数据集粒化为小规模数据子集(粒),然后在每个粒上构建多个自助子集的套索模型,实现粒特征选择,最后,各粒特征选... 基于粒计算视角,提出粒化-融合框架下的海量高维数据特征选择算法.运用BLB(Bag of Little Bootstrap)的思想,首先将原始海量数据集粒化为小规模数据子集(粒),然后在每个粒上构建多个自助子集的套索模型,实现粒特征选择,最后,各粒特征选择结果按权重融合、排序,得到原始数据集的有序特征选择结果.人工数据集和真实数据集上的实验表明文中算法对海量高维数据集进行特征选择的可行性和有效性. 展开更多
关键词 海量高维数据 特征选择 粒计算 套索(lasso)
下载PDF
基于增量学习和Lasso融合的数据可视化模式识别方法 被引量:4
9
作者 梁怀新 郝连旺 +2 位作者 宋佳霖 郑存芳 洪文学 《高技术通讯》 EI CAS 北大核心 2018年第1期39-51,共13页
提出了一种基于增量学习和最小绝对值收缩和选择算子(Lasso)特征选择融合的数据可视化模式识别方法。该方法首先对归一化数据进行一级Lasso筛选特征降维,之后对连续数据进行基于Gini指数的粒化,再送入增量模式学习系统进行增量学习,针... 提出了一种基于增量学习和最小绝对值收缩和选择算子(Lasso)特征选择融合的数据可视化模式识别方法。该方法首先对归一化数据进行一级Lasso筛选特征降维,之后对连续数据进行基于Gini指数的粒化,再送入增量模式学习系统进行增量学习,针对维数大量升高的情况进行Lasso二级特征筛选生成一致模式决策表,生成属性偏序结构图可视化规则发现。数据采用来自UCI的5个数据库,并与分类器KNN,SVM,Adaboost,Random Forest进行分类准确度比较,实验表明,基于该算法的分类精度普遍高于其他分类器水平,且属性偏序结构图可视化层次清晰鲜明。通过增量学习实验设计,得到了准确率、图结构更新和不同比例增量数据的动态关系,其中Pima Indians Diabetes数据学习达到40%时准确率(77.66%)超过Adaboost(75.32%)、SVM(77.27%)、1NN(59.74%)、3NN(75.97%)算法。结果表明该算法进行数据的可视化和模式识别是行之有效的。 展开更多
关键词 增量学习 最小绝对值收缩和选择算子(lasso) 属性偏序结构图 可视化 模式识别 粒化
下载PDF
基于LASSO-ISAPSO-ELM的含蜡原油管道蜡沉积速率预测 被引量:4
10
作者 骆正山 潘柯成 《安全与环境工程》 CAS CSCD 北大核心 2022年第6期69-77,共9页
为提高含蜡原油管道蜡沉积速率的预测精度,保障含蜡原油管道安全运行,提出一种基于套索算法(LASSO)和改进模拟退火粒子群算法(ISAPSO)融合极限学习机(ELM)的含蜡原油管道蜡沉积速率预测模型。首先利用LASSO提取含蜡原油管道蜡沉积速率... 为提高含蜡原油管道蜡沉积速率的预测精度,保障含蜡原油管道安全运行,提出一种基于套索算法(LASSO)和改进模拟退火粒子群算法(ISAPSO)融合极限学习机(ELM)的含蜡原油管道蜡沉积速率预测模型。首先利用LASSO提取含蜡原油管道蜡沉积速率的关键影响因素,简化样本指标;然后对模拟退火粒子群(SAPSO)的种群初始化、惯性权重和学习因子进行改进,并利用其优化ELM的输入权重和隐含层节点阈值;最后以青海某厂原油为试验油样,通过开展室内环道试验获取85组数据样本,将预处理后的样本数据集代入模型计算,对含蜡原油管道蜡沉积速率进行预测,并将LASSO-ISAPSO-ELM模型的预测结果与BPNN模型和PSO-SVM模型的预测结果进行对比。结果表明:经LASSO筛选,得到5项影响含蜡原油管道蜡沉积速率的关键因素;ISAPSO比SAPSO提前43代收敛且寻优精度更优;LASSO-ISAPSO-ELM模型预测结果的均方根误差、平均相对误差和希尔不等系数分别低达0.06983、0.69373%、0.00336,与其他模型相比,LASSO-ISAPSO-ELM模型的预测精度更高。 展开更多
关键词 含蜡原油管道 蜡沉积速率 套索算法(lasso) 改进模拟退火粒子群算法(ISAPSO) 极限学习机(ELM)
下载PDF
Variable Selection via Biased Estimators in the Linear Regression Model
11
作者 Manickavasagar Kayanan Pushpakanthie Wijekoon 《Open Journal of Statistics》 2020年第1期113-126,共14页
Least Absolute Shrinkage and Selection Operator (LASSO) is used for variable selection as well as for handling the multicollinearity problem simultaneously in the linear regression model. LASSO produces estimates havi... Least Absolute Shrinkage and Selection Operator (LASSO) is used for variable selection as well as for handling the multicollinearity problem simultaneously in the linear regression model. LASSO produces estimates having high variance if the number of predictors is higher than the number of observations and if high multicollinearity exists among the predictor variables. To handle this problem, Elastic Net (ENet) estimator was introduced by combining LASSO and Ridge estimator (RE). The solutions of LASSO and ENet have been obtained using Least Angle Regression (LARS) and LARS-EN algorithms, respectively. In this article, we proposed an alternative algorithm to overcome the issues in LASSO that can be combined LASSO with other exiting biased estimators namely Almost Unbiased Ridge Estimator (AURE), Liu Estimator (LE), Almost Unbiased Liu Estimator (AULE), Principal Component Regression Estimator (PCRE), r-k class estimator and r-d class estimator. Further, we examine the performance of the proposed algorithm using a Monte-Carlo simulation study and real-world examples. The results showed that the LARS-rk and LARS-rd algorithms,?which are combined LASSO with r-k class estimator and r-d class estimator,?outperformed other algorithms under the moderated and severe multicollinearity. 展开更多
关键词 Variable selection least absolute shrinkage and selection operator (lasso) least Angle Regression (LARS) Elastic Net (ENet) Biased ESTIMATORS
下载PDF
肺鳞癌免疫基因组学分型及预测模型构建 被引量:2
12
作者 林雪莲 肖又德 +4 位作者 陈祥 余雷 缪洪涛 郑永法 戈伟 《生物医学工程与临床》 CAS 2021年第6期749-756,共8页
目的通过基因组学分析建立肺鳞癌免疫分型,并进一步探索其临床应用价值。方法通过检索下载分析癌症基因组图谱(TCGA)数据库中所有肺鳞癌数据包括患者基因表达谱及临床数据(检索时间:建库到2021年1月4日),通过单样本基因集富集分析(ssGS... 目的通过基因组学分析建立肺鳞癌免疫分型,并进一步探索其临床应用价值。方法通过检索下载分析癌症基因组图谱(TCGA)数据库中所有肺鳞癌数据包括患者基因表达谱及临床数据(检索时间:建库到2021年1月4日),通过单样本基因集富集分析(ssGSEA)对患者进行分组,利用基因表达数据估算恶性肿瘤组织中的基质细胞和免疫细胞占比(ESTIMATE)及通过估计RNA转录本的识别细胞类型(CIBERSORT)分别评估各样本中肿瘤微环境的组成及免疫细胞数量;套索算法(LASSO)筛选并构建预测模型。结果纳入501例肺鳞癌患者进行分析。其中男性371例,女性130例;平均年龄67.2岁(标准差8.6岁)。病理分期:Ⅰ期244例,Ⅱ期162例,Ⅲ期84例,Ⅳ期75例,分期不明5例。77例没有吸烟史,424例有吸烟史。白种人349例,黑种人30例,亚洲人种9例,不明113例。依据ssGSEA将患者分为高、中、低免疫组,中/高免疫组所包含的免疫细胞、基质细胞数量、大部分人类白细胞抗原(HLA)基因表达及程序性死亡受体-1(PD-L1)基因表达较低免疫组高;基因本体论(GO)及京都基因和基因组百科全书(KEGG)分析主要集中于细胞免疫功能。同时基于LASSO分析筛选获得了HLA-A和HLA-E,并构建了生存分析预测模型。结论高/中免疫组肺鳞癌患者具有较高的免疫原性及抗肿瘤免疫活性。同时基于LASSO筛选的HLA-A和HLA-E及据此构建的生存风险模型具有较强预测肺鳞癌患者的预后能力,可为肺鳞癌免疫治疗的研究提供参考依据。 展开更多
关键词 肺鳞癌 癌症基因组图谱(TCGA)数据库 免疫分型 套索算法(lasso) 预后
下载PDF
基于稀疏主元分析的过程监控研究 被引量:2
13
作者 彭必灿 张正道 《计算机工程与应用》 CSCD 2014年第18期240-245,250,共7页
主元分析(principal component analysis)是一种多元统计技术,在过程监控和故障诊断中具有广泛的应用。针对过程监控中数据量大的特点,提出一种稀疏主元分析(sparse principal component analysis)方法,通过引入lasso约束函数,构建稀疏... 主元分析(principal component analysis)是一种多元统计技术,在过程监控和故障诊断中具有广泛的应用。针对过程监控中数据量大的特点,提出一种稀疏主元分析(sparse principal component analysis)方法,通过引入lasso约束函数,构建稀疏主元分析的框架,将PCA降维问题转化为回归最优化问题,从而求解得到稀疏化的主元,并提高了主元模型的抗干扰能力。由于稀疏后主元相关的数据量减少,利用数据建立过程监控模型,减少了计算量,并缩短了计算时间,进而提高了监控的实时性。利用田纳西伊斯特曼过程(TE processes)进行实验仿真,并与传统的主元分析方法进行对比研究。结果表明,新提出的稀疏主元分析方法在计算效率和监控实时性上均优于传统的主元分析方法。 展开更多
关键词 最小绝对收缩和选择算子(lasso) 稀疏主元分析 状态监控 田纳西伊斯特曼(TE)过程
下载PDF
基于Post-LASSO方法的就医需求多控制变量选择 被引量:1
14
作者 胡晓辉 刘艳飞 蒋蕾 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2018年第10期2659-2667,共9页
分析省级层面就医需求的政策变量和交互要素,并控制地区和时间效应的异质性,为精确估计医疗改革效应和医疗机构区域合理布局提供科学依据.以就医需求和就医供给的代理变量、区域特征控制变量建立指标体系,采用Post-double-selection-LA... 分析省级层面就医需求的政策变量和交互要素,并控制地区和时间效应的异质性,为精确估计医疗改革效应和医疗机构区域合理布局提供科学依据.以就医需求和就医供给的代理变量、区域特征控制变量建立指标体系,采用Post-double-selection-LASSO方法选择潜在变量及其函数形式.一阶差分、全控制变量和各省标准差集聚三个模型的比较结果显示,标准差集聚模型较好地控制时间趋势和初始差异,证实复杂就医需求的影响因素包括医院规模、医疗业务、医疗价格、区域特征,以及医疗收入和人口密度的交互作用.由此,应考虑不同工具变量的传递路径、不同区域特征及其初始差异和交互要素对就医需求的影响,以实现医疗资源空间均衡化. 展开更多
关键词 就医 工具变量 交互要素 最小绝对收缩和选择算子(lasso)
原文传递
基于最小绝对收缩与选择算子模型稀疏恢复的多目标检测 被引量:1
15
作者 洪刘根 郑霖 杨超 《计算机应用》 CSCD 北大核心 2017年第8期2184-2188,共5页
针对地面多径环境下运动目标检测,使用最小绝对收缩与选择算子(LASSO)算法在参数估计时会出现伪目标的问题,提出一种基于LASSO模型框架的设计矩阵降维构造方法。首先,信号的多径传播能够带来目标检测的空间分集,信号在不同的多径上有不... 针对地面多径环境下运动目标检测,使用最小绝对收缩与选择算子(LASSO)算法在参数估计时会出现伪目标的问题,提出一种基于LASSO模型框架的设计矩阵降维构造方法。首先,信号的多径传播能够带来目标检测的空间分集,信号在不同的多径上有不同的多普勒频移;此外,使用宽带正交频分复用(OFDM)信号能够带来频率分集。由于空间分集和频率分集的引入造成目标的稀疏特性。利用多径的稀疏性和对环境的先验知识,去估计稀疏向量。仿真结果表明,在一定信噪比(SNR,-5 d B)下,基于设计矩阵降维构造方法的改进的LASSO算法比基追踪算法(BP)、DS(Dantzig Selector)、LASSO等传统算法的检测性能有明显提高;在一定虚警率(0.1)条件下,改进的LASSO算法比原LASSO算法检测概率提高了30%。所提算法能够有效去除伪目标,提高雷达目标检测概率。 展开更多
关键词 多径效应 稀疏向量恢复 多目标检测 最小绝对收缩与选择算子 正交频分复用信号雷达
下载PDF
一种利用Screening加速技巧的Lasso算法
16
作者 邱俊洋 潘志松 +2 位作者 易磊 陶蔚 张梁梁 《计算机工程与应用》 CSCD 北大核心 2018年第4期135-140,共6页
Lasso(Least absolute shrinkage and selection operator)是目前广为应用的一种稀疏特征选择算法。经典的Lasso算法通过对高维数据进行特征选择一定程度上降低了计算开销,然而,求解Lasso问题目前仍面临诸多困难与挑战,例如当特征维数... Lasso(Least absolute shrinkage and selection operator)是目前广为应用的一种稀疏特征选择算法。经典的Lasso算法通过对高维数据进行特征选择一定程度上降低了计算开销,然而,求解Lasso问题目前仍面临诸多困难与挑战,例如当特征维数和样本数量非常大时,甚至无法将数据矩阵加载到主存储器中。为了应对这一挑战,Screening加速技巧成为近年来研究的热点。Screening可以在问题优化求解之前将稀疏优化结果中系数必然为0的无效特征筛选出来并剔除,从而极大地降低数据维度,在不损失问题求解精度的前提下,加速稀疏优化问题的求解速度。首先推导了Lasso的对偶问题,根据对偶问题的特性得出基于对偶多面投影的Screening加速技巧,最后将Screening加速技巧引入Lasso特征选择算法,并在多个高维数据集上进行实验,通过加速比、识别率以及算法运行时间三个指标验证了Screening加速技巧在Lasso算法上的良好性能。 展开更多
关键词 lasso算法 Screening加速技巧 稀疏特征选择 高维数据
下载PDF
轨迹优化的LASSO网格自适应加密方法 被引量:5
17
作者 张松 侯明善 《系统工程与电子技术》 EI CSCD 北大核心 2016年第5期1195-1200,共6页
针对轨迹优化直接方法,提出了以控制变量曲率为基础的最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)网格自适应加密策略,用于提高优化精度。以高分辨率二分网格节点为中心,构造径向基函数逼近控制曲... 针对轨迹优化直接方法,提出了以控制变量曲率为基础的最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)网格自适应加密策略,用于提高优化精度。以高分辨率二分网格节点为中心,构造径向基函数逼近控制曲线,利用LASSO方法估计径向基函数系数,并自动筛选出位于控制曲线曲率极大区间的高分辨率节点加密当前网格。本文方法不需要进行状态和控制误差估计,适应性和通用性强。两组典型算例验证了方法的有效性。 展开更多
关键词 轨迹优化 网格加密 最小绝对收缩与选择 径向基函数
下载PDF
基于LASSO回归和Nomogram预测经皮肾活检术后出血风险
18
作者 李铖铖 梅莞翠 +1 位作者 柏刚 张忠磊 《中国医学工程》 2024年第8期8-15,共8页
目的探讨超声引导下经皮肾穿刺活检术后出血的危险因素,并构建列线图预测模型。方法回顾性收集2022年6月1日至2023年6月1日在十堰市太和医院超声医学科进行实时超声引导下经皮肾穿刺活检住院患者的临床及影像资料。采用LASSO回归、Logis... 目的探讨超声引导下经皮肾穿刺活检术后出血的危险因素,并构建列线图预测模型。方法回顾性收集2022年6月1日至2023年6月1日在十堰市太和医院超声医学科进行实时超声引导下经皮肾穿刺活检住院患者的临床及影像资料。采用LASSO回归、Logistic回归分析,构建超声引导下肾穿刺活检术后出血的列线图预测模型,利用受试者工作特征(ROC)曲线、校正曲线(calibration curve)和决策曲线分析(DCA)三个层面对模型进行评估。结果最终纳入206例超声引导下肾穿刺活检的患者。LASSO回归及Logistic回归分析结果显示,高血压病史(OR=5.339,P<0.001)、穿刺肾下极皮质厚度(OR=0.410,P<0.001)、穿刺肾皮髓质分界不清(OR=6.133,P<0.001)和穿刺时患者不能配合(OR=4.525,P=0.004)是超声引导下肾穿刺活检后出血的独立危险因素。列线图预测模型具有良好的诊断效能AUC=0.891,95%CI为0.842~0.941,绘制模型校准曲线,平均绝对误差为0.026,理想曲线和校正曲线贴合较好。Hosmer-Lemeshow检测χ^(2)=6.599,P=0.580(P>0.05),表明该模型的准确度较好。绘制临床决策曲线显示当列线图预测模型的阈概率小于89%时,该模型的临床净收益率最高。结论高血压病史、穿刺肾下极皮质厚度、穿刺肾皮髓质分界不清、穿刺时患者不能配合是超声引导下肾穿刺活检术后出血的危险因素;基于列线图模型预测超声引导下肾穿刺活检术后出血具有可行性,可以为临床评估肾穿刺活检后出血风险提供可视化依据。 展开更多
关键词 肾活检 出血 高危因素 lasso回归 列线图
下载PDF
高维数据挖掘中特征选择的稳健方法 被引量:3
19
作者 李泽安 陈建平 +1 位作者 章雅娟 赵为华 《计算机应用》 CSCD 北大核心 2013年第8期2194-2197,2235,共5页
针对高维数据的特点,即数据中变量个数往往大于样本观测数目,并且数据往往具有异质性特点,基于众数回归分析和变量选择降维技术,提出了一种稳健有效的特征选择方法,利用局部二次逼近算法(LQA)和最大期望(EM)算法,给出估计算法和最优调... 针对高维数据的特点,即数据中变量个数往往大于样本观测数目,并且数据往往具有异质性特点,基于众数回归分析和变量选择降维技术,提出了一种稳健有效的特征选择方法,利用局部二次逼近算法(LQA)和最大期望(EM)算法,给出估计算法和最优调节参数的选取方法。通过实验的模拟数据分析表明,所提出的特征提取选择方法整体优于基于最小二乘和中位数的正则化估计方法,特别当误差是非正态分布时,与已有方法相比具有较高的预测能力和稳健性。 展开更多
关键词 高维数据 特征选择 众数回归 自适应lasso 最大期望算法
下载PDF
采用多源信息融合的妊娠猪舍环境质量评价方法 被引量:3
20
作者 迟宇 郭艳娇 +2 位作者 冯涵 李寒 郑永军 《农业工程学报》 EI CAS CSCD 北大核心 2022年第18期212-221,共10页
妊娠猪舍作为养殖场猪只繁育的基础条件,其环境质量对母猪的生产性能有显著影响。为合理评价妊娠猪舍环境质量,该研究提出一种基于模拟退火的粒子群算法(Simulated Annealing-Particle Swarm Optimization,SA-PSO)、套索算法(Least Abso... 妊娠猪舍作为养殖场猪只繁育的基础条件,其环境质量对母猪的生产性能有显著影响。为合理评价妊娠猪舍环境质量,该研究提出一种基于模拟退火的粒子群算法(Simulated Annealing-Particle Swarm Optimization,SA-PSO)、套索算法(Least Absolute Shrinkage and Selection Operator,LASSO)和反向传播(Back Propagation,BP)神经网络的环境质量评价模型。利用卡尔曼滤波和分批估计自适应加权融合算法,实现多节点环境数据的时间与空间序列融合;构建猪舍环境质量非线性评价模型,采用LASSO算法,筛选得出与环境质量强相关的特征参数,实现输入降维;融合SA-PSO算法实现网络初始权值和阈值的优化,形成SA-PSO-LASSO-BP神经网络评价模型。通过对数据采集系统获取的实际妊娠猪舍环境数据进行验证,结果表明:提出的环境质量评价模型决定系数为0.918、总准确率为95.85%,相比单纯使用BP神经网络,加入LASSO和SA-PSO算法后决定系数与总准确率分别提高了37.43%、11.09个百分点,具有更高的评价精度和性能,可更好地拟合复杂环境参数与环境质量间的非线性关系,为妊娠猪舍环境质量评价提供参考。 展开更多
关键词 模型 环境 妊娠猪舍 环境质量 BP神经网络 lasso算法 SA-PSO算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部