目的提出一种新的挑选定标集的方法-偏最小二乘留一交叉验证法。方法以玉米为例,通过对玉米中水分含量的实际建模与外部验证,根据主成分数、相关系数、预测均方根差以及相对分析误差(ratio of performance to standard deviate,RPD)等因...目的提出一种新的挑选定标集的方法-偏最小二乘留一交叉验证法。方法以玉米为例,通过对玉米中水分含量的实际建模与外部验证,根据主成分数、相关系数、预测均方根差以及相对分析误差(ratio of performance to standard deviate,RPD)等因素,综合比较4种定标集挑选方法的优缺点。结果偏最小二乘留一交叉验证法结合样品和光谱性质,在保持原始样品覆盖范围的基础上,挑选出的定标集所建立的模型具有较低的模型复杂程度、较高的验证相关系数以及较高的RPD值。结论该方法既克服了随机挑选法存在的样品代表性不足的风险,同时也避免了含量梯度法和计算机识别法只考虑样品或者光谱的单一性质的不足,同时该方法具有操作简单、易于推广等优点,为食品安全检测提供了一种新的筛选样品的方法。展开更多
土壤有机质含量可见-近红外光谱反演过程中校正集的构建策略对模型的预测精度有重要影响。以江汉平原洪湖地区水稻土为研究对象,采用Kennard-Stone(KS)法,Rank-KS(RKS)和Sample set Partitioning based on joint X-Y distance(SPXY)法,...土壤有机质含量可见-近红外光谱反演过程中校正集的构建策略对模型的预测精度有重要影响。以江汉平原洪湖地区水稻土为研究对象,采用Kennard-Stone(KS)法,Rank-KS(RKS)和Sample set Partitioning based on joint X-Y distance(SPXY)法,构建样本数占总校正集不同比例的子校正集,通过偏最小二乘回归,建立土壤有机质含量的可见—近红外光谱反演模型。结果表明:KS法无法提高模型预测精度,但可以在保证标准差与预测均方根误差比(ratio of performance to standard deviation,RPD)>2.0的前提下减少30%的校正样本;基于SPXY法的模型,当子校正集样本比例为总校正集的50%时达到最佳的模型预测精度,RPD为2.557;RKS法能够在保证预测精度的情况下(RPD>2.0),最多减少总校正集70%的样本,对应模型RPD为2.212。当校正集与验证集的有机质含量分布相近时,能够以较少的建模样本达到与总校正集相近甚至更高的模型预测精度,提升土壤有机质光谱反演模型的实用性。展开更多
文摘目的提出一种新的挑选定标集的方法-偏最小二乘留一交叉验证法。方法以玉米为例,通过对玉米中水分含量的实际建模与外部验证,根据主成分数、相关系数、预测均方根差以及相对分析误差(ratio of performance to standard deviate,RPD)等因素,综合比较4种定标集挑选方法的优缺点。结果偏最小二乘留一交叉验证法结合样品和光谱性质,在保持原始样品覆盖范围的基础上,挑选出的定标集所建立的模型具有较低的模型复杂程度、较高的验证相关系数以及较高的RPD值。结论该方法既克服了随机挑选法存在的样品代表性不足的风险,同时也避免了含量梯度法和计算机识别法只考虑样品或者光谱的单一性质的不足,同时该方法具有操作简单、易于推广等优点,为食品安全检测提供了一种新的筛选样品的方法。
文摘土壤有机质含量可见-近红外光谱反演过程中校正集的构建策略对模型的预测精度有重要影响。以江汉平原洪湖地区水稻土为研究对象,采用Kennard-Stone(KS)法,Rank-KS(RKS)和Sample set Partitioning based on joint X-Y distance(SPXY)法,构建样本数占总校正集不同比例的子校正集,通过偏最小二乘回归,建立土壤有机质含量的可见—近红外光谱反演模型。结果表明:KS法无法提高模型预测精度,但可以在保证标准差与预测均方根误差比(ratio of performance to standard deviation,RPD)>2.0的前提下减少30%的校正样本;基于SPXY法的模型,当子校正集样本比例为总校正集的50%时达到最佳的模型预测精度,RPD为2.557;RKS法能够在保证预测精度的情况下(RPD>2.0),最多减少总校正集70%的样本,对应模型RPD为2.212。当校正集与验证集的有机质含量分布相近时,能够以较少的建模样本达到与总校正集相近甚至更高的模型预测精度,提升土壤有机质光谱反演模型的实用性。