-
题名数据分析中的数据质量识别
被引量:5
- 1
-
-
作者
吴喜之
闫洁
-
机构
中国人民大学统计学院
-
出处
《统计与信息论坛》
2006年第6期12-16,27,共6页
-
基金
自然科学基金重点项目(10431010)
教育部重点基地重大项目(05JJD910001)
中国人民大学应用统计中心资助。
-
文摘
数据的质量直接影响数据分析的效率和分析结果的可靠性。数据质量包括数据结构质量和给定数据结构后的数据真实性、一致性和完整性。在着重考虑拿到数据之后,从单元格、记录、变量三个角度如何识别数据中潜在的质量问题,并以案例为支撑,介绍了各种可能出现的问题。
-
关键词
数据质量
缺失值
异常值
无效记录
无效变量
-
Keywords
data quality
missing values
abnormal values
invalid reoords
invalid variables
-
分类号
F224.0
[经济管理—国民经济]
-
-
题名背包问题的若干性质及问题的简化
被引量:1
- 2
-
-
作者
钟海林
叶祥企
-
机构
江西师范大学数学与信息科学学院
-
出处
《江西科学》
2008年第1期46-47,共2页
-
文摘
对单约束线性整数规划(ILP,背包问题)的特性进行了分析,通过剪去无效变量对问题进行简化,并给出了问题的一个上界及最优值判定条件。
-
关键词
整数规划
背包问题
无效变量
-
Keywords
ILP, Knapsack problem, Invalided variable
-
分类号
O221
[理学—运筹学与控制论]
-
-
题名无效变量消除法在油菜籽芥酸近红外无损速测中的应用
被引量:2
- 3
-
-
作者
丁小霞
李培武
刘培
唐晓倩
张文
陈小媚
-
机构
中国农业科学院油料作物研究所
农业部油料及制品质量监督检验测试中心
农业部油料作物生物学重点开放实验室
-
出处
《中国油料作物学报》
CAS
CSCD
北大核心
2010年第3期441-446,共6页
-
基金
国家油菜现代产业技术体系基金(nycytx-005)
国家科技支撑计划基金(2010BAD01B07)
湖北省自然科学基金(2002AB098)
-
文摘
探索改善油菜籽芥酸近红外预测模型准确度与精密度的方法,利用无效变量消除法(UVE),对135个油菜籽样品近红外光谱信号进行筛选,并利用筛选后的光谱对油菜籽芥酸含量进行偏最小二乘法交叉验证。结果表明,UVE法筛选变量后建立的芥酸校正模型对未知样品预测结果的准确度和速度显著优于全波长参与建立的芥酸校正模型。散射校正加一阶导数对光谱预处理,UVE法筛选变量,偏最小二乘法交叉验证建立的校正模型效果最好,其预测值与标准值的相关系数R达到0.92,交叉验证预测均方差为2.2。因此,用UVE进行波长选择后建立的近红外模型,能准确快速地对油菜籽芥酸含量进行定量分析。
-
关键词
油菜籽
近红外光谱
无效变量消除法
偏最小二乘法
-
Keywords
Rapeseed
Near-infrared reflectance spectroscopy(NIRS)
Uninformative variables elimination(UVE)
Partial least squares(PLS)
-
分类号
Q946.81
[生物学—植物学]
S330.35
[农业科学—作物遗传育种]
-
-
题名孟德尔随机化中多效性偏倚校正方法简介
被引量:14
- 4
-
-
作者
高雪
王慧
王彤
-
机构
山西医科大学公共卫生学院卫生统计教研室
-
出处
《中华流行病学杂志》
CAS
CSCD
北大核心
2019年第3期360-365,共6页
-
基金
国家自然科学基金(81872715).
-
文摘
孟德尔随机化以遗传变异作为工具变量,对感兴趣的暴露因素与结局的因果关联进行估计及评价。遗传变异作为有效工具变量需要满足强关联假设及无多效性假设。然而,由于遗传变异与表型性状间存在复杂的生物学效应,其作为工具变量的多效性往往无法避免。基于此,本文分别从工具变量筛选、无效工具变量检验、校正多效性的模型构建以及敏感性分析等方面介绍无效工具变量的多效性偏倚校正方法。在实际应用中,研究者应结合数据类型、样本含量、分析假设等多个方面选择合适的方法进行分析与推断,从而得到一致、稳健的因果效应估计量。
-
关键词
孟德尔随机化
多效性
无效工具变量
校正模型
-
Keywords
Mendelian randomization
Pleiotropy
Invalid instrumental variables
Correction model
-
分类号
R195.1
[医药卫生—卫生统计学]
-