期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
权重概率主成分分析模型的建立及应用研究 被引量:7
1
作者 高兵 孙琳 +4 位作者 谢彪 王文佶 刘美娜 张秋菊 《中国卫生统计》 CSCD 北大核心 2018年第6期802-805,共4页
目的建立权重概率主成分分析模型,通过模拟实验进行模型评价,选择最优模型进行代谢组学数据分析,为代谢组学数据分析提供降噪优化的分析方法。方法使用折刀抽样法计算变量载荷的置信区间和变异系数,利用变量载荷的变异信息设计倒数式、... 目的建立权重概率主成分分析模型,通过模拟实验进行模型评价,选择最优模型进行代谢组学数据分析,为代谢组学数据分析提供降噪优化的分析方法。方法使用折刀抽样法计算变量载荷的置信区间和变异系数,利用变量载荷的变异信息设计倒数式、开根式、对数式三种加权方式进行原始数据中的变量加权,结合概率主成分分析模型建立权重概率主成分分析模型;通过模拟实验从第一主成分载荷的估计和预测效能进行模型评价,选择最优权重概率主成分分析模型;绘制代谢组学数据主成分得分图,利用中心距离比较权重概率主成分分析模型与概率主成分分析模型在可视化分组效果。结果倒数式加权概率模型在第一主成分载荷的估计和模型预测方面优于另外两种权重概率模型。在可视化方面,权重概率主成分分析不仅缩小了模型估计的不确定性,而且增大组间的中心距离。结论构建了权重概率主成分分析模型,不仅结果解释和可视化优于概率主成分分析模型,而且为差异变量的筛选提供了一个较小的参考范围。 展开更多
关键词 代谢组学 变量筛选 概率主成分分析 权重
下载PDF
基于色谱-质谱平台的代谢组学数据预处理方法 被引量:6
2
作者 孙琳 张秋菊 +4 位作者 王文佶 谢彪 高兵 刘美娜 《中国卫生统计》 CSCD 北大核心 2017年第3期518-522,共5页
代谢组学的概念自20世纪90年代被正式提出,已被广泛应用于医学研究领域,其一般研究流程包括样本采集、样本检测、数据预处理、数据分析和生物学解释等。常用的样本检测技术有核磁共振(nuclear magnetic resonance,NMR)和高分辨率色谱... 代谢组学的概念自20世纪90年代被正式提出,已被广泛应用于医学研究领域,其一般研究流程包括样本采集、样本检测、数据预处理、数据分析和生物学解释等。常用的样本检测技术有核磁共振(nuclear magnetic resonance,NMR)和高分辨率色谱-质谱联用技术,本文所述方法针对后者。 展开更多
关键词 代谢组学 数据预处理方法 色谱-质谱 样本采集 医学研究领域 研究流程 数据分析 高分辨率 噪声强度 缺失数据
下载PDF
多次交叉验证对PLSDA模型的影响研究 被引量:5
3
作者 张秋菊 +4 位作者 王文佶 谢彪 孙琳 高兵 刘美娜 《中国卫生统计》 CSCD 北大核心 2017年第1期15-17,22,共4页
目的比较一次交叉验证和多次交叉验证对PLSDA最优模型的影响,探讨在个体正确分组和少数个体错分时,多次交叉验证对PLSDA最优模型稳定性的影响。方法打乱数据集中个体顺序进行多次交叉验证,通过一次交叉验证和多次交叉验证的方法对模拟... 目的比较一次交叉验证和多次交叉验证对PLSDA最优模型的影响,探讨在个体正确分组和少数个体错分时,多次交叉验证对PLSDA最优模型稳定性的影响。方法打乱数据集中个体顺序进行多次交叉验证,通过一次交叉验证和多次交叉验证的方法对模拟数据和真实数据进行分析,使用成分数和MSEP等参数值来评价模型变异性和稳定性。结果模拟数据结果,仅进行1次交叉验证结果成分数为3,MSEP值为0.3792;在不打乱数据标签时,5000次交叉验证结果中,成分数范围是2~6,MSEP值的范围0.2569~0.5794;打乱5%的标签时,5000次交叉验证结果中,成分数范围是1~8,MSEP值的范围0.2061~0.6463;真实数据结果,进行1次交叉验证结果成分数为4,MSEP值为0.1376;10000次交叉验证成分数范围是4~10,MSEP范围是0.0802~0.3761。结论一次交叉验证结果不稳定,在应用PLSDA建模时,多次交叉验证在少量个体错分时能够获得稳定模型,建议使用多次交叉验证确保PLSDA模型稳定性。 展开更多
关键词 交叉验证 PLSDA 高维数据
下载PDF
动态代谢组学数据分析方法介绍 被引量:5
4
作者 王文佶 张秋菊 +4 位作者 谢彪 高兵 孙琳 刘美娜 《中国卫生统计》 CSCD 北大核心 2016年第6期1075-1078,共4页
近年来,代谢组学发展迅速并广泛应用于营养学、毒理学、疾病诊断等各个领域。随着研究的深入,代谢组学所获得的数据集因研究设计的不同而日益复杂,产生了有时间间隔的动态代谢组学数据。然而目前分析此类数据的方法十分有限,并且在... 近年来,代谢组学发展迅速并广泛应用于营养学、毒理学、疾病诊断等各个领域。随着研究的深入,代谢组学所获得的数据集因研究设计的不同而日益复杂,产生了有时间间隔的动态代谢组学数据。然而目前分析此类数据的方法十分有限,并且在大多数情况下,这种动态数据所带来的因时间因素产生的变异直接被忽略。 展开更多
关键词 代谢组学 数据集 疾病诊断 时间间隔 动态数据 营养学 毒理学
下载PDF
基于logistic回归模型的儿童过敏性紫癜影响因素研究 被引量:2
5
作者 谢彪 +3 位作者 相静 罗潇 王文佶 刘美娜 《中国医院统计》 2015年第5期333-337,共5页
目的:分析儿童过敏性紫癜的影响因素,为疾病的预防提供线索和依据。方法通过调查问卷收集414名过敏性紫癜及对照组儿童的相关信息;分别采用t检验、χ2检验和秩和检验比较病例组和对照组的差异。利用logistic回归模型分析儿童过敏性... 目的:分析儿童过敏性紫癜的影响因素,为疾病的预防提供线索和依据。方法通过调查问卷收集414名过敏性紫癜及对照组儿童的相关信息;分别采用t检验、χ2检验和秩和检验比较病例组和对照组的差异。利用logistic回归模型分析儿童过敏性紫癜的影响因素。结果单因素分析结果显示,病例组和对照组年龄、母亲和父亲受教育程度差异有统计学意义;饮食规律性、食用生冷、油炸和辛辣食物、肉类、饮料、奶及奶制品、水果和蔬菜差异有统计学意义;出生方式、母乳喂养、混合喂养以及母亲孕前接触有害物质差异有统计学意义。调整年龄、性别和母亲受教育程度后多因素分析结果显示,儿童过敏性紫癜的保护因素有:生活在农村地区、睡眠时间、水果食用频率、甜食食用频率、肉类食用频率、母亲受教育程度;儿童过敏性紫癜的危险因素有:混合喂养、口嚼食物喂养、怀孕期间患病、生冷食物食用频率、坚果食用频率、辛辣食物食用频率。结论保证儿童充足的睡眠、少吃生冷和辛辣食物以及充足的肉类和水果可以降低过敏性紫癜的发生风险;预防过敏性紫癜还可以提倡母乳喂养、避免口嚼食物喂养。 展开更多
关键词 过敏性紫癜 儿童 LOGISTIC回归分析 影响因素
下载PDF
医院过敏患者数据信息系统在线统计分析功能的实现
6
作者 于磊 张茂祥 +2 位作者 李昂 刘美娜 《中国卫生信息管理杂志》 2015年第6期644-647,653,共5页
目的利用SAS软件实现过敏患者数据信息系统的在线统计分析功能,高效快速地获得过敏患者数据动态分析结果。方法 Windows环境下,以Apache为服务器,SAS统计软件的WEB功能采用SAS/Intr Net实现;MySQL数据库与SAS之间的连接采用MySQL ODBC D... 目的利用SAS软件实现过敏患者数据信息系统的在线统计分析功能,高效快速地获得过敏患者数据动态分析结果。方法 Windows环境下,以Apache为服务器,SAS统计软件的WEB功能采用SAS/Intr Net实现;MySQL数据库与SAS之间的连接采用MySQL ODBC Driver 5.3.4完成;编写SAS程序并制作相应的HTML页面。结果实现了SAS的WEB功能及SAS软件与MySQL数据库的连接,为医院过敏患者数据信息系统增加了在线统计分析功能;终端用户可以通过在浏览器上点击式操作,完成与服务器端SAS软件的互动,调用过敏患者数据信息系统中的数据实现在线统计分析功能,获得相应的分析结果。结论利用SAS软件的WEB功能可以实现信息系统在线统计分析功能,为使用者提供动态的数据分析结果。 展开更多
关键词 过敏患者 信息系统 在线统计分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部