利用最大最小爬山算法构建肺癌患者的预后模型,指导肺癌预后评价。以SEER(surveillance,epidemiology,and end results)数据库中2008年至2014年期间被确诊为肺癌的患者组成数据集,首先利用卡方检验、Logistic回归分析方法对数据集中的...利用最大最小爬山算法构建肺癌患者的预后模型,指导肺癌预后评价。以SEER(surveillance,epidemiology,and end results)数据库中2008年至2014年期间被确诊为肺癌的患者组成数据集,首先利用卡方检验、Logistic回归分析方法对数据集中的变量进行特征选择;然后,在训练集上利用最大最小爬山算法建立肺癌患者的预后模型,并在测试集上对患者进行5年后生存情况预测;最后,选择Logistic回归、人工神经网络、决策树、支持向量机方法和本研究模型在测试集上进行分类实验对比。最终结果显示本研究模型对肺癌患者5年后生存情况的预测准确率高于其他方法。展开更多
目的建立基于MRI术前子宫内膜癌(endometrial cancer,EC)的分子亚型的生境影像组学预测模型。方法回顾性收集2家医学中心经病理证实的EC患者,分别纳入训练组(n=270)和测试组(n=70)。所有患者均进行了术前MRI及病理组织学和分子亚型诊断...目的建立基于MRI术前子宫内膜癌(endometrial cancer,EC)的分子亚型的生境影像组学预测模型。方法回顾性收集2家医学中心经病理证实的EC患者,分别纳入训练组(n=270)和测试组(n=70)。所有患者均进行了术前MRI及病理组织学和分子亚型诊断。首先根据扩散加权成像(diffusion-weighted imaging,DWI)和对比增强(contrast enhancement,CE)图像对肿瘤进行生境亚区域分区,随后从T1加权成像(T1-weighted imaging,T1WI)、T2加权成像(T2-weighted imaging,T2WI)、DWI和CE图像的不同亚区域提取生境影像组学特征。应用3种机器学习分类器,包括逻辑回归、支持向量机和随机森林,分别建立预测p53异常型EC的模型并进行效能验证,表现出最佳综合预测性能的模型被选为生境影像组学模型。采用相同程序,建立基于T1WI、T2WI、DWI和CE共4个序列的全区域影像组学模型及临床模型。采用受试者工作特性曲线评估模型的效能,使用DeLong检验比较模型的差异。使用决策曲线分析评价模型应用的临床收益。结果经特征选择后保留8个生境影像组学特征建立生境影像组学模型、10个全区域影像组学特征建立影像组学模型和3个临床特征建立临床模型。生境影像组学模型曲线下面积(area under the curve,AUC)最高,分别为0.855(0.788~0.922,训练集)和0.769(0.631~0.907,验证集)。DeLong检验显示训练集的生境影像组学模型效能优于全区域影像组学模型(P=0.001),但测试集差异不显著(P=0.543);两组生境影像组学模型效能均优于临床模型(P=0.007,训练集;P=0.038,验证集)。DCA曲线显示该模型在阈值概率0.2~0.8之间均可对临床诊断提供收益。结论基于MRI的生境影像组学模型可以较准确地预测p53异常型的EC,效能优于全区域影像组学和临床模型,有助于术前EC的无创性分子亚型分型。展开更多
目的·构建结直肠癌(colorectal cancer,CRC)预后风险评分模型,分析不同评分CRC患者间显著差异的肿瘤特征信号通路或生物过程,并预测该模型对其他癌症患者的免疫治疗效果。方法·从公共数据库中收集8个独立的CRC微阵列数据集和2...目的·构建结直肠癌(colorectal cancer,CRC)预后风险评分模型,分析不同评分CRC患者间显著差异的肿瘤特征信号通路或生物过程,并预测该模型对其他癌症患者的免疫治疗效果。方法·从公共数据库中收集8个独立的CRC微阵列数据集和2个CRC RNA-seq数据集,筛选每个CRC数据集中的差异表达基因(differentially expressed genes,DEGs)。基于数据集共有的DEGs,采用单因素Cox回归模型筛选与不良预后相关的基因,采用套索(LASSO)回归和多因素Cox回归模型构建CRC预后风险评分模型。依据风险评分,将患者分为高风险组和低风险组。使用受试者操作特征曲线的曲线下面积(area under the curve,AUC)和Kaplan-Meier(KM)生存分析对模型性能进行评价。采用多因素Cox回归模型分析风险评分是否为CRC的独立预后因素。利用基因集富集分析(gene set enrichment analysis,GSEA)探究高、低风险组CRC患者在肿瘤特征基因集相关通路中的差异。通过KM生存分析和χ2检验预测其他癌症患者的免疫治疗效果,以评估模型的应用价值。结果·单因素Cox回归分析,从不同数据集共有的DEGs中获得16个与不良预后相关的基因;以此为基础,构建了包含8个特征基因的CRC预后风险评分模型。该模型在训练集(AUC_(max)=0.788)、内外部验证集(AUC均值>0.600)中展现了中等程度的准确性,其低风险组患者的生存率均高于高风险组。多因素Cox回归分析显示,风险评分可作为CRC的独立预后因素。GSEA结果显示,肿瘤特征基因集相关通路在高风险组患者中显著富集。KM生存分析和χ^(2)检验结果显示,低风险组的其他癌症患者具有更高的生存率及更好的免疫治疗效果。结论·成功构建了含8个特征基因的CRC风险评分预后模型,可为改善CRC患者预后、预测其他癌症患者的免疫治疗效果提供参考。展开更多
文摘利用最大最小爬山算法构建肺癌患者的预后模型,指导肺癌预后评价。以SEER(surveillance,epidemiology,and end results)数据库中2008年至2014年期间被确诊为肺癌的患者组成数据集,首先利用卡方检验、Logistic回归分析方法对数据集中的变量进行特征选择;然后,在训练集上利用最大最小爬山算法建立肺癌患者的预后模型,并在测试集上对患者进行5年后生存情况预测;最后,选择Logistic回归、人工神经网络、决策树、支持向量机方法和本研究模型在测试集上进行分类实验对比。最终结果显示本研究模型对肺癌患者5年后生存情况的预测准确率高于其他方法。
文摘目的建立基于MRI术前子宫内膜癌(endometrial cancer,EC)的分子亚型的生境影像组学预测模型。方法回顾性收集2家医学中心经病理证实的EC患者,分别纳入训练组(n=270)和测试组(n=70)。所有患者均进行了术前MRI及病理组织学和分子亚型诊断。首先根据扩散加权成像(diffusion-weighted imaging,DWI)和对比增强(contrast enhancement,CE)图像对肿瘤进行生境亚区域分区,随后从T1加权成像(T1-weighted imaging,T1WI)、T2加权成像(T2-weighted imaging,T2WI)、DWI和CE图像的不同亚区域提取生境影像组学特征。应用3种机器学习分类器,包括逻辑回归、支持向量机和随机森林,分别建立预测p53异常型EC的模型并进行效能验证,表现出最佳综合预测性能的模型被选为生境影像组学模型。采用相同程序,建立基于T1WI、T2WI、DWI和CE共4个序列的全区域影像组学模型及临床模型。采用受试者工作特性曲线评估模型的效能,使用DeLong检验比较模型的差异。使用决策曲线分析评价模型应用的临床收益。结果经特征选择后保留8个生境影像组学特征建立生境影像组学模型、10个全区域影像组学特征建立影像组学模型和3个临床特征建立临床模型。生境影像组学模型曲线下面积(area under the curve,AUC)最高,分别为0.855(0.788~0.922,训练集)和0.769(0.631~0.907,验证集)。DeLong检验显示训练集的生境影像组学模型效能优于全区域影像组学模型(P=0.001),但测试集差异不显著(P=0.543);两组生境影像组学模型效能均优于临床模型(P=0.007,训练集;P=0.038,验证集)。DCA曲线显示该模型在阈值概率0.2~0.8之间均可对临床诊断提供收益。结论基于MRI的生境影像组学模型可以较准确地预测p53异常型的EC,效能优于全区域影像组学和临床模型,有助于术前EC的无创性分子亚型分型。
文摘目的·构建结直肠癌(colorectal cancer,CRC)预后风险评分模型,分析不同评分CRC患者间显著差异的肿瘤特征信号通路或生物过程,并预测该模型对其他癌症患者的免疫治疗效果。方法·从公共数据库中收集8个独立的CRC微阵列数据集和2个CRC RNA-seq数据集,筛选每个CRC数据集中的差异表达基因(differentially expressed genes,DEGs)。基于数据集共有的DEGs,采用单因素Cox回归模型筛选与不良预后相关的基因,采用套索(LASSO)回归和多因素Cox回归模型构建CRC预后风险评分模型。依据风险评分,将患者分为高风险组和低风险组。使用受试者操作特征曲线的曲线下面积(area under the curve,AUC)和Kaplan-Meier(KM)生存分析对模型性能进行评价。采用多因素Cox回归模型分析风险评分是否为CRC的独立预后因素。利用基因集富集分析(gene set enrichment analysis,GSEA)探究高、低风险组CRC患者在肿瘤特征基因集相关通路中的差异。通过KM生存分析和χ2检验预测其他癌症患者的免疫治疗效果,以评估模型的应用价值。结果·单因素Cox回归分析,从不同数据集共有的DEGs中获得16个与不良预后相关的基因;以此为基础,构建了包含8个特征基因的CRC预后风险评分模型。该模型在训练集(AUC_(max)=0.788)、内外部验证集(AUC均值>0.600)中展现了中等程度的准确性,其低风险组患者的生存率均高于高风险组。多因素Cox回归分析显示,风险评分可作为CRC的独立预后因素。GSEA结果显示,肿瘤特征基因集相关通路在高风险组患者中显著富集。KM生存分析和χ^(2)检验结果显示,低风险组的其他癌症患者具有更高的生存率及更好的免疫治疗效果。结论·成功构建了含8个特征基因的CRC风险评分预后模型,可为改善CRC患者预后、预测其他癌症患者的免疫治疗效果提供参考。