期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于Stacking与多特征融合的加密恶意流量检测 被引量:6
1
作者 霍跃华 赵法起 《计算机工程》 CAS CSCD 北大核心 2023年第5期165-172,180,共9页
加密技术保护网络通信安全的同时,大量恶意软件也采用加密协议来隐藏其恶意行为。在现有基于机器学习的TLS加密恶意流量检测模型中,存在单模型检测算法对多粒度特征适用性差和混合流量检测误报率高的问题。提出基于Stacking策略和多特... 加密技术保护网络通信安全的同时,大量恶意软件也采用加密协议来隐藏其恶意行为。在现有基于机器学习的TLS加密恶意流量检测模型中,存在单模型检测算法对多粒度特征适用性差和混合流量检测误报率高的问题。提出基于Stacking策略和多特征融合的非解密TLS加密恶意流量检测方法。分析加密恶意流量特征多粒度的特点,提取流量的流特征、连接特征和TLS握手特征。对所提取的特征通过特征工程进行规约处理,从而减少计算开销。对规约处理后的3类特征分别建立随机森林、XGBoost和高斯朴素贝叶斯分类器模型学习隐藏在流量内部的规律。在此基础上,使用流指纹融合处理后的多维特征,利用Stacking策略组合3个分类器,构成DMMFC检测模型来识别网络中的TLS加密恶意流量。基于CTU-13公开数据集对构建的模型进行性能评估,实验结果表明,该方法在二分类实验上识别召回率高达99.93%,恶意流量检测的误报率低于0.10%,能够有效检测非解密的TLS加密恶意流量。 展开更多
关键词 加密恶意流量 TLS协议 stacking策略 特征降维 多特征融合
下载PDF
基于机器学习的2型糖尿病风险预警分析系统
2
作者 周建华 申淇源 《电脑与信息技术》 2024年第3期31-34,共4页
近年来2型糖尿病的发病率呈上升趋势,是危害人类健康的常见疾病之一。通过机器学习构建2型糖尿病风险预警分析系统变得迫在眉睫,针对单一的机器学习算法在对糖尿病预测时存在准确率和精度率不高的问题,设计采用Stacking策略对支持向量机... 近年来2型糖尿病的发病率呈上升趋势,是危害人类健康的常见疾病之一。通过机器学习构建2型糖尿病风险预警分析系统变得迫在眉睫,针对单一的机器学习算法在对糖尿病预测时存在准确率和精度率不高的问题,设计采用Stacking策略对支持向量机、CatBoost、XGBoost进行算法融合,实验证明,融合算法在准确率,精度率,容错率方面都有大幅提高,能够更有效地辅助医生进行糖尿病的早期诊断和干预。 展开更多
关键词 机器学习 风险预警 stacking策略 2型糖尿病
下载PDF
铁路集装箱堆场智能管理关键技术研究 被引量:6
3
作者 于雪峤 叶飞 +2 位作者 王丹竹 席江月 许植深 《铁道货运》 2020年第12期1-6,共6页
铁路集装箱运输业务的高速发展,对我国铁路集装箱堆场管理模式提出了更高的要求,智能化技术装备成为铁路集装箱物流运作节点充分释放堆存能力、提升作业效率的关键手段。为进一步提升集装箱堆场运作效率,在阐述我国铁路集装箱堆场管理... 铁路集装箱运输业务的高速发展,对我国铁路集装箱堆场管理模式提出了更高的要求,智能化技术装备成为铁路集装箱物流运作节点充分释放堆存能力、提升作业效率的关键手段。为进一步提升集装箱堆场运作效率,在阐述我国铁路集装箱堆场管理现状及存在问题的基础上,设计铁路集装箱堆场智能运营管理体系架构,结合集装箱堆场主要业务、优化目标提出铁路集装箱堆场箱位智能指派方法;从堆场集装箱定位技术、铁路侧堆场出入管理技术、公路侧堆场出入管理技术3个方面,探讨铁路集装箱堆场关键设备应用技术,为支撑铁路货运供给侧改革、提升铁路集装箱堆场服务运作效能提供支撑。 展开更多
关键词 铁路 集装箱堆场 智能管理 堆存策略 关键技术
下载PDF
基于集成学习算法的消费行为预测 被引量:4
4
作者 贾志强 李涛 乐金祥 《计算机技术与发展》 2022年第5期141-146,共6页
消费行为预测在营销活动中具有重要的价值,其预测效果主要取决于特征工程与算法建模。通过特征提取与新特征发现,提出定长与变长滑动窗口相结合的特征提取方法和基于先验知识与矩阵分解的特征交叉方法。特征提取方法考虑样本不平衡和用... 消费行为预测在营销活动中具有重要的价值,其预测效果主要取决于特征工程与算法建模。通过特征提取与新特征发现,提出定长与变长滑动窗口相结合的特征提取方法和基于先验知识与矩阵分解的特征交叉方法。特征提取方法考虑样本不平衡和用户消费习惯,提取更多的样本数据并给特征加上时间属性,而特征交叉方法考虑商品与用户之间隐含的关联关系,提取有关联的新特征。对于单一模型预测效果较差的问题,采用stacking策略构建集成学习模型,以XGBoost、随机森林和梯度提升决策树作为初级学习器对特征进行变换,以逻辑回归作为元学习器对用户消费行为进行预测。实验结果表明,该特征工程方法在多个模型算法中均能明显提高精准率,该集成学习模型预测效果要比单个模型更好。 展开更多
关键词 行为预测 特征工程 算法建模 stacking策略 集成学习
下载PDF
基于多维特征神经网络集成的有源干扰识别算法
5
作者 赵忠臣 刘利民 +2 位作者 解辉 韩壮志 荆贺 《现代电子技术》 2023年第19期1-7,共7页
针对在强噪声环境下雷达有源干扰识别准确率不高的问题,提出一种基于功率谱密度、频谱瞬时包络与时频图特征神经网络集成的干扰识别算法。首先从理论推导和方法实现两个角度论述了神经网络集成的基本原理;然后阐述了特征获取方法、网络... 针对在强噪声环境下雷达有源干扰识别准确率不高的问题,提出一种基于功率谱密度、频谱瞬时包络与时频图特征神经网络集成的干扰识别算法。首先从理论推导和方法实现两个角度论述了神经网络集成的基本原理;然后阐述了特征获取方法、网络结构和采用Stacking策略进行网络生成与集成的过程,分析了有源干扰识别的训练、测试结果;最后将该方法与基于时频图的AlexNet检测器、基于功率谱密度序列的LSTM检测器、基于特征融合的双通道检测器进行比较,仿真结果表明,在干噪比(JNR)大于-6 dB时,所提算法对6种有源干扰识别准确概率达到99%以上,具有很好的检测性能。 展开更多
关键词 有源干扰识别 神经网络集成 多维特征 深度自编码器 卷积神经网络 stacking策略 机器学习 泛化误差
下载PDF
基于LSTM-StackingCXR模型的房价预测算法研究
6
作者 高巍 刘博洋 +1 位作者 李大舟 王淮中 《沈阳化工大学学报》 CAS 2023年第1期80-86,共7页
房屋价格一直是社会最为关心的话题.预测房价走势并为购房者提供参考房价一直是房地产业和相关学术领域的研究热点.针对房价预测过程中存在数据集变量多、维度高的问题,本文通过计算多个房源特征与房源价格之间的皮尔森系数,去除冗余房... 房屋价格一直是社会最为关心的话题.预测房价走势并为购房者提供参考房价一直是房地产业和相关学术领域的研究热点.针对房价预测过程中存在数据集变量多、维度高的问题,本文通过计算多个房源特征与房源价格之间的皮尔森系数,去除冗余房源特征,有效地降低了房源特征数据集的维度.为了将信息损失降至最小,采用CatBoost处理房源特征中的类别变量.针对预测模型的过拟合、泛化能力差的问题,采用Stacking策略融合了CatBoost、XGBoost、随机森林算法,并且结合LSTM神经网络,最终提出了一种LSTM-StackingCXR模型.实验结果表明,LSTM-StackingCXR模型预测结果与现有多个模型预测结果相比,其预测精度指标有较大程度的提升. 展开更多
关键词 房价预测 stacking策略 CatBoost XGBoost 随机森林
下载PDF
随机集港的出口箱堆存策略设计与仿真 被引量:4
7
作者 钟慧玲 欧仙群 +1 位作者 张冠湘 蔡文学 《上海海事大学学报》 北大核心 2012年第1期26-31,共6页
为降低集装箱堆场的翻箱率,研究在船舶到港前已经获知出口箱属性的情况下随机集港的出口箱堆存策略.在分析出口箱已有堆存策略的基础上,提出一种以平面箱位为分配单元的改进型堆存策略.对该策略的步骤进行详细阐述,给出模型的假设条件... 为降低集装箱堆场的翻箱率,研究在船舶到港前已经获知出口箱属性的情况下随机集港的出口箱堆存策略.在分析出口箱已有堆存策略的基础上,提出一种以平面箱位为分配单元的改进型堆存策略.对该策略的步骤进行详细阐述,给出模型的假设条件、评价指标和组成模块,利用仿真软件Flexsim建立集装箱堆场仿真模型,分析不同堆存策略的效果.以某集装箱码头为例进行仿真分析,结果表明:在堆场利用率相同且高于70%的情况下,采用改进型堆存策略所带来的翻箱率远远低于其他已有堆存策略。 展开更多
关键词 随机集港 集装箱堆场 翻箱率 堆存策略 出口箱 仿真
下载PDF
基于因果分析和相似日选择的共享单车需求量预测组合模型 被引量:3
8
作者 徐长兴 汪伟平 +2 位作者 昌锡铭 包旭 吴建军 《山东科学》 CAS 2021年第2期54-64,共11页
共享单车的需求量预测是优化车辆系统布局、实现车辆合理调度的基础。为了提高共享单车需求量预测模型的精度,建立了基于格兰杰因果分析和相似日选择的组合预测模型,研究了时间和天气因素对共享单车出行需求的影响。应用格兰杰因果检验... 共享单车的需求量预测是优化车辆系统布局、实现车辆合理调度的基础。为了提高共享单车需求量预测模型的精度,建立了基于格兰杰因果分析和相似日选择的组合预测模型,研究了时间和天气因素对共享单车出行需求的影响。应用格兰杰因果检验方法,筛选出影响共享单车需求量变化的关键天气指标。然后,基于天气特征向量的灰色关联度指标,提取待预测日各时段的相似日样本集。综合随机森林回归、支持向量回归等机器学习算法,建立了Stacking策略的组合预测模型,对区域分时共享单车需求量进行预测。最后,对北京市共享单车用户的骑行数据进行实例分析。结果表明相较单个机器学习预测模型,提出的组合预测模型的平均绝对百分比误差下降了9.1%,提高了共享单车短时需求预测的科学性和准确性,可为实际车辆调度提供参考依据。 展开更多
关键词 共享单车 出行需求 因果分析 灰色关联度 相似日 机器学习 stacking策略
下载PDF
基于集成学习策略的化工园区大气污染影响预测 被引量:2
9
作者 王旭坪 于秀丽 王天腾 《运筹与管理》 CSSCI CSCD 北大核心 2021年第11期127-134,共8页
建立科学、有效、准确的空气质量预测系统,对于保护人们的身体健康和促进社会的和谐稳定具有重要的科学价值和实际意义。研究聚焦化工园区,基于物联网背景下企业排放实时数据,融合气象信息,采用多种有监督式机器学习(决策树、多元线性... 建立科学、有效、准确的空气质量预测系统,对于保护人们的身体健康和促进社会的和谐稳定具有重要的科学价值和实际意义。研究聚焦化工园区,基于物联网背景下企业排放实时数据,融合气象信息,采用多种有监督式机器学习(决策树、多元线性回归、Lasso回归、支持向量机、Xgboost、梯度提升机、Light GBM、MLP(多层感知觉神经网络))及改进的集成学习Stacking策略实现化工园区空气质量的预测,并识别影响大气污染的关键因素。结果表明:(1)Stacking策略下的预测框架与单模型预测结果相比有统计学意义上的显著提升。(2)在Stacking策略中,初级、次级学习器的选择策略影响预测的精度和泛化性,最佳模式为初级采用强学习器,次级使用线性模型。(3)在同一园区、不同企业污染物不同排放口对空气质量影响不同,研究结论可为政府监管部门对化工园区的治理和管控提供决策支持。 展开更多
关键词 stacking策略 机器学习 大气污染影响 化工园区
下载PDF
基于改进一对一算法的网络流量分类 被引量:2
10
作者 赵择 徐佑宇 +1 位作者 唐亮 卜智勇 《中国科学院大学学报(中英文)》 CSCD 北大核心 2020年第4期570-576,共7页
准确的流量分类是网络管理和网络安全的有效保障。近年来基于机器学习的网络流量分类备受关注,特征选择对于机器学习的分类效果有重要影响。但使整体分类性能达到最优的特征选择子集,并不一定使特定类别的分类性能达到最佳,这降低了分... 准确的流量分类是网络管理和网络安全的有效保障。近年来基于机器学习的网络流量分类备受关注,特征选择对于机器学习的分类效果有重要影响。但使整体分类性能达到最优的特征选择子集,并不一定使特定类别的分类性能达到最佳,这降低了分类性能可达到的上限,对此提出基于改进的一对一算法的流量分类模型。首先采用一对一的思想将流量多分类任务拆解为多个相互独立的二分类子任务,分别对任意两类流量进行特征选择和流量分类。所有子任务的分类结果采用Stacking策略结合。实验表明,多种机器学习算法与特征选择算法应用于该模型的准确度较经典模型均有提升。 展开更多
关键词 一对一 流量分类 stacking策略 机器学习 特征选择
下载PDF
基于支持向量机模型的机场行李码放策略 被引量:1
11
作者 洪振宇 张聪 《计算机应用与软件》 北大核心 2022年第7期44-51,66,共9页
为了解决机场行李在转运过程中存在的装箱问题,从码放策略、学习算法模型两个方面进行研究,提出基于深度稀疏最小二乘支持向量机模型(Deep Sparse Least Squares Support Vector Machine, DSLSSVM)的行李码放策略。该策略包括评价和决... 为了解决机场行李在转运过程中存在的装箱问题,从码放策略、学习算法模型两个方面进行研究,提出基于深度稀疏最小二乘支持向量机模型(Deep Sparse Least Squares Support Vector Machine, DSLSSVM)的行李码放策略。该策略包括评价和决策两个部分。在评价时,通过将行李车与行李离散化,建立两者的数学关系,从而得到评价行李码放位置优劣的评估参数;在决策时,利用深度稀疏最小二乘支持向量机模型学习工人的码放经验,将决策问题转化为二分类问题,选择最佳码放位置进行码放。仿真实验表明:该算法可以达到较高的分类精度,并且能够得到比较理想的装箱效果,具有较强的实用性,满足机场行李高效运输的要求。 展开更多
关键词 支持向量机 码放策略 最小二乘 稀疏化
下载PDF
基于集合运算特征提取及Stacking策略的新闻多分类方法 被引量:1
12
作者 曾寰 李金忠 付青 《井冈山大学学报(自然科学版)》 2021年第2期70-75,共6页
文本分类是机器学习重要任务之一,如何对文本信息进行有效分类组织,对用户查找并获取有用信息具有重要作用。针对新闻文本分析,提出了一种基于集合运算特征提取及Stacking策略的新闻多分类方法,该方法基于集合运算的方法来提取文本特征... 文本分类是机器学习重要任务之一,如何对文本信息进行有效分类组织,对用户查找并获取有用信息具有重要作用。针对新闻文本分析,提出了一种基于集合运算特征提取及Stacking策略的新闻多分类方法,该方法基于集合运算的方法来提取文本特征,采用Stacking策略,使用SVM以及贝叶斯方法来对文本进行分类。与典型同类方法对比,在复旦大学文本分类数据集上的实验结果表明,该方法随着样本数增加,各分类指标逐渐升高并趋于稳定。 展开更多
关键词 文本分类 新闻 集合运算 stacking 策略
下载PDF
广州港冷链物流系统优化与仿真 被引量:1
13
作者 陈洪先 陈宁 汪德贵 《港口科技》 2017年第12期1-9,43,共10页
为了加快广州港冷链物流发展步伐,促进广州国际航运中心的建设,采用数学建模和FlexTerm仿真的方法对港口冷链物流堆存系统、集疏运系统进行优化。在冷藏箱混合堆存的基础上以各贝位间操作量的不平衡性最小、集卡行驶路径最短、场桥作业... 为了加快广州港冷链物流发展步伐,促进广州国际航运中心的建设,采用数学建模和FlexTerm仿真的方法对港口冷链物流堆存系统、集疏运系统进行优化。在冷藏箱混合堆存的基础上以各贝位间操作量的不平衡性最小、集卡行驶路径最短、场桥作业时间最短为目标函数分别构建贝位间作业量平衡分配模型、集卡路径优化模型和集装箱龙门吊调度优化模型。在K-means聚类分析的基础上,以集疏运总成本最小为目标函数构建珠三角和泛珠三角内陆集疏运线网优化模型。利用FlexTerm软件,以南沙三期集装箱码头的冷藏箱堆场为对象构建仿真模型,并将冷库涵盖在内。仿真输出结果验证堆存优化模型的有效性。采用Lingo和Matlab软件进行求解,结果表明各模型均能在一定程度上提高港口生产效率。 展开更多
关键词 港口 广州港 集装箱码头 冷藏箱混堆优化 K-means聚类分析 FlexTerm 堆存策略
下载PDF
基于集成学习模型的城市轨道交通车载数据分析与列车停车误差预测
14
作者 张兴凯 张立鹏 +2 位作者 陈钰 李欣 王晓玲 《城市轨道交通研究》 北大核心 2021年第4期53-57,61,共6页
提出了一种基于Stacking策略的集成学习模型算法。通过基础模型算法评估阶段和基础模型算法集成阶段,成功选出K个基础模型,并基于模型集成策略完成了模型的集成工作,最终得到了基于Stacking策略的集成预测模型。基于实际案例,使用该集... 提出了一种基于Stacking策略的集成学习模型算法。通过基础模型算法评估阶段和基础模型算法集成阶段,成功选出K个基础模型,并基于模型集成策略完成了模型的集成工作,最终得到了基于Stacking策略的集成预测模型。基于实际案例,使用该集成模型对列车停车误差进行预测,并对预测结果进行验证。验证结果显示,基于Stacking策略的集成学习算法模型的训练效率高、预测精度高,与其他传统模型相比具有较强优势。 展开更多
关键词 城市轨道交通 集成学习模型 车载数据分析 列车停车误差预测 stacking策略
下载PDF
集装箱码头堆场功能分区及仿真
15
作者 张雨婷 黄有方 严伟 《上海海事大学学报》 北大核心 2014年第4期37-43,共7页
为缩短集装箱船舶的装卸时间、提高集装箱堆场的利用率,探索港口集装箱码头的堆场功能分区.在分析集装箱作业流程中所存在问题的基础上,针对进口箱区提出带有货主等级制的新型堆存策略,针对出口箱区所提出的堆存策略配套设计新的集卡调... 为缩短集装箱船舶的装卸时间、提高集装箱堆场的利用率,探索港口集装箱码头的堆场功能分区.在分析集装箱作业流程中所存在问题的基础上,针对进口箱区提出带有货主等级制的新型堆存策略,针对出口箱区所提出的堆存策略配套设计新的集卡调度方案.利用Flexsim软件分别建立传统的和新的功能分区下的出口装船流程模型,分析两者的数据差异,证明新的堆存策略的实效性和优越性.对集装箱堆场功能分区的探索和设计,可为我国集装箱堆场管理和运营提供新思路. 展开更多
关键词 集装箱码头 堆场 功能分区 堆存策略 集卡调度
下载PDF
层状含能材料设计方法研究进展
16
作者 何晓凯 曹意林 刘英哲 《火炸药学报》 EI CAS CSCD 北大核心 2023年第5期378-389,I0008,共13页
综述了层状含能材料的国内外最新研究进展,详细讨论了层状含能材料的主要设计策略:一是基于经验直觉的设计方法,典型思路有内环化反应、双边修饰、层内氢键匹配、面对面π-π堆积策略等;二是基于化学理论计算的设计方法,设计理念在于搜... 综述了层状含能材料的国内外最新研究进展,详细讨论了层状含能材料的主要设计策略:一是基于经验直觉的设计方法,典型思路有内环化反应、双边修饰、层内氢键匹配、面对面π-π堆积策略等;二是基于化学理论计算的设计方法,设计理念在于搜索热力学稳定的二聚体和晶体结构预测方面;三是基于机器学习的设计方法,设计思路主要体现在加速层状堆积模式的筛选和对材料性质的快速预测。最后,对层状含能材料设计工作的未来发展方向提出了展望,例如,基于统计学规律深入理解层状含能材料的构效关系以及构建适合层状含能材料的特征描述体系。附参考文献85篇。 展开更多
关键词 层状含能材料 设计策略 机器学习 内环化反应 双边修饰 层内氢键匹配 面对面π-π堆积策略
下载PDF
构皮滩水电厂一、二次调频控制策略 被引量:4
17
作者 朱华 李丽 《变频器世界》 2011年第4期109-111,共3页
本文基于电力系统调频方式,阐述了一次调频和二次调频关系的三种策略,并以贵州构皮滩水电厂为例,证实一次调频和二次调频叠加策略的可行性和实际效果,并指出叠加策略和闭锁策略的适用范围。
关键词 电力系统 水电厂 一次调频 二次调频 叠加控制策略
下载PDF
基于Stacking集成策略的P2P网贷违约风险预警研究 被引量:28
18
作者 丁岚 骆品亮 《投资研究》 CSSCI 2017年第4期41-54,共14页
本文以logistic回归、决策树、支持向量机(SVM)作为初级学习器,以SVM作为次级学习器,构建基于Stacking集成策略的评估模型来预测P2P网贷中借款人的违约风险。构建模型时采用10×10折嵌套交叉验证方法以克服交叉学习现象。通过爬虫... 本文以logistic回归、决策树、支持向量机(SVM)作为初级学习器,以SVM作为次级学习器,构建基于Stacking集成策略的评估模型来预测P2P网贷中借款人的违约风险。构建模型时采用10×10折嵌套交叉验证方法以克服交叉学习现象。通过爬虫技术抓取人人贷的交易数据进行的实证研究结果表明,相较单一的logistic回归、决策树或者SVM模型,基于Stacking集成策略的预测模型能显著降低一类错误和二类错误比例,提高预测正确率。本研究对P2P网贷平台的违约风险预警具有应用参考意义。 展开更多
关键词 P2P网贷 违约风险 stacking集成策略 嵌套交叉验证
原文传递
基于多异学习器融合Stacking集成学习的窃电检测 被引量:12
19
作者 游文霞 李清清 +3 位作者 杨楠 申坤 李文武 吴泽黎 《电力系统自动化》 EI CSCD 北大核心 2022年第24期178-186,共9页
针对窃电检测中用户用电数据类别不平衡、采用投票法作为结合策略的集成学习方法无法充分发挥多个不同学习器优势等问题,提出一种利用Stacking集成学习融合多异学习器的模型应用于窃电检测。首先,从影响电量计量的因素出发,根据常见的5... 针对窃电检测中用户用电数据类别不平衡、采用投票法作为结合策略的集成学习方法无法充分发挥多个不同学习器优势等问题,提出一种利用Stacking集成学习融合多异学习器的模型应用于窃电检测。首先,从影响电量计量的因素出发,根据常见的5种窃电方法模拟6种窃电行为模式;其次,采用合成少数类过采样技术(SMOTE)对不平衡的用电数据进行处理,并利用K折交叉验证法对平衡后的训练集进行划分以缓解因重复学习造成的过拟合;然后,使用评价指标和多样性度量优选模型的不同初级学习器和元学习器,构建融合不同学习器优势和差异的Stacking集成学习窃电检测模型;最后,算例对比分析结果表明所提窃电检测模型能有效解决用电数据类别不平衡,充分发挥不同学习器的优势,评价指标良好。 展开更多
关键词 stacking结合策略 集成学习 窃电检测 合成少数类过采样技术 K折交叉验证
下载PDF
基于Stacking集成学习的在线健康社区问答信息采纳识别研究 被引量:4
20
作者 林萍 吕健超 《情报科学》 北大核心 2023年第2期135-142,共8页
【目的/意义】提出基于Stacking集成学习的问答信息采纳行为识别策略,促进在线健康社区问答的精准化推送、助推数字化医疗服务高质量发展。【方法/过程】构建以集成学习方法和非集成学习方法为基学习器、以逻辑回归算法(LR)为元学习器的... 【目的/意义】提出基于Stacking集成学习的问答信息采纳行为识别策略,促进在线健康社区问答的精准化推送、助推数字化医疗服务高质量发展。【方法/过程】构建以集成学习方法和非集成学习方法为基学习器、以逻辑回归算法(LR)为元学习器的Stacking集成学习模型,比较单预测模型、同类预测模型组合、不同类预测模型组合的Stacking集成学习模型预测精度,选取“寻医问药”平台的慢性病问答构建数据集验证模型的优越性,并选取“快速问医生有问必答120”平台数据验证模型的可移植性。【结果/结论】Stacking集成模型相比于单预测模型能够更精准识别被采纳问答信息,模型具有较强的泛化性,可以适用于不同的在线健康社区。【创新/局限】本文基于Stacking集成思想构建两阶段预测模型,并借助机器学习构建最佳预测模型组合,显著提高在线健康社区问答信息采纳识别精度,但伴随问答信息积累,在线健康社区问答模式不断发展变化,考虑结合历史数据和每日更新数据的动态预测方法是未来研究工作重点。 展开更多
关键词 在线健康社区 stacking集成策略 机器学习 信息采纳 信息识别
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部