期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
决策森林研究综述 被引量:12
1
作者 黄海新 吴迪 文峰 《电子技术应用》 北大核心 2016年第12期5-9,共5页
随着经济与社会的发展,数据挖掘技术广泛应用到各个领域,其中分类算法中的决策森林(Decision Forest)成为一个研究热点。决策森林算法是一种包含多个决策树分类器的统计学习理论,能较好地处理噪声且避免发生过拟合。针对几种典型的决策... 随着经济与社会的发展,数据挖掘技术广泛应用到各个领域,其中分类算法中的决策森林(Decision Forest)成为一个研究热点。决策森林算法是一种包含多个决策树分类器的统计学习理论,能较好地处理噪声且避免发生过拟合。针对几种典型的决策森林算法,阐述了其原理和算法的特点,并从决策森林的构建过程出发,系统地分析和总结了国内外现有的决策森林算法。在此基础上,详细说明了在面对大数据时应用决策森林进行分布式计算的处理过程。通过比较,总结出了各种决策森林算法的适用范围。 展开更多
关键词 数据挖掘 抽样 决策森林 分类 分布式计算 决策
下载PDF
特定信息增益决策森林分类器研究 被引量:7
2
作者 董立岩 李真 周灵艳 《计算机工程与应用》 CSCD 北大核心 2010年第26期111-113,237,共4页
传统的决策树是利用决策属性的信息增益来进行建模的,而有时决策属性的信息增益是根据属性的不同取值而动态变化的。改进了决策树算法,考虑了决策属性取值不同产生的信息增益的差别。根据决策属性的不同取值创建了基于特定信息增益的决... 传统的决策树是利用决策属性的信息增益来进行建模的,而有时决策属性的信息增益是根据属性的不同取值而动态变化的。改进了决策树算法,考虑了决策属性取值不同产生的信息增益的差别。根据决策属性的不同取值创建了基于特定信息增益的决策森林分类模型。实验结果表明虽然决策森林模型的建模过程比决策树复杂,但是具有比较高的分类精度。 展开更多
关键词 决策森林 特定信息增益 数据挖掘
下载PDF
特征基因挖掘的决策森林方法 被引量:5
3
作者 李霞 张田文 +1 位作者 饶绍奇 李丽 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2004年第4期480-483,共4页
基于决策树的基因芯片数据分析方法以追求样本最大分类正确率为目标,造成大量的部分相关基因被排除,不适用于挖掘复杂疾病的相关基因.为此,提出了特征基因挖掘的决策森林方法:从多组特征子集中识别重要疾病相关基因,每个子集根据自身对... 基于决策树的基因芯片数据分析方法以追求样本最大分类正确率为目标,造成大量的部分相关基因被排除,不适用于挖掘复杂疾病的相关基因.为此,提出了特征基因挖掘的决策森林方法:从多组特征子集中识别重要疾病相关基因,每个子集根据自身对目标的分类能力被识别;通过抽样技术产生大量不同结构的训练样本,可以挖掘出高相关或部分相关基因.数值分析结果表明,该方法是生物类型分类和疾病相关基因挖掘的有效工具. 展开更多
关键词 基因表达谱 基因树 特征识别 决策森林 特征基因 基因挖掘 DNA芯片 疾病
下载PDF
基于滤波器相似性剪枝的声学场景分类
4
作者 李香梅 马建芬 +1 位作者 降爱莲 张朝霞 《计算机工程与设计》 北大核心 2024年第7期1997-2003,共7页
为解决场景分类系统模型复杂度高且现有场景分类剪枝算法容易丢失重要特征信息的问题,提出一种基于滤波器相似性剪枝的声学场景分类方法。以滤波器自身相似性为基础,采用余弦距离和欧氏距离度量距离融合的方法生成相似矩阵判断滤波器重... 为解决场景分类系统模型复杂度高且现有场景分类剪枝算法容易丢失重要特征信息的问题,提出一种基于滤波器相似性剪枝的声学场景分类方法。以滤波器自身相似性为基础,采用余弦距离和欧氏距离度量距离融合的方法生成相似矩阵判断滤波器重要性并消除冗余滤波器。为提高分类器的泛化性,在网络输出端用决策森林后处理并构建网络。实验结果表明,所提方法能够有效在降低模型复杂度的基础上提升分类精度和系统泛化性,尤其是当消除参数较多时,所提方法特别有利。 展开更多
关键词 声学场景分类 卷积神经网络 滤波器相似性 相似矩阵 滤波器剪枝 参数微调 决策森林
下载PDF
一种基于决策森林的单调分类方法 被引量:5
5
作者 许行 王文剑 任丽芳 《计算机研究与发展》 EI CSCD 北大核心 2017年第7期1477-1487,共11页
单调分类问题是特征与类别之间带有单调性约束的有序分类问题.对于符号数据的单调分类问题已有较好的方法,但对于数值数据,现有的方法分类精度和运行效率有限.提出一种基于决策森林的单调分类方法(monotonic classification method base... 单调分类问题是特征与类别之间带有单调性约束的有序分类问题.对于符号数据的单调分类问题已有较好的方法,但对于数值数据,现有的方法分类精度和运行效率有限.提出一种基于决策森林的单调分类方法(monotonic classification method based on decision forest,MCDF),设计采样策略来构造决策树,可以保持数据子集与原数据集分布一致,并通过样本权重避免非单调数据的影响,在保持较高分类精度的同时有效提高了运行效率,同时这种策略可以自动确定决策森林中决策树的个数.在决策森林进行分类时,给出了决策冲突时的解决方法.提出的方法既可以处理符号数据,也可以处理数值数据.在人造数据集、UCI及真实数据集上的实验数据表明:该方法可以提高单调分类性能和运行效率,缩短分类规则的长度,解决数据集规模较大的单调分类问题. 展开更多
关键词 单调分类 决策 单调一致性 决策森林 集成学习
下载PDF
采用信息学方法识别颈部淋巴瘤与淋巴结反应增生性疾病超声诊断特征 被引量:5
6
作者 李晶 田家玮 《哈尔滨医科大学学报》 CAS 北大核心 2013年第6期517-521,共5页
目的采用信息学方法对颈部淋巴瘤和良性反应增生性疾病超声所观察的指标进行识别,评价两者在诊断中的差别,进而提高临床诊断率。方法选择82例颈部淋巴结肿大患者,其中淋巴瘤29例,良性反应增生性疾病53例。在考虑超声指标间关系的同时通... 目的采用信息学方法对颈部淋巴瘤和良性反应增生性疾病超声所观察的指标进行识别,评价两者在诊断中的差别,进而提高临床诊断率。方法选择82例颈部淋巴结肿大患者,其中淋巴瘤29例,良性反应增生性疾病53例。在考虑超声指标间关系的同时通过统计分析与信息学方法(均值t检验法,频率分布法,层次聚类法,R×C列联表检验,决策森林)进行特征选择并采用4个分类器进行评价,达到对颈部淋巴瘤与淋巴结反应增生性疾病做出区分。结果 5个定量指标(包膜厚度,L,T,L/T,皮质厚度)与8个定性指标(血流分布类型,淋巴结血供情况,比邻关系,淋巴门类型,皮质与淋巴门界限,皮质类型,皮质增厚情况,皮质回声)分别与淋巴瘤比较大多存在显著性差异(P<0.001),采用4个分类器对所选特征进行评价,分类效果大多在80%以上。结论通过对选取主要参数进行信息学方法分析得出特征指标的联合效应,对两者的鉴别诊断有重要的临床价值,可提高临床诊断率。 展开更多
关键词 淋巴瘤 颈部淋巴结反应增生性疾病 超声特征 特征识别 决策森林
下载PDF
基于决策森林特征基因的两种识别方法 被引量:2
7
作者 吕飒丽 汪强虎 +1 位作者 李霞 郭政 《生物信息学》 2004年第3期19-22,共4页
应用DNA芯片可获得成千上万个基因的表达谱数据。寻找对疾病有鉴别力的特征基因 ,滤掉与疾病无关的基因是基因表达谱数据分析的关键问题。利用决策森林方法的集成优势 ,提出基于决策森林的两种特征基因识别方法。该方法先由决策森林按... 应用DNA芯片可获得成千上万个基因的表达谱数据。寻找对疾病有鉴别力的特征基因 ,滤掉与疾病无关的基因是基因表达谱数据分析的关键问题。利用决策森林方法的集成优势 ,提出基于决策森林的两种特征基因识别方法。该方法先由决策森林按照一定的显著性水平滤掉大部分与疾病类别无关的基因 ,然后采用统计频数法和扰动法 ,根据所选特征对分类的贡献程度对初选的特征基因作更加精细地选择。最后 ,选用神经网络作为外部分类器对所选的特征基因子集进行评价 ,将提出的方法应用于 4 0例结肠癌组织与 2 2例正常组织中 2 0 0 0个基因的表达谱实验数据。结果表明 :上述两种方法选出的特征基因均具有较高的疾病鉴别能力 ,均可获得最优特征基因子集 ,基于决策森林的统计频数法优于扰动法。 展开更多
关键词 BOOTSTRAP 决策森林 人工神经网络 特征基因
下载PDF
DSP指令集仿真器优化技术研究 被引量:3
8
作者 林方全 吴健 阮园 《科学技术与工程》 2011年第29期7150-7154,7184,共6页
鉴于指令集仿真器(ISS)在处理器仿真及系统软件测试和验证领域研究中的重要性,如何更好地提升ISS性能一直是领域研究人员面临的一个难题。在现有解释型ISS一般模型的基础上,引入了决策森林、译码缓存、虚拟页表等多种优化技术,设计并实... 鉴于指令集仿真器(ISS)在处理器仿真及系统软件测试和验证领域研究中的重要性,如何更好地提升ISS性能一直是领域研究人员面临的一个难题。在现有解释型ISS一般模型的基础上,引入了决策森林、译码缓存、虚拟页表等多种优化技术,设计并实现了一款面向ZWFCore的高性能可定制DSP指令集仿真器——ZWISS。经实验分析,与现有方法相比,提出的优化技术能够明显提升IIS性能。 展开更多
关键词 指令集仿真器 可定制 译码缓存 决策森林 虚拟页表
下载PDF
基于关系数据分析的决策森林学习方法 被引量:2
9
作者 王利民 李雄飞 《计算机工程与应用》 CSCD 北大核心 2008年第21期99-101,共3页
模式识别中的多分类器集成日益得到研究人员的关注并成为研究的热点。提出一种基于决策森林构造的多重子模型集成方法,通过对每个样本赋予决策规则,构造决策森林而非单个决策树以自动确定相对独立的样本子集,在此基础上结合条件独立性... 模式识别中的多分类器集成日益得到研究人员的关注并成为研究的热点。提出一种基于决策森林构造的多重子模型集成方法,通过对每个样本赋予决策规则,构造决策森林而非单个决策树以自动确定相对独立的样本子集,在此基础上结合条件独立性假设进行模型集成。整个学习过程不需要任何人为参与,能够自适应确定决策树数量和每个子树结构,发挥各分类器在不同样本和不同区域上的分类优势。在UCI机器学习数据集上的实验结果和样例分析验证了方法的有效性。 展开更多
关键词 模式识别 多重子模型集成 决策森林 条件独立性假设
下载PDF
决策树算法在通信客户流失预警模型中的应用 被引量:1
10
作者 谭黎光 徐胜萍 谭序光 《学园》 2018年第1期9-9,11,共2页
通信市场竞争日趋激烈,客户保有和挽留工作非常重要。面向企业一般分析人员,探讨SPSS决策树算法快速有效建立流失客户预警模型,清晰描述流失客户画像,以便针对性地进行客户保有及挽留,增加企业效益。
关键词 客户流失 预测模型 决策 决策森林
原文传递
基于广义信息论的决策森林多重子模型集成方法 被引量:1
11
作者 王利民 徐沛娟 李雄飞 《模式识别与人工智能》 EI CSCD 北大核心 2009年第2期325-329,共5页
为提高传统决策树学习方法的扩展性和自适应性,基于广义信息论提出决策森林多重子模型集成方法.采用从下至顶的学习策略,将离散化处理和决策树的逻辑表达有机结合在一起,整个学习过程不需要任何人为参与,能自动确定子树数目和子树结构.... 为提高传统决策树学习方法的扩展性和自适应性,基于广义信息论提出决策森林多重子模型集成方法.采用从下至顶的学习策略,将离散化处理和决策树的逻辑表达有机结合在一起,整个学习过程不需要任何人为参与,能自动确定子树数目和子树结构.在UCI机器学习数据集上的实验结果和样例分析验证了本文方法的可行性和有效性. 展开更多
关键词 多重子模型集成 广义信息论 决策森林
原文传递
姿势内核学习融合决策森林在线手势识别算法 被引量:1
12
作者 王建玺 徐向艺 鲁书喜 《电视技术》 北大核心 2015年第9期129-134,145,共7页
针对在线姿势识别中来自流行深度传感器的噪声数据影响识别鲁棒性的问题,提出了一种基于姿势内核学习融合决策森林方法。首先,将使用骨架关节角表示每种姿势;然后,利用多类SVM分类器获得姿势内核;最后,利用决策森林实时标记关键姿势序列... 针对在线姿势识别中来自流行深度传感器的噪声数据影响识别鲁棒性的问题,提出了一种基于姿势内核学习融合决策森林方法。首先,将使用骨架关节角表示每种姿势;然后,利用多类SVM分类器获得姿势内核;最后,利用决策森林实时标记关键姿势序列,根据关键姿势序列完成识别。实验结果表明,本方法的识别率可高达99.3%,相比几种较为先进的识别方法,本文方法具有更好的识别鲁棒性,并且在一定程度上降低了识别所耗时间。 展开更多
关键词 在线姿势识别 姿势内核学习 关节角表示 决策森林 多类SVM分类器
下载PDF
决策森林法在胃癌基因信号通路分析中的应用
13
作者 李建更 李欣 《生物学杂志》 CAS CSCD 2011年第4期84-87,共4页
DNA微阵列分析为识别疾病类型及鉴别特征基因等生物研究提供了重要的研究手段,但目前大量使用的基于单基因的分析方法受样本数量和噪音的影响较大,无法呈现基因间的相互关系,而基因信号通路分析则是解决这一问题的一种有效方法。结合决... DNA微阵列分析为识别疾病类型及鉴别特征基因等生物研究提供了重要的研究手段,但目前大量使用的基于单基因的分析方法受样本数量和噪音的影响较大,无法呈现基因间的相互关系,而基因信号通路分析则是解决这一问题的一种有效方法。结合决策森林法对胃癌数据进行了基因通道分析,对所选择基因在基因信号通路中的作用以及通路中基因之间的相互作用进行了研究,为胃癌的研究提供了新的思路。 展开更多
关键词 胃癌 决策森林 基因信号通路
下载PDF
基于广义信息论的决策森林数据挖掘模型
14
作者 王利民 臧雪柏 曹春红 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第1期155-158,共4页
针对模式识别中的多分类器集成,通过挖掘测试样本特征属性的相关性,结合训练集的条件独立性分析对每个样本赋予分类规则,构造分类森林(而非单个决策树)进行模型集成。整个学习过程能够自适应确定各决策树结构和数量,并充分发挥集成模型... 针对模式识别中的多分类器集成,通过挖掘测试样本特征属性的相关性,结合训练集的条件独立性分析对每个样本赋予分类规则,构造分类森林(而非单个决策树)进行模型集成。整个学习过程能够自适应确定各决策树结构和数量,并充分发挥集成模型的伸缩性和扩展性。在UCI机器学习数据集上的实验结果验证了本方法的有效性。 展开更多
关键词 人工智能 模式识别 决策森林 条件独立性假设 数据挖掘模型
下载PDF
利用决策森林构建复杂疾病驱动的基因网络
15
作者 姜伟 吴超 +2 位作者 徐建凯 杨月莹 李霞 《中国生物医学工程学报》 CAS CSCD 北大核心 2009年第2期263-269,共7页
目前,癌症、糖尿病、心脏病、高血压等复杂疾病严重危害着人类的生命和健康,这些疾病并不是由孤立的单个基因发生改变所致,而是多基因联合作用的结果。从系统生物学的角度出发,针对以往基因网络重构算法非疾病驱动的问题,提出了一种利... 目前,癌症、糖尿病、心脏病、高血压等复杂疾病严重危害着人类的生命和健康,这些疾病并不是由孤立的单个基因发生改变所致,而是多基因联合作用的结果。从系统生物学的角度出发,针对以往基因网络重构算法非疾病驱动的问题,提出了一种利用决策森林构建复杂疾病驱动的基因网络的算法,着重关注基因间的协同作用与复杂疾病发病机理的关系。通过对结肠癌基因芯片数据的分析,识别出66个与结肠癌显著关联的基因互作,其中大部分互作关系参与细胞增殖、细胞凋亡、细胞分化、有丝分裂和免疫等与癌症密切相关的生物过程中。该方法从基因互作和通路的角度为系统研究疾病的遗传复杂性提供了一个崭新的思路。 展开更多
关键词 复杂疾病 基因网络 决策森林 系统生物学
下载PDF
一种模型决策森林算法 被引量:15
16
作者 尹儒 门昌骞 王文剑 《计算机科学与探索》 CSCD 北大核心 2020年第1期108-116,共9页
随机森林(RF)具有抗噪能力强,预测准确率高,能够处理高维数据等优点,因此在机器学习领域得到了广泛的应用。模型决策树(MDT)是一种加速的决策树算法,虽然能够提高决策树算法的训练效率,但是随着非纯伪叶结点规模的增大,模型决策树的精... 随机森林(RF)具有抗噪能力强,预测准确率高,能够处理高维数据等优点,因此在机器学习领域得到了广泛的应用。模型决策树(MDT)是一种加速的决策树算法,虽然能够提高决策树算法的训练效率,但是随着非纯伪叶结点规模的增大,模型决策树的精度也在下降。针对上述问题,提出了一种模型决策森林算法(MDF)以提高模型决策树的分类精度。MDF算法将MDT作为基分类器,利用随机森林的思想,生成多棵模型决策树。算法首先通过旋转矩阵得到不同的样本子集,然后在这些样本子集上训练出多棵不同的模型决策树,再将这些树通过投票的方式进行集成,最后根据得到的模型决策森林给出分类结果。在标准数据集上的实验结果表明,提出的模型决策森林在分类精度上明显优于模型决策树算法,并且MDF在树的数量较少时也能取到不错的精度,避免了因树的数量增加时间复杂度增高的问题。 展开更多
关键词 基尼指数 模型决策森林(MDF) 模型决策树(MDT) 随机森林(RF)
下载PDF
基于深度神经决策森林的电网数字化转型数据融合方法
17
作者 郑卓妮 辛华 《自动化与仪器仪表》 2024年第5期50-54,共5页
在电网数字化转型过程中,所需处理的数据种类繁多、规模庞大、数据源分布、格式不一致,导致数据质量差、数据分析和处理效率低。为此,提出基于深度神经决策森林的电网数字化转型数据融合方法。通过电网管理平台(计财域)对电网进行数字... 在电网数字化转型过程中,所需处理的数据种类繁多、规模庞大、数据源分布、格式不一致,导致数据质量差、数据分析和处理效率低。为此,提出基于深度神经决策森林的电网数字化转型数据融合方法。通过电网管理平台(计财域)对电网进行数字化转型,根据数据库功能差异进行分库设计,并进行读写分离设计,更好地支撑平台应用的集中部署、降低主实例事务处理压力。结合深度神经决策森林融合数字化转型后的电网数据,采用卷积神经网络,提取数字化转型后电网数据特征,将其输入由多决策树组合而成的决策森林中,通过数据分类完成数据融合。实验结果表明:本方法能够有效完成电网数字化转型数据融合,融合后数据更易查看,便于后续的应用分析;最终的数据融合准确率达到98.7%,数据损失函数值仅为0.7,且数据融合覆盖度较高,可以提升电网数字化转型过程中的电网数据应用效果。 展开更多
关键词 电网管理平台 数字化转型 数据融合 深度神经决策森林 读写分离 水平分库分表
原文传递
基于多尺度相位聚合轨迹表示的出行方式识别模型
18
作者 张驰 顾益军 《计算机工程》 CAS CSCD 北大核心 2023年第10期289-297,共9页
现有出行方式识别模型通常依赖在数据采集设备中插入额外传感器元件或提高设备采样率的方法提升识别准确率,但现实工作环境中提高设备采样率或传感器数量的做法会增加采样设备的能耗,并且设备采样率难以统一也影响了出行方式识别模型的... 现有出行方式识别模型通常依赖在数据采集设备中插入额外传感器元件或提高设备采样率的方法提升识别准确率,但现实工作环境中提高设备采样率或传感器数量的做法会增加采样设备的能耗,并且设备采样率难以统一也影响了出行方式识别模型的准确率。针对上述问题,提出基于多尺度相位聚合-深层神经决策森林的出行方式识别模型。提取轨迹数据中的多尺度局部和全局特征令牌,采用卷积神经网络层提取令牌间的时空相关性。使用相位检测令牌混合层,动态调整神经网络中令牌与固定权重的关系,捕捉令牌间的相位关系,得到多尺度相位聚合的轨迹表示。利用深层神经决策森林算法,得到出行方式的分类结果。实验结果表明,与基于随机森林的出行方式识别模型相比,所提模型在3种低频重采样数据上的平均识别准确率提升了2.726个百分点,能够更有效地识别出行方式。 展开更多
关键词 出行方式识别 深度学习 GPS数据 神经决策森林 卷积神经网络
下载PDF
基于比赛环境特征的多目标运动员跟踪方法 被引量:4
19
作者 秦海玉 廖志武 《计算机工程与设计》 北大核心 2017年第11期3173-3178,共6页
鉴于运动员跟踪与移动的复杂程度和环境等因素高度相关,提出一种基于当前运动轨迹和赛场环境特征的跟踪检测方法。从噪声检测中提取赛场环境特征集,对选手空间分布情况等当前赛场环境特征进行描述;基于当前轨迹和比赛环境特征训练随机... 鉴于运动员跟踪与移动的复杂程度和环境等因素高度相关,提出一种基于当前运动轨迹和赛场环境特征的跟踪检测方法。从噪声检测中提取赛场环境特征集,对选手空间分布情况等当前赛场环境特征进行描述;基于当前轨迹和比赛环境特征训练随机决策森林,建立运动员各时间点的亲密度模型,该环境条件性运动模型包含目标关联性,可保持可跟踪性。对分别包括10名和22名选手的篮球和足球比赛进行实验,各选取持续几分钟的序列作为样本,实验结果表明,该模型能够显著提高运动员跟踪性能。 展开更多
关键词 跟踪 环境特征 随机决策森林 关联性 运动轨迹
下载PDF
模块化决策森林的区块链交易欺诈检测模型
20
作者 田红鹏 韦甜 《计算机工程与应用》 CSCD 北大核心 2023年第19期237-246,共10页
区块链技术广泛应用于数字资产和电子交易等行业,因此出现很多欺诈行为。为了有效控制比特币交易欺诈损失,现有欺诈检测方式主要有学习模型预测和规则匹配等,但该方式存在预测精确率不够高和欺诈者容易绕过规则的问题。针对上述问题,采... 区块链技术广泛应用于数字资产和电子交易等行业,因此出现很多欺诈行为。为了有效控制比特币交易欺诈损失,现有欺诈检测方式主要有学习模型预测和规则匹配等,但该方式存在预测精确率不够高和欺诈者容易绕过规则的问题。针对上述问题,采用改进的去噪稀疏自编码器,以降低虚拟货币交易数据特征维度,继而结合“分而治之”的方法,提出模块化决策森林模型。模块化决策森林是基于峰值密度快速模糊聚类将数据分解为多组小数据,每组数据都将由一个决策树学习。根据隶属度确定模糊边界,边界模糊样本将添加一组决策树进行学习。对于分类难度仍较大的样本采用多次划分的策略,由父决策树与多个子决策树共同学习。在实验验证部分,分别采用数字图像数据集Optdigits、虚拟货币交易数据集Elliptic和Ethereum,验证模块化决策森林模型的性能,并与图神经网络、逻辑回归、随机森林等模型进行对比。实验结果表明,该模块化决策森林模型在精确率、召回率、F1-score均有大幅度提升。 展开更多
关键词 虚拟货币交易 模块化决策森林 去噪自编码器 欺诈检测
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部