期刊文献+
共找到267篇文章
< 1 2 14 >
每页显示 20 50 100
数据挖掘中的数据分类算法综述 被引量:168
1
作者 刘红岩 陈剑 陈国青 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第6期727-730,共4页
分类算法是数据挖掘中的最重要的技术之一。通过对当前提出的最新的具有代表性的分类算法进行分析和比较 ,总结每类算法的各方面特性 ,从而便于研究者对已有的算法进行改进 ,提出具有更好性能的新的分类算法 。
关键词 数据挖掘 数据分类算法 关联规则 数据库
原文传递
基于概念格的分类和关联规则的集成挖掘方法 被引量:64
2
作者 胡可云 陆玉昌 石纯一 《软件学报》 EI CSCD 北大核心 2000年第11期1478-1484,共7页
改进了一个 Bordat的建格算法 ,使之适合于集成挖掘的需要 ,进而提出一个从概念格上提取关联规则和分类规则的算法 ,实现了关联规则和分类规则的挖掘在概念格框架下的统一 .
关键词 分类 关联规则 数据挖掘 机器学习
下载PDF
数据挖掘算法研究与综述 被引量:52
3
作者 邹志文 朱金伟 《计算机工程与设计》 CSCD 北大核心 2005年第9期2304-2307,共4页
数据挖掘方法结合了机器学习、模式识别、统计学、数据库和人工智能等众多领域的知识,是解决从大量信息中获取有用知识、提供决策支持的有效途径,具有广泛的应用前景。以关联、分类、聚类归类,对当前数据挖掘的多种方法进行了研究,并指... 数据挖掘方法结合了机器学习、模式识别、统计学、数据库和人工智能等众多领域的知识,是解决从大量信息中获取有用知识、提供决策支持的有效途径,具有广泛的应用前景。以关联、分类、聚类归类,对当前数据挖掘的多种方法进行了研究,并指出其现存的问题。这些方法都有局限性,多方法融合、有机组合互补将成为数据挖掘的发展趋势。 展开更多
关键词 数据挖掘 分类算法 关联分析 分类分析 聚类分析
下载PDF
中国植被分类系统修订方案 被引量:69
4
作者 郭柯 方精云 +8 位作者 王国宏 唐志尧 谢宗强 沈泽昊 王仁卿 强胜 梁存柱 达良俊 于丹 《植物生态学报》 CAS CSCD 北大核心 2020年第2期111-127,共17页
为了推动《中国植被志》研编工作,该文回顾了中国植被分类系统的发展过程和主要阶段性成果,提出了作为《中国植被志》研编技术框架组成部分的中国植被分类系统修订方案,对各植被型组及各植被型进行了简单定义和描述,并针对中国植被分类... 为了推动《中国植被志》研编工作,该文回顾了中国植被分类系统的发展过程和主要阶段性成果,提出了作为《中国植被志》研编技术框架组成部分的中国植被分类系统修订方案,对各植被型组及各植被型进行了简单定义和描述,并针对中国植被分类系统若干问题,特别就中国植被分类系统总体框架、混交林的界定以及土壤在植被分类中的重要性等问题进行了讨论。1960年侯学煜在《中国的植被》中首次提出了中国植被分类的原则和系统,1980年出版的《中国植被》制定了分类等级和划分依据等更加完善的系统,之后《中国植被及其地理格局——中华人民共和国1:1000000植被图说明书》和《中国植物区系与植被地理》以及很多省区的植被专著对该系统进行过修订。2017年宋永昌在《植被生态学》中提出了一个分类等级单位调整的方案。本次提出的中国植被分类系统修订方案基本沿用《中国植被》的植被分类原则、分类单位及系统,采用"植物群落学-生态学"分类原则,主要以植物群落特征及其与环境的关系作为分类依据,包含三级主要分类单位,即植被型(高级单位)、群系(中级单位)和群丛(低级单位);在三个主要分类单位之上分别增加辅助单位植被型组、群系组和群丛组,在植被型和群系之下主要根据群落的生态差异和实际需要可再增加植被亚型或亚群系。修订方案包含了森林、灌丛、草本植被(草地)、荒漠、高山冻原与稀疏植被、沼泽与水生植被(湿地)、农业植被、城市植被和无植被地段9个植被型组,划分为48个植被型(含30个自然植被型、12个农业植被型、5个城市植被型和无植被地段)。自然植被中有23个植被型进一步划分出了81个植被亚型。 展开更多
关键词 植被分类 植被型 群系 群丛 群落外貌 群落生态特征 “植物群落学-生态学”分类原则
原文传递
衡阳盆地紫色土丘陵坡地植物群落数量分类及物种多样性研究 被引量:67
5
作者 杨宁 邹冬生 李建国 《农业现代化研究》 CSCD 北大核心 2009年第5期615-619,共5页
采用数学模糊聚类分析法,对衡阳盆地紫色土丘陵坡地植物群落进行数量分类,并应用Patrick丰富度指数、Simpson指数、Shannon-Wiener多样性指数以及Pielou均匀度指数比较分析了衡阳盆地紫色土丘陵坡地不同空间位置的物种多样性特点。结果... 采用数学模糊聚类分析法,对衡阳盆地紫色土丘陵坡地植物群落进行数量分类,并应用Patrick丰富度指数、Simpson指数、Shannon-Wiener多样性指数以及Pielou均匀度指数比较分析了衡阳盆地紫色土丘陵坡地不同空间位置的物种多样性特点。结果表明:(1)衡阳盆地紫色土丘陵坡地的植物群落可分为3种群丛类型,分别为Ⅰ.马尾松+杉木—牡荆+六月雪—野菊花+夏枯草群丛;Ⅱ.糯米条+紫薇—野菊花+蒲公英群丛;Ⅲ.须芒草+狗尾草群丛,它们分别位于紫色土丘陵坡地的下坡、中坡与上坡。(2)通过分析衡阳盆地紫色土丘陵坡地的物种多样性可知:①物种丰富度、均匀度和生物多样性指数其大小顺序均为:草本层>灌木层>乔木层;②衡阳盆地紫色土丘陵坡地有一定的坡性特征,阴坡植被无论是乔木层、还是灌木层和草本层,它们的物种丰富度、均匀度、Simpson多样性指数和Shannon-Wiener多样性指数均是大于同一水平空间的阳坡;③衡阳盆地紫色土丘陵坡地植物生物多样性在不同的垂直空间位置上表现各异,无论是阳坡还是阴坡其物种丰富度、均匀度、Simpson多样性指数和Shan-non-Wiener多样性指数从总体上来说从上坡至下坡有逐步增大的趋势。 展开更多
关键词 植物群落 模糊聚类 物种多样性 紫色土 群丛类型 衡阳盆地
下载PDF
数据采掘的基本方法及其与专家系统的差异 被引量:11
6
作者 唐常杰 杨富华 杨璐 《计算机应用》 CSCD 1999年第3期17-20,共4页
目前,数据采掘技术研究正在升温,大有超过当年专家系统的趋势。本文介绍了数据采掘技术的产生背景、基本任务和方法,并举例加以说明。最后简介了目前已有的成熟的KDD系统,并从方法论的角度比较了数据采掘与专家系统的差异。
关键词 数据采集 数据库 专家系统 知识发现
下载PDF
汾河太原段河漫滩草地植被的数量分类与排序 被引量:42
7
作者 上官铁梁 贾志力 +2 位作者 张金屯 张峰 许念 《草业学报》 CSCD 2001年第4期31-39,共9页
采用双向指示种分析法和除趋势对应分析法对汾河太原段河漫滩草地植被做了分类和排序研究 ,结果将汾河太原段草地群落划分为 17个群系 ,并论述了各群系的特征。DCA排序进一步说明了群系的分布格局与土壤水分、质地和人为干扰的密切关系... 采用双向指示种分析法和除趋势对应分析法对汾河太原段河漫滩草地植被做了分类和排序研究 ,结果将汾河太原段草地群落划分为 17个群系 ,并论述了各群系的特征。DCA排序进一步说明了群系的分布格局与土壤水分、质地和人为干扰的密切关系。种的DCA排序结果证明对群落生境有明显的指示作用 ,能客观反映群落的生境特征。此外 ,还讨论了群落的演替趋势。 展开更多
关键词 TWINSPAN分类 DCA排序 群丛 河漫滩草地植被 汾河 太原段
下载PDF
中条山中段植物群落数量分类与排序研究 被引量:36
8
作者 郭东罡 上官铁梁 《武汉植物学研究》 CSCD 北大核心 2005年第5期444-448,共5页
在群落样方调查基础上,采用双向指示种分析法(TW IN SPAN)和除趋势对应分析(DCA)对中条山中段植物群落进行了数量分类和排序。TW IN SPAN将53个样方分为14组,根据植被分类的原则划分为14个群丛,论述了各群丛的群落学特征。53个样方的DC... 在群落样方调查基础上,采用双向指示种分析法(TW IN SPAN)和除趋势对应分析(DCA)对中条山中段植物群落进行了数量分类和排序。TW IN SPAN将53个样方分为14组,根据植被分类的原则划分为14个群丛,论述了各群丛的群落学特征。53个样方的DCA排序结果反映了植物群落类型与环境梯度之间的关系,表明影响群丛分布格局的主导生态因子为海拔高度、水分和热量。DCA排序将65个种分为5个种组,各种组在排序轴上的位置反映了种组成员的生态适应性及其在群落中的重要性和更新生态位。 展开更多
关键词 TWINSPAN分类 群系 群落特征 DCA排序 中条山中段
下载PDF
《中国植被志》研编内容与规范 被引量:44
9
作者 王国宏 方精云 +12 位作者 郭柯 谢宗强 唐志尧 沈泽昊 王仁卿 王襄平 王德利 强胜 于丹 彭少麟 达良俊 刘庆 梁存柱 《植物生态学报》 CAS CSCD 北大核心 2020年第2期128-178,共51页
植被志是基于植被(或植物群落)调查资料,全面记叙植被的外貌、物种组成、结构和功能,以及地理分布和生境条件等特征,并对同类植被进行归纳和总结的志书。《中国植被志》是第一部对中国植被进行全面记述的志书,预计完成约48卷110册。在... 植被志是基于植被(或植物群落)调查资料,全面记叙植被的外貌、物种组成、结构和功能,以及地理分布和生境条件等特征,并对同类植被进行归纳和总结的志书。《中国植被志》是第一部对中国植被进行全面记述的志书,预计完成约48卷110册。在借鉴《中国植被》(1980)(简称"80方案")植被分类基本原则的基础上,《中国植被志》将对中国植被分类系统的高级分类单位(植被型组、植被型和植被亚型)进行归纳和总结,对中级和低级分类单位(群系组、群系、亚群系,群丛组、群丛)进行详细描述。植被高级分类单位的描述具有概括性质,是在中国植被分类系统中级和低级分类单位描述的基础上,对其在全球和中国境内的地理分布、自然环境、群落外貌、植被类型及多样性、优势种或共优势种、生物多样性保育价值以及资源现状等进行概述,并对"80方案"相关内容进行修订和拓展,将提供对中国植被基本特征客观、准确的记述。在植被中级和低级分类单位中,群系组描述的内容包括地理分布、自然环境、群落外貌、植被类型以及价值与保育等内容;群系描述的主要内容包括地理分布、自然环境、生态特征、物种组成、群落结构、群丛组和群丛的分类与描述、优势种的生物学特性、生物量与生产力、植被动态与演替以及价值与保育等方面。作为植被志研编的核心内容,群丛组和群丛的分类与描述主要基于植被调查资料,采用数量分类方法,根据群落结构和物种组成的差异划分出不同的植被类型,并对其基本特征进行定量描述和归纳。其中,群落的层片结构、特定植被分类单元的特征种或特征种组的筛选与甄别是植被类型划分的关键环节;而群落外貌,群落结构,物种组成,各类物种的生长习性、生境的偏适性等是群丛组和群丛描述与归纳的重点内容。该文提出了中国植� 展开更多
关键词 植被 植被志 植被分类 植被命名 植被描述 群系组 群系 群丛组 群丛
原文传递
再议中国的植被分类系统 被引量:31
10
作者 宋永昌 阎恩荣 宋坤 《植物生态学报》 CAS CSCD 北大核心 2017年第2期269-278,共10页
在《对中国植被分类系统的认知和建议》(简称《认知和建议》)的基础上,参考近期国内外植被分类研究成果,再次讨论了中国植被分类系统和单位,统一了各级单位划分依据,增补了高、中、低各等级分类的具体建议,并对《认知和建议》一文中相... 在《对中国植被分类系统的认知和建议》(简称《认知和建议》)的基础上,参考近期国内外植被分类研究成果,再次讨论了中国植被分类系统和单位,统一了各级单位划分依据,增补了高、中、低各等级分类的具体建议,并对《认知和建议》一文中相关部分,特别是植被型一级做了修订。将该修订方案与联合国教科文组织《世界植被分类与制图》、美国联邦地理数据委员会《美国植被分类规范》,以及Braun-Blanquet的分类方案进行对比,以便于同行间相互了解和交流。 展开更多
关键词 植被分类 植被型 群系 群丛 建议方案
原文传递
广西石灰岩季节性雨林分类的研究 被引量:22
11
作者 王献溥 孙世洲 李信贤 《植物研究》 CAS CSCD 北大核心 1998年第4期428-460,共33页
广西北热带地区石灰岩山地占据相当大的面积,特别是桂西南一带,那里形成一种独特的石灰岩季节性雨林,与相邻的砂页岩或花岗岩山地季节性雨林镶嵌分布。本文主要论述它的分类系统和地理分布规律。
关键词 季节性雨林 森林群落 群落分类 群系 群丛 植被
下载PDF
广西常绿阔叶林的分类和地理分布研究 被引量:20
12
作者 王献溥 蒋高明 《武汉植物学研究》 CSCD 2000年第3期195-205,共11页
常绿阔叶林是东亚湿润亚热带地区特有的地带性植被类型 ,群落类型多种多样。作者研究制定了广西常绿阔叶林的分类系统 ,包括 1 3个群系组、52个群系 ,列举有代表性的1 0 3个群丛。扼要地阐述了它们的地理分布和生境特点 ,为其保护和科... 常绿阔叶林是东亚湿润亚热带地区特有的地带性植被类型 ,群落类型多种多样。作者研究制定了广西常绿阔叶林的分类系统 ,包括 1 3个群系组、52个群系 ,列举有代表性的1 0 3个群丛。扼要地阐述了它们的地理分布和生境特点 ,为其保护和科学的管理提供基本材料。 展开更多
关键词 常绿阔叶林 群落分类 群系组 群丛 地理分布
下载PDF
法人应如何分类:评《民法总则》的选择 被引量:22
13
作者 王涌 《中外法学》 CSSCI 北大核心 2017年第3期609-644,共36页
《民法总则》之所以最终采营利法人和非营利法人的法人元分类,一是对《民法通则》传统的继承,二是为解决实践中的非营利法人问题,具有合理性。营利法人的一般规定实质上发挥了商法典总则的部分功能。法人分类与法人形态法定主义有密... 《民法总则》之所以最终采营利法人和非营利法人的法人元分类,一是对《民法通则》传统的继承,二是为解决实践中的非营利法人问题,具有合理性。营利法人的一般规定实质上发挥了商法典总则的部分功能。法人分类与法人形态法定主义有密切联系。社团法人和财团法人的分类是法人的构造维度的分类,两者之间的差异在减少,甚至存在重叠。中国非营利法人立法中存在体系的叠床架屋和治理的空心洞的困境,我国应制订一部《非营利法人法》,以弥补这些缺陷。《民法总则》中“非法人组织”的概念存在内在矛盾,不是一个成功创新,非法人组织的本质就是法人。信托也是隐蔽的法人。法人是社会自组织的工具,立法机构应在营利法人和非营利法人的元分类下,将各类“非法人组织”纳入两类法人。应当将非法人组织(合伙企业)赋予法人资格,改造为无限公司。民法典最终应废止“非法人组织”的概念。民法典不应吝啬法人的供给。 展开更多
关键词 法人分类 非营利法人 社团 财团 非法人组织
原文传递
草海国家级自然保护区水生植物群落的数量分类与排序分析 被引量:22
14
作者 潘少兵 任晓冬 《生物学杂志》 CAS CSCD 2010年第5期60-63,76,共5页
在群落样方调查的基础之上,采用双向指示种分析法(TW INSPAN)和除趋势对应分析(DCA)对草海国家级自然保护区水生植物群落进行分类和排序。TW INSPAN将50个样方分为17组,根据植被分类的原则划分为17个群丛,论述了各个群丛的群落学特征。5... 在群落样方调查的基础之上,采用双向指示种分析法(TW INSPAN)和除趋势对应分析(DCA)对草海国家级自然保护区水生植物群落进行分类和排序。TW INSPAN将50个样方分为17组,根据植被分类的原则划分为17个群丛,论述了各个群丛的群落学特征。50个样方的DCA排序结果反映了植物群落类型与环境梯度之间的关系,表明影响群落分布格局的主导生态因子为水分条件,第一轴反映了各个群落类型所在的水分条件梯度。排序结果与分类结果较吻合,反映出植物群落类型和物种分布随环境因子梯度变化的趋势。 展开更多
关键词 TWINSPAN分类 DCA排序 群丛 群落特征 草海自然保护区
下载PDF
维度的结合与分离对归类不确定性预测的影响 被引量:17
15
作者 莫雷 赵海燕 《心理学报》 CSSCI CSCD 北大核心 2002年第5期470-479,共10页
探讨在归类不确定的情境下目标与预测特征两个维度的结合或分离对被试特征预测的影响。共包括 3个实验 :实验 1在Murphy和Ross的研究的基础上进一步提高非靶类型中目标及预测特征的基本概率 ,考察被试的特征预测是否会受非靶类型信息的... 探讨在归类不确定的情境下目标与预测特征两个维度的结合或分离对被试特征预测的影响。共包括 3个实验 :实验 1在Murphy和Ross的研究的基础上进一步提高非靶类型中目标及预测特征的基本概率 ,考察被试的特征预测是否会受非靶类型信息的影响。实验 2探讨非靶类型的目标与预测特征结合与否是否会影响被试预测特征时对非靶类型信息的使用。实验 3探讨提高靶类型中目标与预测特征结合的比例是否影响被试对特征的预测。结果表明 :当非靶类型中目标与关键特征处于分离的状态时 ,被试在进行特征预测时没有利用非靶类型的信息 ,符合单类说的假设 ;而当非靶类型中目标与关键特征结合时 ,被试在进行特征预测时则会利用非靶类型的信息 ,符合Bayesian规则 ;靶类型中的目标与关键特征结合的比例提高 ,被试对特征预测的概率也随之提高。据此 ,本研究将目标与预测特征结合比例这个变量加入Bayesian规则的计算公式 。 展开更多
关键词 维度 结合 分离 归类 不确定性预测
下载PDF
并行数据挖掘研究 被引量:11
16
作者 张潇 恽爽 +1 位作者 陆桑璐 陈道蓄 《计算机工程》 CAS CSCD 北大核心 2003年第17期58-59,75,共3页
随着数据挖掘中数据量的高速增长以及大规模并行计算在数据挖掘中的应用,并行数据挖掘这一结合并行计算技术和数据挖掘技术在社会各个方面得到了大规模的各种各样的应用。然而,在数据挖掘并行化过程的同时,由于挖掘系统本身的原因,... 随着数据挖掘中数据量的高速增长以及大规模并行计算在数据挖掘中的应用,并行数据挖掘这一结合并行计算技术和数据挖掘技术在社会各个方面得到了大规模的各种各样的应用。然而,在数据挖掘并行化过程的同时,由于挖掘系统本身的原因,将挖掘过程完全并行还有一定的困难,这正是研究并行数据挖掘的价值所在。该文在分析并行挖掘现状,阐述并行挖掘技术发展前景的同时,针对并行挖掘的问题,指出了今后应该进行的工作。 展开更多
关键词 并行数据挖掘 分类规则 关联规则 工作站网
下载PDF
湖南水口山铅-锌多金属矿田硅化角砾岩体(带)地质特征与成矿关系 被引量:18
17
作者 刘省三 《矿产与地质》 2007年第2期186-191,共6页
水口山铅-锌多金属矿田内的硅化角砾岩体(带)的展布明显地与矿田构造关系密切。根据硅化角砾岩体(带)所处位置的地质环境、构造特征及硅化角砾岩体的产状、成份、胶结物特征的分析,参考镜下鉴定和部分测试资料,将矿田内的硅化角砾岩体(... 水口山铅-锌多金属矿田内的硅化角砾岩体(带)的展布明显地与矿田构造关系密切。根据硅化角砾岩体(带)所处位置的地质环境、构造特征及硅化角砾岩体的产状、成份、胶结物特征的分析,参考镜下鉴定和部分测试资料,将矿田内的硅化角砾岩体(带)分为层间破碎带型、断层破碎型和溢流硅帽泉华型三类,并论述各类硅化角砾岩体与铅锌多金属矿成矿关系的密切程度。 展开更多
关键词 铅锌多金属矿田 硅化角砾岩 分类 成矿关系 水口山 湖南
下载PDF
广西马尾松林分类、分布和演替的研究 被引量:17
18
作者 王献溥 蒋高明 《植物研究》 CAS CSCD 北大核心 2002年第2期151-155,共5页
马尾松林是常绿阔叶林演替系列中的一个演替阶段 ,在广西各个地理区域都有广泛的分布 ,主要见于海拔 1 30 0m以下红、黄壤丘陵山地。本文通过群落分类研究划分出 3个群丛纲 76个群丛。分析这些群丛的外貌、结构和种类成分的变化 ,可确... 马尾松林是常绿阔叶林演替系列中的一个演替阶段 ,在广西各个地理区域都有广泛的分布 ,主要见于海拔 1 30 0m以下红、黄壤丘陵山地。本文通过群落分类研究划分出 3个群丛纲 76个群丛。分析这些群丛的外貌、结构和种类成分的变化 ,可确定其演替趋向和所处的演替阶段 。 展开更多
关键词 广西 分布 常绿阔叶林 马尾松林 群落分类 群落演替 群丛
下载PDF
高地应力层状软岩隧道非对称挤压大变形分级修正方法研究 被引量:16
19
作者 孟陆波 黄意霖 +4 位作者 李天斌 陈渤 张文居 陈海清 李昊禹 《岩石力学与工程学报》 EI CAS CSCD 北大核心 2022年第1期147-156,共10页
为探明高地应力层状软岩隧道非对称大变形特征,收集200个高地应力层状软岩隧道大变形案例数据,统计分析非对称大变形的影响因素,采用关联规则方法分析隧道相对变形量、非对称变形部位,研究非对称大变形分级修正方法。结果表明:高地应力... 为探明高地应力层状软岩隧道非对称大变形特征,收集200个高地应力层状软岩隧道大变形案例数据,统计分析非对称大变形的影响因素,采用关联规则方法分析隧道相对变形量、非对称变形部位,研究非对称大变形分级修正方法。结果表明:高地应力层状软岩隧道大变形分级非对称主要因素为岩层倾角α、岩层走向与隧道轴线夹角β、原岩应力场最大主应力与岩层面夹角γ。得到大变形分级基本因素(围岩抗压强度、最大主应力值)与相对变形量、大变形分级非对称主要因素(α,β,γ)与非对称变形部位之间的20条强关联规则,揭示了α,β,γ与非对称变形的规律:随α增大,非对称变形部位从边墙和隧底转移到边墙和拱顶;随β增大,非对称变形部位从拱顶和边墙转移到隧底和边墙;随γ增大,非对称变形部位从隧底转移到边墙再到拱顶,非对称变形部位由α,β,γ共同决定。以强度应力比和相对变形量判定大变形基本等级,以大变形分级非对称主要因素α,β,γ判识大变形部位,建立非对称挤压大变形分级修正方法,取得了良好的应用效果。研究成果为层状软岩隧道非对称大变形分级判识提供了一种重要方法。 展开更多
关键词 岩石力学 高地应力 非对称 大变形 分级 关联规则
原文传递
一种大数据环境中分布式辅助关联分类算法 被引量:16
20
作者 张明卫 朱志良 +1 位作者 刘莹 张斌 《软件学报》 EI CSCD 北大核心 2015年第11期2795-2810,共16页
在很多现实的分类应用中,新数据的类标需要由领域专家最终确定,而分类器的分类结果仅起辅助作用.另外,随着大数据所隐含价值越发被人们重视,分类器的训练会从面向单一数据集逐渐过渡到面向分布式空间数据集,大数据环境下辅助分类也将成... 在很多现实的分类应用中,新数据的类标需要由领域专家最终确定,而分类器的分类结果仅起辅助作用.另外,随着大数据所隐含价值越发被人们重视,分类器的训练会从面向单一数据集逐渐过渡到面向分布式空间数据集,大数据环境下辅助分类也将成为未来分类应用的重要分支.然而,现有的分类研究缺乏对此类应用的关注.大数据环境中的辅助分类面临以下3个问题:1)训练集是分布式大数据集;2)在空间上,训练集所包含的各局部数据源的类别分布不尽相同;3)在时间上,训练集是动态变化的,会发生类别迁移现象.在考虑以上问题的基础上,提出一种大数据环境中分布式辅助关联分类方法.该方法首先给出一种大数据环境中分布式关联分类器构建算法,在该算法中,通过横向加权考虑分类数据集在空间上的类别分布差异,并给出"前件空间支持度-相关系数"的度量框架,改进关联分类算法面对不平衡数据的性能缺陷;然后,给出一种基于适应因子的辅助关联分类器动态调整方法,能够在分类器应用过程中充分利用领域专家实时反馈的结果对分类器进行动态调整,以提升其面向动态数据集的分类性能,减缓分类器的退化和重新训练的频率.实验结果表明,该方法能够面向分布式数据集较快地训练出有较高分类准确率的关联分类器,并在数据集不断扩充变化时提升分类性能,是一种有效的大数据环境中辅助分类应用方法. 展开更多
关键词 大数据 分布式 辅助分类 关联分类 动态分类器
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部