-
题名基于委员会投票选择方法的主动学习的研究
被引量:7
- 1
-
-
作者
赵悦
穆志纯
-
机构
北京科技大学信息工程学院
-
出处
《太原理工大学学报》
CAS
北大核心
2006年第4期469-472,共4页
-
文摘
讨论了利用QBC(委员会投票选择)的主动学习方法来学习贝叶斯网络分类器,通过对基于投票熵和基于KL-divergence的QBC算法的研究,指出了两者存在的缺陷;同时提出了基于投票熵与类条件后验最大熵相结合的QBC算法。实验证明,该算法提高了分类器的精度,并使用了较少的训练样本,这有效解决了大数据量训练样本获得困难的情况下分类器建模问题。
-
关键词
主动学习
委员会投票选择
投票熵
最大熵
-
Keywords
active learning
Query-by-Committee
vote entropy
maximum entropy
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名结合主动学习策略的半监督分类算法
被引量:7
- 2
-
-
作者
赵建华
刘宁
-
机构
西北工业大学计算机学院
商洛学院数学与计算机应用学院
商洛学院经济与管理学院
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第8期2295-2298,共4页
-
基金
陕西省自然科学基础研究计划资助项目(2015JM6347)
商洛学院科研资助项目(14SKY006
14SKY007)
-
文摘
为了提高半监督分类的性能,提出一种基于主动学习策略的半监督分类算法SSC_AL和一种基于改进的主动学习策略的半监督分类算法SSC_IAL。通过样本密度计算,改进基于投票熵的主动学习算法,减少主动学习过程中可能产生的孤立点和冗余点;分别使用主动学习策略和改进的主动学习策略挑选信息价值高的无标记样本作为候选样本,使用半监督学习算法对候选样本进行自动标记,减少人工干预。最后,把新增加的新标记样本添加到主动学习和半监督学习的训练集中,训练各自分类器,反复迭代。使用UCI数据集进行实验,结果表明SSC-AL和SSC-IAL算法将问题规模缩减到原来的11%和17%,SSC-IAL分类率提高了1.41%,并且算法的收敛性良好。
-
关键词
半监督分类
主动学习
投票熵
样本密度
-
Keywords
semi-supervised classification
active learning
vote entropy
density of samples
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于半监督主动学习的动态贝叶斯网络算法
被引量:3
- 3
-
-
作者
赵悦
穆志纯
潘秀琴
李霞丽
-
机构
中央民族大学数学与计算机学院
北京科技大学信息工程学院
-
出处
《信息与控制》
CSCD
北大核心
2007年第2期224-229,244,共7页
-
基金
北京市教委重点学科共建资助项目
国家民族事务委员会"十一五"科技创新资助项目(cun0240)
-
文摘
本文提出一种基于半监督主动学习的算法,用于解决在建立动态贝叶斯网络(DBN)分类模型时遇到的难以获得大量带有类标注的样本数据集的问题.半监督学习可以有效利用未标注样本数据来学习DBN分类模型,但是在迭代过程中易于加入错误的样本分类信息,并因而影响模型的准确性.在半监督学习中借鉴主动学习,可以自主选择有用的未标注样本来请求用户标注.把这些样本加入训练集之后,能够最大程度提高半监督学习对未标注样本分类的准确性.实验结果表明,该算法能够显著提高DBN学习器的效率和性能,并快速收敛于预定的分类精度.
-
关键词
动态贝叶斯网络
半监督主动学习
主动学习
最小相对熵
投票熵
-
Keywords
dynamic Bayesian network(DBN)
semi-supervised active learning(SSAL)
active learning
minimum relative entropy
vote entropy
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于投票信息熵的AdaBoost改进算法
被引量:5
- 4
-
-
作者
唐焕玲
鲁明羽
邬俊
-
机构
大连海事大学信息科学技术学院
-
出处
《控制与决策》
EI
CSCD
北大核心
2010年第4期487-492,共6页
-
基金
国家自然科学基金项目(60773084
J0724003
+1 种基金
60603023)
高等学校博士学科点专项科研基金项目(20070151009)
-
文摘
针对AdaBoost算法不能有效提升NB(Naive Bayesian)的分类性能,提出一种改进的样本权重维护策略.权重的调整不仅依据样本是否分错,还需考虑前几轮的多个基分类器对它的投票分歧.基分类器的信任度不但与错误率有关,还与基分类器间的差异性有关.这样可以提高基分类器的正确性,增加基分类器的差异性.实验结果表明,改进的BoostVE-NB算法能有效地提升NB文本分类性能.
-
关键词
ADABOOST
朴素贝叶斯
文本分类
样本权重
投票信息熵
-
Keywords
AdaBoost
Naive Bayesian
Text categorization
Examples'weight
vote entropy
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名QBC主动采样学习在垃圾邮件在线过滤中的应用
被引量:3
- 5
-
-
作者
陈念
唐振民
-
机构
池州学院数学与计算机科学系
南京理工大学计算机科学与工程学院
-
出处
《计算机工程与应用》
CSCD
2014年第22期170-174,共5页
-
基金
安徽省教育厅自然重点项目(No.KJ2012A211)
-
文摘
针对垃圾邮件在线过滤的实际应用,在委员会投票算法采样学习的基础上,提出动态提升采样门槛,在无标签样本池中阶梯式获取高信息量训练样本的方法。该方法能够在稳定识别精度的前提下,进一步降低用于标注和学习的样本数量,压缩由此带来的时间成本。通过在UCI的Spambase数据集上仿真,证明了该方法在改善学习效率方面的有效性。
-
关键词
垃圾邮件过滤
版本空间
主动学习
投票熵
委员会投票算法
-
Keywords
spam filtering
version space
active learning
vote entropy
query-by-committee algorithm
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于QBC的主动学习研究及其应用
被引量:5
- 6
-
-
作者
赵悦
穆志纯
-
机构
北京科技大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2006年第24期23-25,共3页
-
文摘
结合委员会成员投票熵和相对熵,改进了基于委员会选择算法(QBC)的主动学习,并应用基于该算法的主动贝叶斯网络对电信客户信用风险分类进行建模。实验结果表明,提出的基于改进的QBC主动贝叶斯网络分类器所建模型比原有算法有更好的分类精度,并且使用了少量的训练数据。
-
关键词
主动学习
委员会选择
投票熵
相对熵
信用分类
-
Keywords
Active learning
Query-by-committee(QBC)
vote entropy: Kullback-leibler divergence
Credit classification
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-