基于Tri-training的主动学习算法被引量：3

Active Learning Algorithm Based on Tri-training

下载PDF

导出

摘要半监督学习和主动学习都是利用未标记数据,在少量标记数据代价下同时提高监督学习识别性能的有效方法。为此,结合主动学习方法与半监督学习的Tri-training算法,提出一种新的分类算法,通过熵优先采样算法选择主动学习的样本。针对UCI数据集和遥感数据,在不同标记训练样本比例下进行实验,结果表明,该算法在标记样本数较少的情况下能取得较好的效果。将主动学习与Tri-training算法相结合,是提高分类性能和泛化性的有效途径。 Both semi-supervised learning and active learning attempt to exploit the unlabeled data to improve the recognition rate of supervised learning algorithms and minimize the cost of data labeling. So this paper proposes an algorithm to select samples in active learning such as Entropy Priority Sampling（EPS）. It combines with the Tri-training algorithm and active learning method. Experimental results on both the UCI and image datasets under different proportion of marker training samples show that, this algorithm can obtain better result in the case of fewer labeled examples, and the combination of the active learning with semi-supervised learning is an effective way to improve the performance and generalization.

作者张雁吴保国吕丹桔林英

机构地区北京林业大学信息学院西南林业大学计算机与信息学院云南大学软件学院

出处《计算机工程》 CAS CSCD 2014年第6期215-218,229,共5页 Computer Engineering

基金云南省教育厅科研基金资助项目(2010Y290 2012C098)

关键词半监督学习主动学习 Tri—training算法熵优先采样 Tri-EPS算法 semi-supervised learning active learning Tri-training algorithm Entropy Priority Sampling（EPS） Tri-EPS algorithm

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献18

1Zhu Xiaojin. Semi-supervised Learning Literature Survey[R]. Department of Computer Sciences, University of Wisconsin at Madison, Tech. Rep: 1530, 2008. 被引量：1
2周志华,王珏主编..机器学习及其应用 2007[M].北京:清华大学出版社,2007:275.
3Zhou Zhihua, Zhan Dechuan, Yang Qiang. Semi-supervised Learning with Very Few Labeled Training Examples[C]// Proceedings of the 22nd AAAI Conference on Artificial Intelligence. Vancouver, Canada: AAAI Press, 2007: 675-680. 被引量：1
4杨伟,方涛,许刚.基于朴素贝叶斯的半监督学习遥感影像分类[J].计算机工程,2010,36(20):167-169. 被引量：8
5Seeger M. Learning with Labeled and Unlabeled Data[R]. Institute for Adaptive and Neural Computation, University of Edinburgh, Tech. Rep.: EPFL-REPORT-161327, 2002. 被引量：1
6Mohamed Farouk Abdel Hady,Friedhelm Schwenker.Combining Committee-Based Semi-Supervised Learning and Active Learning[J].Journal of Computer Science & Technology,2010,25(4):681-698. 被引量：6
7吴伟宁,刘扬,郭茂祖,刘晓燕.基于采样策略的主动学习算法研究进展[J].计算机研究与发展,2012,49(6):1162-1173. 被引量：33
8Lewis D, Gale W. A Sequential Algorithm for Training Text Classifiers[C]//Proceedings of the 17th ACM International Conference on Research and Development in Information Retrieval. Dublin, Ireland: ACM Press, 1994: 3-12. 被引量：1
9Seuong H, Opper M, Sompolinski H. Query by Committee[C]// Proceedings of the 5th ACM Workshop on Computational Learning Theory. Pittsburgh, USA: ACM Press, 1992: 287-294. 被引量：1
10Freund Y, Seung H S, Shamir E, et al. Selective Sampling Using the Query by Committee Algorithm[J]. Machine Learning, 1997, 28(2/3): 133-168. 被引量：1

二级参考文献146

1Zhou Z H, Chen K J, Jiang Y. Exploiting unlabeled data in content-based image retrieval. In Proc. the 15th European Conf. Machine Learning ( ECML 2004), Pisa, Italy, Sept. 20- 24, 2004, pp.525-536. 被引量：1
2Li M, Zhou Z H. Improve computer-aided diagnosis with machine learning techniques using undiagnosed samples. IEEE Trans. Systems, Man and Cybernetics - Part A: Systems and Humans, 2007, 37(6): 1088-1098. 被引量：1
3Levin A, Viola P, Freund Y. Unsupervised improvement of visual detectors using Co-Training. In Proc. the Int. Conf. Computer Vision, Graz, Austria, April 1-3, 2003, pp.626-633. 被引量：1
4Nigam K, McCallum A K, Thrun S, Mitchell T. Text classification from labeled and unlabeled documents using EM. Machine Learning, 2000, 39(2/3): 103-134. 被引量：1
5Kiritchenko S, Matwin S. Email classification with Co- Training. In Proc. the 2001 Conf. the Centre for Advanced Studies on Collaborative Research ( CASCON 2001), Toronto, Canada, Nov. 5-7, 2001, pp.8-19. 被引量：1
6Nigam K, Ghani R. Analyzing the effectiveness and applicability of Co-Training. In Proc. the 9th Int. Conf. Information and Knowledge Management, McLean, USA, Nov. 6-11, 2000, pp.86-93. 被引量：1
7Lewis D D, Gale A W. A sequential algorithm for training text classifiers. In Proc. the Special Interest Group on Info. Retrieval, Dublin, Irland, July 3-6, 1994, pp.3-12. 被引量：1
8Dempster A P, Laird N M, Rubin D B. Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society, Series B (Methodological, 1977, 39(1): 1-38. 被引量：1
9Blum A, Mitchell T. Combining labeled and unlabeled data with Co-Training. In Proc. the 11th Annual Conf. Computational Learning Theory (COLT1998), Madison, USA, July 24-26, 1998, pp.92-100. 被引量：1
10Muslea I, Minton S, Knoblock C A. Selective sampling with redundant views. In Proc. the 17th National Conference on Artificial Intelligence and Twelfth Conference on Innovative Applications of Artificial Intelligence, Austin, USA, Jul. 30- Aug. 3, 2000, pp.621-626. 被引量：1

共引文献58

1文辉,徐永林,于敬.基于主动学习的领域知识多模式抽取框架[J].新一代信息技术,2022,5(6):137-143.
2王娇,罗四维,曾宪华.基于随机子空间的半监督协同训练算法[J].电子学报,2008,36(B12):60-65. 被引量：14
3李昆仑,张伟,代运娜.基于Tri-training的半监督SVM[J].计算机工程与应用,2009,45(22):103-106. 被引量：15
4蔡晰,郭躬德,黄添强.用于化合物毒性预测的半监督分类算法[J].计算机工程与设计,2010,31(12):2838-2841.
5孔志周,蔡自兴.基于统计证据的半监督多分类器融合方法[J].控制与决策,2011,26(11):1616-1620. 被引量：2
6黄鸿,秦高峰,冯海亮.半监督流形学习及其在遥感影像分类中的应用[J].光学精密工程,2011,19(12):3025-3033. 被引量：6
7邬书跃,余杰,樊晓平.基于Tri-training的入侵检测算法[J].计算机工程,2012,38(6):158-160. 被引量：2
8易文斌,冒亚明,慎利.利用概率主题模型的遥感影像半监督分类[J].计算机工程与应用,2013,49(10):1-4. 被引量：2
9程圣军,刘家锋,黄庆成,唐降龙.基于样本条件价值改进的Co-training算法[J].自动化学报,2013,39(10):1665-1673. 被引量：4
10张雁,林英,吕丹桔.基于Tri-Training算法的数据编辑技术[J].计算机与数字工程,2013,41(10):1583-1585.

同被引文献22

1车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
2董静,孙乐,冯元勇,黄瑞红.中文实体关系抽取中的特征选择研究[J].中文信息学报,2007,21(4):80-85. 被引量：55
3姚从磊,邸楠.一种基于Web的大规模人物社会关系提取方法[J].模式识别与人工智能,2007,20(6):740-744. 被引量：11
4陈耀东,王挺,陈火旺.半监督学习和主动学习相结合的浅层语义分析[J].中文信息学报,2008,22(2):70-75. 被引量：13
5刘路,李弼程,张先飞.基于正反例训练的SVM命名实体关系抽取[J].计算机应用,2008,28(6):1444-1446. 被引量：4
6黄鑫,朱巧明,钱龙华,刘梅梅.基于特征组合的中文实体关系抽取[J].微电子学与计算机,2010,27(4):198-200. 被引量：19
7陈荣,曹永锋,孙洪.基于主动学习和半监督学习的多类图像分类[J].自动化学报,2011,37(8):954-962. 被引量：74
8毛小丽,何中市,邢欣来,刘莉.基于语义角色的实体关系抽取[J].计算机工程,2011,37(17):143-145. 被引量：7
9吴伟宁,刘扬,郭茂祖,刘晓燕.基于采样策略的主动学习算法研究进展[J].计算机研究与发展,2012,49(6):1162-1173. 被引量：33
10刘康,钱旭,王自强.主动学习算法综述[J].计算机工程与应用,2012,48(34):1-4. 被引量：25

引证文献3

1刘锦文,许静,张利萍,芮伟康.基于标签传播和主动学习的人物社会关系抽取[J].计算机工程,2017,34(2):234-240. 被引量：4
2康璐璐,范兴容,王茜竹,杨晓雅,明蕊.基于特征组分层与半监督学习的鼠标轨迹识别[J].计算机工程,2021,47(4):277-284. 被引量：1
3马骏,杨镜宇,吴曦.基于预聚类主动半监督的作战体系效能评估[J].系统工程与电子技术,2022,44(6):1889-1896.

二级引证文献5

1张璞,王俊霞,王英豪.基于标签传播的情感词典构建方法[J].计算机工程,2018,44(5):168-173. 被引量：9
2黄杨琛,贾焰,甘亮,徐菁,黄九鸣,赫中翮.基于远程监督的多因子人物关系抽取模型[J].通信学报,2018,39(7):103-112. 被引量：10
3王健,郑七凡,李超,石晶.基于ENCODER_ATT机制的远程监督关系抽取[J].广西师范大学学报（自然科学版）,2019,37(4):53-60.
4黄炟鑫,蒋俊正.基于图模型的高光谱图像分类算法[J].桂林电子科技大学学报,2022,42(3):205-210.
5严银凯,彭宁宁,易丽莎.基于持续同调的倾斜时间序列分类算法[J].计算机工程,2024,50(6):110-123.

1王雷,杨思春.基于改进Tri-training算法的中文问句分类[J].安徽工业大学学报（自然科学版）,2016,33(2):172-176. 被引量：1
2张雁,林英,吕丹桔.基于Tri-Training算法的数据编辑技术[J].计算机与数字工程,2013,41(10):1583-1585.
3张雁,吕丹桔,吴保国.基于Tri-Training半监督分类算法的研究[J].计算机技术与发展,2013,23(7):77-79. 被引量：9
4李心磊,杨思春,彭月娥.Tri-training算法中分类器组合的改进[J].苏州科技学院学报（自然科学版）,2014,31(2):52-56. 被引量：4
5彭雅琴,宫宁生.一种自适应的Tri-Training半监督算法[J].计算机系统应用,2016,25(8):130-134. 被引量：1
6郭毅,黄磊.基于LPA和Tri-Training的半监督文本倾向性分类[J].北京交通大学学报,2015,39(6):114-121. 被引量：1
7徐庆伶,汪西莉.一种基于支持向量机的半监督分类方法[J].计算机技术与发展,2010,20(10):115-117. 被引量：18
8彭雅琴,宫宁生.基于直觉模糊集的Tri-Training改进算法[J].微电子学与计算机,2016,33(3):134-137.
9杨伟,方涛,许刚.基于朴素贝叶斯的半监督学习遥感影像分类[J].计算机工程,2010,36(20):167-169. 被引量：8
10于明,朱超.利用半监督近邻传播聚类算法实现P2P流量识别[J].哈尔滨工程大学学报,2013,34(5):653-657. 被引量：6

计算机工程

2014年第6期

浏览历史

内容加载中请稍等...

基于Tri-training的主动学习算法被引量：3

参考文献18

二级参考文献146

共引文献58

同被引文献22

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于Tri-training的主动学习算法 被引量：3

参考文献18

二级参考文献146

共引文献58

同被引文献22

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于Tri-training的主动学习算法被引量：3