加权投票采样学习在用户信用评级中的应用被引量：2

Application of user credit rating based on weighted voting sampling algorithm

下载PDF

导出

摘要以委员会投票查询算法为基础,提出在采样过程中动态修正分类器成员权值的加权投票方法。在对无标签样本标注价值评估中,该方法能够强化高精度分类器成员的查询贡献,降低高误差成员的投票影响,减少机器训练过程中的标注学习次数。通过在UCI的Statlog(Australian Credit Approval)数据集上对用户信用度级别进行识别,并比较于其他采样方法,证明该方法能够用较小的采样标注代价获取稳定的泛化精度。 In this paper, a method of weighted voting is proposed which can adjust weights of classifiers in committee during the sampling process and it is based on query by committee algorithm. In process of unlabeled sample’s quality evaluation, the method can strengthen the contribution of high precision members, reduce the influence of high error mem-bers and decrease the times of learning which is needed in machine training. By experiment on dataset of Statlog（Austra-lian Credit Approval）and compared results with other methods, the effectiveness has been proved that the algorithm can gain stable generalization accuracy with smaller costs of samples labeling.

作者陈念唐振民

机构地区池州学院数学与计算机科学系南京理工大学计算机科学与工程学院

出处《计算机工程与应用》 CSCD 2014年第21期259-263,共5页 Computer Engineering and Applications

基金安徽省教育厅高等学校自然科学研究重点项目(No.KJ2012A211)

关键词主动学习采样查询加权投票熵标注门槛 active leaming sampling query weighted voting entropy labeling threshold

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1陈荣,曹永锋,孙洪.基于主动学习和半监督学习的多类图像分类[J].自动化学报,2011,37(8):954-962. 被引量：74
2Hoi S C H,Jin R,Lyu M R.Large-scale text categoriza- tion by batch mode active learning[C]//Proceedings of the International Conference on World Wide Web.[S.1.]: ACM Press, 2006 : 633-642. 被引量：1
3Settles B,Craven M.An analysis of active learning strat- egies for sequence labeling tasks[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing. [S.1.] : ACL Press, 2008 : 1069-1078. 被引量：1
4Hauptmann,Lin W, Yan R,et al.Extreme video retrieval: joint maximization of human and computer performance[C]// Proceedings of ACM Workshop on Multimedia Image Retrieval.[S.1.] , ACM Press, 2006 : 385-394. 被引量：1
5Chu W,Zinkevich M,Li L,et al.Unbiased online active learning in data streams[C]//Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Dis- covery and Data Mining.[S.1.] :ACM Press,2011 : 195-203. 被引量：1
6Graepel T, Candela J Q, Borchert T, et al.Web-scale Bayesian click-through rate prediction for sponsored search adver- tising in Microsoft's Bing search engine[C]//Proeeedings of the 27th International Conference on Machine Learning, 2010: 13-20. 被引量：1
7吴伟宁,刘扬,郭茂祖,刘晓燕.基于采样策略的主动学习算法研究进展[J].计算机研究与发展,2012,49(6):1162-1173. 被引量：33
8Tong S, Koller D.Support vector machine active learningwith applications to text classification[J].The Journal of Machine Learning Research, 2001 ( 2 ) : 45-66. 被引量：1
9Huang Shengjun, Jin Rong, Zhou Zhihua.Active learning by querying informative and representative examples[C]// Proc of NIPS 2010.Cambridge, MA: M1T Press, 2010: 892-900. 被引量：1
10Dagan I,Engelson S P.Committee based sampling for training probahilistic classifiers[C]//Proceedings of the 12th International Conference on Machine Learning, 1995: 150-157. 被引量：1

二级参考文献97

1Settles B. Active Learning Literature Survey, Computer Science Technical Report 1648, University of Wisconsin- Madison, USA, 2009. 3-4. 被引量：1
2Dasgupta S. Coarse sample complexity bounds for active learning. Advances in Neural Information Processing Sys- tems. Cambridge: The MIT Press, 2006. 235-242. 被引量：1
3Tong S, Chang E. Support vector machine active learning for image retrieval. In: Proceedings of the 9th ACM Inter- national Conference on Multimedia. New York, USA: ACM, 2001. 107-118. 被引量：1
4Tong S, Koller D. Support vector machine active learning with applications to text classification. The Journal of Ma- chine Learning Research, 2002, 2:45-66. 被引量：1
5Seung H S, Opper M, Sompolinsky H. Query by commit- tee. In: Proceedings of the 5th Annual Workshop on Com- putational Learning Theory. New York, USA: ACM, 1992. 287-294. 被引量：1
6Dagan I, Engelson S P. Committee-based sampling for train- ing probabilistic classifiers. In: Proceedings of the 12th International Conference on Machine Learning. California, USA: Morgan Kaufmann, 1995. 150-157. 被引量：1
7Hoi S C H, Jin R, Lyu M R. Batch mode active learning with applications to text categorization and image retrieval. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(9): 1233-1248. 被引量：1
8Joshi A J, Porikli F, Papanikolopoulos N. Multi-class ac- tive learning for image classification. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recog- nition. Miami, USA: IEEE, 2009. 2372-2379. 被引量：1
9Zhu X J. Semi-supervised Learning Literature Survey, Computer Sciences Technical Report 1530, University of Wisconsin-Madison. USA. 2008. 11-13. 被引量：1
10Riloff E, Wiebe J, Wilson T. Learning subjective nouns using extraction pattern bootstrapping. In: Proceedings of the 7th Conference on Natural Language Learning. Stroudsburg, USA: Association for Computational Linguis- tics, 2003. 25-32. 被引量：1

共引文献98

1刘振宇,李钦富,杨硕,邓应强,刘芬,赖新明,白雪珂.一种基于主动学习和多种监督学习的情感分析模型[J].中国电子科学研究院学报,2020,15(2):171-176. 被引量：2
2文辉,徐永林,于敬.基于主动学习的领域知识多模式抽取框架[J].新一代信息技术,2022,5(6):137-143.
3曹健,陈红倩,毛典辉,李海生,蔡强.基于局部特征的图像目标识别问题综述[J].中南大学学报（自然科学版）,2013,44(S2):258-262. 被引量：14
4赵丰丰.美国《化学文摘》近年的变化[J].医学情报工作,2000,21(2):45-47. 被引量：3
5黄扬帆,张慧敏,徐子航,曹鹏程.超球体支持向量机的不完全二叉树多类分类算法[J].重庆大学学报（自然科学版）,2012,35(6):125-128. 被引量：5
6张建朋,陈福才.基于仿射聚类的主动SVM多类分类方法[J].计算机应用研究,2012,29(9):3316-3319.
7张雁,吴保国,王冬.遥感影像分类方法研究动态[J].安徽农业科学,2012,40(28):14107-14110. 被引量：4
8曹健,李海生,蔡强,郭世龙.图像目标的特征提取技术研究[J].计算机仿真,2013,30(1):409-414. 被引量：32
9芦世丹,崔荣一.基于主动学习策略的半监督聚类算法研究[J].计算机应用研究,2013,30(6):1718-1720. 被引量：1
10张桂平,李文博,王裴岩.基于主动学习的本体概念关系判断[J].中文信息学报,2013,27(4):37-43. 被引量：1

同被引文献27

1李珩,朱靖波,姚天顺.基于Stacking算法的组合分类器及其应用于中文组块分析[J].计算机研究与发展,2005,42(5):844-848. 被引量：18
2李荣艳,金鑫,王春辉,郑宁,别荣芳.一种新的中文文本分类算法[J].北京师范大学学报（自然科学版）,2006,42(5):501-505. 被引量：6
3王华栋,饶培伦.基于搜索引擎的中文分词评估方法[J].情报科学,2007,25(1):108-112. 被引量：5
4化柏林.知识抽取中的停用词处理技术[J].现代图书情报技术,2007(8):48-51. 被引量：39
5未瑞,罗国亮.基于聚类分析和层次分析法的电力客户信用评价研究[J].现代电力,2007,24(6):80-84. 被引量：11
6黄文杰,张宇波.基于可拓方法的电力客户信用风险评估[J].电力系统保护与控制,2008,36(19):5-8. 被引量：9
7卢建昌,蒋伟,刘娜.基于改进的熵权法的电力客户信用风险评价研究[J].电力学报,2008,23(5):368-370. 被引量：5
8周凯,栗秋华,周林,刘强,武剑.基于物元分析理论的大电力客户信用评价[J].电网技术,2009,33(16):75-80. 被引量：18
9宋连峻,徐志勇.基于集对分析和马尔可夫链的电力客户信用风险评估[J].电力自动化设备,2009,29(12):37-40. 被引量：6
10牛小梅,张银玲.层次分析法在电力客户信用风险中的评价[J].计算机仿真,2011,28(5):333-336. 被引量：14

引证文献2

1何跃,赵书朋,何黎.基于情感知识和机器学习算法的组合微文情感倾向分类研究[J].情报杂志,2018,37(5):189-194. 被引量：13
2王炼,孙和平,谢振平,王士同.一种基于缴费积极性的电力客户信用评估模型[J].计算机工程与应用,2016,52(22):253-259. 被引量：7

二级引证文献20

1张振刚,罗泰晔.基于在线评论数据挖掘和Kano模型的产品需求分析[J].管理评论,2022,34(11):109-117. 被引量：12
2杨铮宇,田园,李申章.基于主成分分析和层次分析的高压电力用户信用评价模型研究[J].云南大学学报（自然科学版）,2020,42(S02):6-12. 被引量：16
3马文,杨铮宇,张梅.基于偏差熵的低压电力用户信用组合评价研究[J].云南大学学报（自然科学版）,2020,42(S02):1-5. 被引量：6
4陈宁,吕志鹏,陈孝文,付越,陈文超.电力客户信用综合评估及应用研究[J].科技与创新,2018(17):126-127. 被引量：2
5李捞扒,邹阳,曾晓勤.基于缴费行为轨迹追踪的渠道风险监控模型[J].微型电脑应用,2019,35(4):65-70. 被引量：3
6国佳,郭勇,沈旺,潘梦雅.基于在线评论的网络社区信息可信度评价方法研究[J].图书情报工作,2019,63(17):137-144. 被引量：16
7赵乐,麦范金,张兴旺.多特征融合的Voting-SRM情感分类研究[J].小型微型计算机系统,2019,40(11):2269-2273. 被引量：10
8朱晓霞,宋嘉欣,张晓缇.基于主题挖掘技术的文本情感分析综述[J].情报理论与实践,2019,42(11):156-163. 被引量：24
9宫立华,杨菁,刘鲲鹏,朱龙珠.电力客户缴费渠道业务量预测[J].电力大数据,2019,22(12):9-14. 被引量：2
10谢卫红,杨超波,朱郁筱,李忠顺,蒋瞰阳.网络舆情监控算法研究与分析[J].科技管理研究,2019,39(22):197-205. 被引量：8

1许建,马强.ROLAP查询优化的研究[J].计算机与现代化,2008(7):29-32. 被引量：1
2陈晓璞.数据挖掘技术在客户关系管理中的研究[J].计算机光盘软件与应用,2010(6):34-34.
3王辉.基于结构简化的BP网络的多类形状识别[J].计算机技术与发展,2006,16(7):13-14.
4程玉虎,汪婵,王雪松,孙伟芳.基于软间隔委员会投票主动学习的遥感影像分类[J].煤炭学报,2013,38(7):1201-1206. 被引量：1
5程序设计语言[J].电子科技文摘,2002,0(4):130-131.
6顾磊,梁喜涛.基于委员会投票的主动学习中文分词方法[J].图书馆学研究,2016(1):36-40.
7史永胜,宋云雪.基于遗传算法与BP神经网络的故障诊断模型[J].计算机工程,2004,30(14):125-127. 被引量：17
8奉国和,朱思铭.基于聚类的大样本支持向量机研究[J].计算机科学,2006,33(4):145-147. 被引量：14
9吴健,盛胜利,赵朋朋,崔志明.最小差异采样的主动学习图像分类方法[J].通信学报,2014,35(1):107-114. 被引量：4
10车万翔,张梅山,刘挺.基于主动学习的中文依存句法分析[J].中文信息学报,2012,26(2):18-22. 被引量：10

计算机工程与应用

2014年第21期

浏览历史

内容加载中请稍等...

加权投票采样学习在用户信用评级中的应用被引量：2

参考文献15

二级参考文献97

共引文献98

同被引文献27

引证文献2

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

加权投票采样学习在用户信用评级中的应用 被引量：2

参考文献15

二级参考文献97

共引文献98

同被引文献27

引证文献2

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

加权投票采样学习在用户信用评级中的应用被引量：2