一种基于随机游走模型的多标签分类算法被引量：57

A Multi-Label Classification Algorithm Based on Random Walk Model

下载PDF

导出

摘要在数据挖掘领域,传统的单分类和多分类问题已经得到了广泛的研究.但是多标签数据的普遍存在性和重要性直到近些年来才逐渐得到人们的关注.在多标签分类问题中,由于标签相关性的存在,传统的单分类和多分类问题的解决方法,无法简单地应用于多标签分类问题.文中提出了一种基于随机游走模型的多标签分类算法,称为多标签随机游走算法.首先,将多标签数据映射成为多标签随机游走图.当输入一个未分类数据时,建立一个多标签随机游走图系列.而后,对图系列中的每个图应用随机游走模型,得到遍历每个顶点的概率分布,并将这个点概率分布转化成每个标签的概率分布.最后,基于多标签随机游走算法,文中给出了一种新的阈值学习算法.真实数据集上的实验表明,多标签随机游走算法可以有效地解决多标签分类问题. There are extensive literatures related to traditional single-class and multi-class classification problems,in which each data point is assigned to one category.But in many applications,a data point may belong to more than one category.This kind of problem is called the Multi-Label Classification（MLC） problem.Due to the existing of label relevance,the traditional data-mining methods cannot be directly applied to the MLC problems.This paper proposes a novel MLC algorithm based on the random walk model,called Multi-Label Random Walk（MLRW） algorithm.Firstly,a multi-label random walk graph is built on the training set.As an unlabeled data arrives,a multi-label random walk graph system will be built,on which the random walk processing is carried out.After that,a probability distribution among all labels is obtained.At last,a threshold learning algorithm is proposed based on the MLRW algorithm so that the final prediction on each label is presented.Experimental results on actual data set show that the MLRW algorithm provides an effective solution to the MLC problems.

作者郑伟王朝坤刘璋王建民

机构地区清华大学软件学院清华信息科学与技术国家实验室信息系统安全教育部重点实验室

出处《计算机学报》 EI CSCD 北大核心 2010年第8期1418-1426,共9页 Chinese Journal of Computers

基金国家自然科学基金(60803016) 国家"九七三"重点基础研究发展规划项目基金(2007CB310802 2009CB320706) 国家"八六三"高技术研究发展计划项目基金(2008AA042301 2007AA040602)资助~~

关键词多标签分类算法随机游走阈值学习 multi-label classification random walk threshold learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献24

1Streich A,Buhmann J.Classification of multi-labeled data:A generative approach//Proceedings of the ECML/PKDD.Antwerp,Belgium,2008,2:390-405. 被引量：1
2Lewis D,Yang Y,Rose T,Li F.RCV1:A new benchmark collection for text categorization research.The Journal of Machine Learning Research,2004,5:361-397. 被引量：1
3Veloso A,Meira Jr W,Zaki M.Calibrated lazy associative classification//Proceedings of the 23rd Brazilian Symposium on Databases.Brazil,2008:135-149. 被引量：1
4Snoek C,Worring M,Gemert J V,Geusebroek J,Smeulders A.The challenge problem for automated detection of 101 semantic concepts in multimedia//Proceedings of the ACM Multimedia.Santa Barbara,CA,USA,2006:421-430. 被引量：1
5Tsoumakas G.Multi-label classification.International Journal of Data Warehousing & Mining,2007,3(3):1-13. 被引量：1
6Shen X,Boutell M,Luo J,Brown C.Multi-label machine learning and its application to semantic scene classification//Proceedings of the 2004 International Symposium on Electronic Imaging.San Jose,California,USA,2004:18-22. 被引量：1
7Hullermeier E,Furnkranz J,Cheng W,Brinker K.Label ranking by learning pairwise preferences.Artificial Intelligence,2008,172(16):1897-1916. 被引量：1
8Read J.A pruned problem transformation method for multi-label classification//Proceedings of the New Zealand Computer Science Research Student Conference.New Zealand,2008:143-150. 被引量：1
9Tsoumakas G,Vlahavas I.Random k-labelsets:An ensemble method for multilabel classification//Proceedings of the ECML.Warsaw,Poland,2007:406-417. 被引量：1
10Schapire R,Singer Y.BoosTexter:A boosting-based system for text categorization.Machine Learning,2000,39(2):135-168. 被引量：1

同被引文献614

1陈鹏,钱徽,朱淼良.一种快速高斯粒子滤波算法[J].华中科技大学学报（自然科学版）,2008,36(S1):291-294. 被引量：9
2吴高巍,陶卿,王珏.基于后验概率的支持向量机[J].计算机研究与发展,2005,42(2):196-202. 被引量：12
3徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
4苏高利,邓芳萍.关于支持向量回归机的模型选择[J].科技通报,2006,22(2):154-158. 被引量：59
5苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：388
6姜远,周志华.基于词频分类器集成的文本分类方法[J].计算机研究与发展,2006,43(10):1681-1687. 被引量：22
7林红,饶云波,李勇.遗传算法在乘务员排班系统中的应用[J].计算机技术与发展,2007,17(1):199-202. 被引量：5
8叶嘉,黄桂敏.一种非结构化P2P的随机有向图拓扑模型[J].计算机应用与软件,2007,24(4):64-66. 被引量：1
9Okuma K, Taleghani A, de Freitas N. A boosted particle filter: multitarget detection and tracking [C] // Proceedings of European Conf on Computer Vision 2004. Prague: Springer-Verlag, 2004: 28-39. 被引量：1
10Cai Yizheng, de Freitas O, Little J J. Robust visual tracking for multiple targets[C]//Proceedings of European Conference on Computer Vision 2006. Graz: Springer-Verlag, 2006: 107-118. 被引量：1

引证文献57

1喻金平,郑杰,朱桂祥.基于多关系网络的社区检测算法[J].系统仿真学报,2015,27(1):147-154. 被引量：1
2孙伟平,向杰,陈加忠,余胜生.基于GPU的粒子滤波并行算法[J].华中科技大学学报（自然科学版）,2011,39(5):63-66. 被引量：11
3赵卫红.海洋中胶体研究的新进展[J].海洋与湖沼,2000,31(2):221-229. 被引量：11
4蒋华,戚玉顺.基于球结构支持向量机的多标签分类的主动学习[J].计算机应用,2012,32(5):1359-1361. 被引量：3
5任梅,詹永照,潘道远,孙佳瑶.基于概率超图的视频事件语义检测[J].计算机应用,2012,32(11):3014-3017. 被引量：1
6蒋华,戚玉顺.基于球结构SVM的多标签分类[J].计算机工程,2013,39(1):294-297. 被引量：6
7范海雄,刘付显,夏璐.基于概率LS-SVM的多标签非均衡样本分类算法[J].解放军理工大学学报（自然科学版）,2013,14(2):169-175.
8李思男,李宁,李战怀.多标签数据挖掘技术:研究综述[J].计算机科学,2013,40(4):14-21. 被引量：32
9张振海,李士宁,李志刚,陈昊.一类基于信息熵的多标签特征选择算法[J].计算机研究与发展,2013,50(6):1177-1184. 被引量：62
10林霄,肖国强,吴松,邱开金.基于随机游走模型的物体识别[J].计算机工程与应用,2013,49(21):145-151.

二级引证文献359

1张翔.基于风险预控的煤矿安全管理分析[J].山西能源学院学报,2023,36(6):56-58. 被引量：3
2李敏,章国豪,陈梓樑,郭志勇,胡晓敏.基于差分进化的多目标粒子群特征选择算法[J].计算机应用研究,2020,37(1):76-79. 被引量：8
3郑雪红,郑爱榕,陈祖峰.厦门海域水体中胶体多糖的醛糖组成[J].海洋与湖沼,2005,36(1):10-17.
4孙小静,张战平,朱广伟,秦伯强.太湖水体中胶体磷含量初探[J].湖泊科学,2006,18(3):231-237. 被引量：10
5陈丁,郑爱榕,刘春兰,陈敏.天然胶体中磷的含量及分布[J].海洋学报,2006,28(3):144-150. 被引量：4
6郑爱榕,陈敏,吕娥,杨俊鸿,程远月.天然胶体对微藻生长的效应[J].海洋与湖沼,2006,37(4):361-369. 被引量：1
7白艳艳,郑敏芳,郑爱榕,陈丁,刘春兰.天然胶体对天然菌群生长的影响[J].厦门大学学报（自然科学版）,2007,46(4):550-554. 被引量：2
8赵卫红,崔鑫,王江涛,季乃云,苗辉.赤潮水体中胶体物质对赤潮异弯藻(Heterosigma akashiwo)和中肋骨条藻(Skeletonema costatum)生长的影响[J].生态学报,2009,29(2):573-580. 被引量：6
9王芳,朱广伟,许海,秦伯强.太湖梅梁湾水体中胶体对铜绿微囊藻生长的促进效应[J].中国环境科学,2009,29(5):538-542. 被引量：7
10马骁轩,冉勇.浅析环境科学中胶体分离的切向超滤技术[J].水资源保护,2009,25(3):57-60. 被引量：2

1叶超,姚竹亭.基于人工鱼群算法和BP神经网络的时间序列预测研究[J].电子世界,2013(19):110-111.
2汤进,黄莉莉,赵海峰,罗斌.使用自适应线性回归的多标签分类算法[J].华南理工大学学报（自然科学版）,2012,40(9):69-74. 被引量：7
3宣荣喜,黄兴.供热网温度跟随控制的算法与实现[J].西安电子科技大学学报,2005,32(4):622-626. 被引量：1
4彭松,商阳.高校信息化应用中“信息孤岛”现象的分析及对策[J].轻工设计,2011(3):69-69.
5南书坡.竞争型神经网络在土壤分类中的应用[J].电脑知识与技术,2013,9(9):5708-5710.
6王建,姚振强,尹明德,朱瑶洁,李康妹.用于距离图像2D扫描线的极速边缘检测器[J].电子学报,2010,38(7):1711-1715. 被引量：6
7刘武安.艺术秩序——谈关于重复的艺术[J].新视觉艺术,2009(3):104-105.
8祝永胜,张铮,邰铭,韩首魁,张丹.基于虚拟化技术构建动态Web服务系统的设计与实现[J].信息工程大学学报,2017,18(1):116-120.
9黄丽莲,高萌.神经元网络自适应时延同步及保密通信应用[J].应用科技,2010,37(9):1-4. 被引量：1

计算机学报

2010年第8期

浏览历史

内容加载中请稍等...

一种基于随机游走模型的多标签分类算法被引量：57

参考文献24

同被引文献614

引证文献57

二级引证文献359

相关作者

相关机构

相关主题

浏览历史

一种基于随机游走模型的多标签分类算法 被引量：57

参考文献24

同被引文献614

引证文献57

二级引证文献359

相关作者

相关机构

相关主题

浏览历史

一种基于随机游走模型的多标签分类算法被引量：57