基于相似度矩阵学习和矩阵校正的无监督多视角特征选择被引量：1

Unsupervised Multi-view Feature Selection Based on Similarity Matrix Learning and Matrix Alignment

下载PDF

导出

摘要多视角特征选择通过融合多个视角的信息获取具有代表性的特征子集,来提高分类、聚类等学习任务的效率。然而,描述对象的特征繁杂多样且相互关联,单一地从原始特征中选择特征子空间可以简单地解决维度问题,但无法有效获取数据内部存在的结构信息和特征关联信息,且固定使用相似度矩阵和投影矩阵易损失视角间的相关性。针对以上问题,提出了基于相似度矩阵学习和矩阵校正的无监督多视角特征选择(SMLMA)算法。该算法首先构造所有视角的相似度矩阵,通过流形学习得到一致相似度矩阵以及投影矩阵,最大程度地发现和保留多视角数据的结构信息;其次采用矩阵校正的方法,最大化相似度矩阵和核矩阵之间的相关性,合理利用不同视角之间的关联性,减少特征子集的信息冗余;最后,采用Armijo搜索方法快速得到收敛结果。在4个实验数据集Caltech-7,NUS-WIDE-OBJ,Toy Animal和MSRC-v1上的实验结果表明,相比单视角特征选择和部分多视角特征选择方法,所提算法在聚类任务上的准确率平均提高了约7.54%。其较好地保留了数据的结构信息和多视角之间特征的相关性,捕获了更多高质量的特征。 Multi-view feature selection improves the efficiency of classification,clustering and other learning tasks by fusing information from multiple views to obtain representative feature subsets.However,the features of different views that describe objects are complex and interrelated.Simply searching subset of features from original space partly solves the problem of dimension,but it barely obtains the latent structural information and association information among features.Besides,using fixed similarity matrix and projection matrix is prone to lose the correlation between different views.To solve these problems,an unsupervised multi-view feature selection algorithm based on similarity matrix learning and matrix alignment(SMLMA)is proposed.Firstly,the similarity matrix based on all views is constructed,and the consistent similarity matrix and projection matrix are obtained by mani-fold learning,to explore and reserve the structural information of data to the greatest extent.Then,the matrix alignment method is used to maximize the correlation between the similarity matrix and the kernel matrix,for the purpose of using the correlation between different views and reducing the information redundancy of feature subset.Finally,the Armijo searching method is introduced to obtain the convergence result quickly.Experimental results on four datasets(Caltech-7,NUS-WIDE-OBJ,Toy Animal and MSRC-v1)show that,compared with single view feature selection and some multi-view feature selection methods,the accuracy of SMLMA is averagely improved by about 7.54%.The proposed algorithm well retains the structural information of data and the correlation between multi-view features,and captures more high-quality features.

作者李斌万源 LI Bin;WAN Yuan(School of Science,Wuhan University of Technology,Wuhan 430070,China)

机构地区武汉理工大学理学院

出处《计算机科学》 CSCD 北大核心 2022年第8期86-96,共11页 Computer Science

基金中央高校基本科研业务费专项资金(2021III030JC)。

关键词多视角无监督特征选择相似度矩阵矩阵校正 Multi-view Unsupervised Feature selection Similarity matrix Matrix alignment

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1蔺广逢,朱虹,范彩霞,张二虎,罗磊.基于Grassmann流形的多聚类特征选择[J].计算机工程,2012,38(16):178-181. 被引量：3
2黄飞,吴泽忠.基于Armijo搜索步长的几种共轭梯度法的分析对比[J].成都信息工程大学学报,2019,34(2):209-215. 被引量：2
3叶小艳,叶小莺,周化.基于影响力社区检测与蚁群算法的特征选择[J].计算机工程与设计,2019,40(9):2684-2691. 被引量：4

二级参考文献24

1Boutemedjet S, Bouguila N, Ziou D. A Hybrid Feature Extraction Selection Approach for High-dimensional Non-gaussian Data Clustering[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(8): 1429-1443. 被引量：1
2Cai Deng, Zhang Chiyuan, He Xiaofei. Unsupervised Feature Selection for Multi-cluster Data[C]//Proceedings of the 16th ACM SIGKDD'I 0. Washington D. C., USA: ACM Press, 2010. 被引量：1
3Sotoca J M, Pla F. Supervised Feature Selection by Clustering Using Conditional Mutual Information-based Distances[J]. Pattern Recognition, 2010, 43(6): 2068-2081. 被引量：1
4Kabir M, Islam M, Murase K. A New Wrapper Feature Selection Approach Using Neural Network[J]. Neurocomputing, 2010,73(16-18): 3273-3283. 被引量：1
5Sun Dan, Zhang Daoqiang. Bagging Constraint Score for Feature Selection with Pairwise constraints[J]. Pattern Recognition, 2010, 43(6): 2106-2118. 被引量：1
6Zhao Zheng, Liu Huan. Spectral Feature Selection for Supervised and Unsupervised Learning[C]//Proceedings of the 24th Annual International Conference on Machine Learning. Corvallis, USA: [s. n.], 2007. 被引量：1
7Chiang L H, Pell R J. Genetic Algorithms Combined with Dis- criminant Analysis for Key Variable Identification[J]. Journal of Process Control, 2004, 14(2): 143-155. 被引量：1
8Hsu W H. Genetic Wrappers for Feature Selection in Decision Tree Induction and Variable Ordering in Bayesian Network Structure Learning[J]. Information Sciences, 2004, 163(1-3): 103-122. 被引量：1
9He Xiaofei, Cai Deng, Niyogi P. Laplacian Score for Feature Selection[J]. Advances in Neural Information Processing Systems, 2005, 18: 507-514. 被引量：1
10Lui Y M, Ross B J, Kirby M. Action Classification on Product Manifolds[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. San Francisco, USA: IEEE Press, 2010. 被引量：1

共引文献6

1李淑芳,曾宪华,冯萧.Grassmann流形上半监督特征映射算法及其视频目标识别[J].重庆邮电大学学报（自然科学版）,2014,26(2):265-270. 被引量：2
2高德平.考虑样本数据重复性的通信信息冗余数据检测算法[J].微型电脑应用,2021,37(6):205-208. 被引量：2
3李菊雯,吴泽忠.基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究[J].成都信息工程大学学报,2021,36(5):558-563. 被引量：1
4宫建成,韩涛,杨小强,刘武强,周付明.采用滑动平均多元多尺度色散熵的液压泵故障诊断方法[J].陆军工程大学学报,2023,2(1):45-54. 被引量：2
5付立东,郭亚鑫,宋进福.基于优化蚁群和标签传播的复杂网络社区检测[J].计算机工程与设计,2023,44(5):1320-1327.
6郭松,冯璟,朱聪,毛玉龙,宋佼佼.电力物资采购数据特征提取方法研究[J].信息技术,2023,47(6):134-138.

同被引文献6

1刘灯明,荆俊峰,刘凯,房志奇.基于改进蚁群算法的云计算资源分配策略研究[J].电子技术应用,2022,48(5):104-109. 被引量：14
2王朋飞,杨光辉,冯豆,曲鸿春,李自愿,姚辉昌.基于B/S架构的监控信息点表自动生成系统研究[J].电工技术,2022(18):129-132. 被引量：3
3姚志强,常乃超,窦仁晖,倪益民,徐歆,任辉.适应集控模式的主厂站数据流优化[J].电网技术,2022,46(10):4113-4121. 被引量：5
4杨华,林先堪,廖柏程.人工智能与大数据在变电领域的实践与运用[J].设备管理与维修,2023(4):128-130. 被引量：4
5杨振宇,牛天洋,吕敏.混合存储模式下MapReduce作业调度[J].计算机系统应用,2023,32(3):70-85. 被引量：3
6田晓航,霍鑫,周典乐,赵辉.基于蚁群信息素辅助的Q学习路径规划算法[J].控制与决策,2023,38(12):3345-3353. 被引量：6

引证文献1

1齐炳新,李智玲,高健,王佳桢,刘杰.基于一种集控站监控信息预测和优化模型研究与分析[J].电子技术应用,2024,50(8):81-85.

1潘振君,梁成,张化祥.基于一致图学习的鲁棒多视图子空间聚类[J].计算机应用,2021,41(12):3438-3446. 被引量：1
2吕涛,倪丽,陈川,孙洋洋,赵培微,吴娟,张嘉盛,司徒伟基.基于综合抗性基因数据库研究介导幽门螺杆菌对克拉霉素和左氧氟沙星耐药的易感基因[J].中华消化杂志,2022,42(2):103-110. 被引量：3
3杨戈,邹武星.基于深度学习的视频行为分类方法综述[J].电子技术应用,2022,48(7):1-7. 被引量：4
4谢新林,尹东旭,续欣莹,刘晓芳,罗臣彦,谢刚.基于图像级标签的弱监督图像语义分割综述[J].太原理工大学学报,2021,52(6):894-906. 被引量：3
5陈方遒,景云,郭思冶.基于旅客出行选择特征的高速铁路浮动定价策略研究[J].铁道学报,2022,44(6):11-17. 被引量：5
6邢倩,谷小磊,朱海涛,李晓婷,崔湧,孙应实.CT影像组学预测结直肠癌肝转移术后患者1年内无进展生存期[J].中国医学影像技术,2022,38(7):1035-1040. 被引量：8
7杨莉莉.提供帮助[J].英语画刊（高级）,2022(8):8-8.
8黄燕燕,刘冬梅,邝嘉华,周钦育,陈宇瀚,高璇,塔尼娅,周杨.植物乳杆菌DMDL 9010降解亚硝酸盐特性及其相关基因挖掘[J].现代食品科技,2021,37(11):14-24. 被引量：7
9谢晓峰,卢德辉,邵泉,宋琢.基于OpenGL的危大工程三维模型引擎研发及应用[J].广州建筑,2022,50(3):75-80. 被引量：2
10龙建武,栗童,朱江洲,宋鑫磊,石美凤.基于超像素和随机游走的交互式分割算法[J].计算机应用研究,2022,39(6):1891-1896. 被引量：2

计算机科学

2022年第8期

浏览历史

内容加载中请稍等...

基于相似度矩阵学习和矩阵校正的无监督多视角特征选择被引量：1

参考文献3

二级参考文献24

共引文献6

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于相似度矩阵学习和矩阵校正的无监督多视角特征选择 被引量：1

参考文献3

二级参考文献24

共引文献6

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于相似度矩阵学习和矩阵校正的无监督多视角特征选择被引量：1