期刊文献+
共找到285篇文章
< 1 2 15 >
每页显示 20 50 100
一种利用关联规则挖掘的多标记分类算法 被引量:34
1
作者 刘军煜 贾修一 《软件学报》 EI CSCD 北大核心 2017年第11期2865-2878,共14页
多标记学习广泛存在于现实生活中,是当今机器学习领域的研究热点.在多标记学习框架中,每个对象由一个示例构成,但可能同时属于多个类别标记,并且各个标记之间相互关联,所以挖掘多标记之间的关联性对于多标记学习框架具有重要的意义.首... 多标记学习广泛存在于现实生活中,是当今机器学习领域的研究热点.在多标记学习框架中,每个对象由一个示例构成,但可能同时属于多个类别标记,并且各个标记之间相互关联,所以挖掘多标记之间的关联性对于多标记学习框架具有重要的意义.首先对经典的关联规则算法进行改进,提出了基于矩阵分治的频繁项集挖掘算法,并证明了该算法挖掘频繁项集的正确性;进而将该算法应用于多标记学习框架中,分别提出了基于全局关联规则挖掘和局部关联规则挖掘的多标记分类算法;最后对所提出的算法与现有多标记算法进行实验对比,结果表明,算法在5种不同的评价准则下能够取得更好的效果. 展开更多
关键词 多标记学习 关联规则 矩阵分治 频繁项集
下载PDF
Binary relevance for multi-label learning: an overview 被引量:26
2
作者 Min-Ling ZHANG Yu-Kun LI +1 位作者 Xu-Ying LIU Xin GENG 《Frontiers of Computer Science》 SCIE EI CSCD 2018年第2期191-202,共12页
Multi-label learning deals with problems where each example is represented by a single instance while being associated with multiple class labels simultaneously. Binary relevance is arguably the most intuitive solutio... Multi-label learning deals with problems where each example is represented by a single instance while being associated with multiple class labels simultaneously. Binary relevance is arguably the most intuitive solution for learning from multi-label examples. It works by decomposing the multi-label learning task into a number of independent binary learning tasks (one per class label). In view of its potential weakness in ignoring correlations between labels, many correlation-enabling extensions to binary relevance have been proposed in the past decade. In this paper, we aim to review the state of the art of binary relevance from three perspectives. First, basic settings for multi-label learning and binary relevance solutions are briefly summarized. Second, representative strategies to provide binary relevance with label correlation exploitation abilities are discussed. Third, some of our recent studies on binary relevance aimed at issues other than label correlation exploitation are introduced. As a conclusion, we provide suggestions on future research directions. 展开更多
关键词 machine learning multi-label learning binary relevance label correlation class-imbalance relative labeling-importance
原文传递
代价敏感学习方法综述 被引量:28
3
作者 万建武 杨明 《软件学报》 EI CSCD 北大核心 2020年第1期113-136,共24页
分类是机器学习的重要任务之一.传统的分类学习算法追求最低的分类错误率,假设不同类型的错误分类具有相等的损失.然而,在诸如人脸识别门禁系统、软件缺陷预测、多标记学习等应用领域中,不同类型的错误分类所导致的损失差异较大.这要求... 分类是机器学习的重要任务之一.传统的分类学习算法追求最低的分类错误率,假设不同类型的错误分类具有相等的损失.然而,在诸如人脸识别门禁系统、软件缺陷预测、多标记学习等应用领域中,不同类型的错误分类所导致的损失差异较大.这要求学习算法对可能导致高错分损失的样本加以重点关注,使得学习模型的整体错分损失最小.为解决该问题,代价敏感学习方法引起了研究者的极大关注.以代价敏感学习方法的理论基础作为切入点,系统阐述了代价敏感学习的主要模型方法以及代表性的应用领域.最后,讨论并展望了未来可能的研究趋势. 展开更多
关键词 代价敏感 损失 分类 人脸识别 软件缺陷预测 多标记学习
下载PDF
多源适应多标签分类框架 被引量:24
4
作者 姚哲 陶剑文 《计算机工程与应用》 CSCD 北大核心 2017年第7期88-96,170,共10页
多源适应学习是一种旨在提升目标学习性能的有效机器学习方法。针对多标签视觉分类问题,基于现有的研究进展,研究提出一种新颖的联合特征选择和共享特征子空间学习的多源适应多标签分类框架,在现有的图Laplacian正则化半监督学习范式中... 多源适应学习是一种旨在提升目标学习性能的有效机器学习方法。针对多标签视觉分类问题,基于现有的研究进展,研究提出一种新颖的联合特征选择和共享特征子空间学习的多源适应多标签分类框架,在现有的图Laplacian正则化半监督学习范式中充分考虑目标视觉特征的优化处理,多标签相关信息在共享特征子空间的嵌入,以及多个相关领域的判别信息桥接利用等多个方面,并将其融为一个统一的学习模型,理论证明了其局部最优解只需通过求解一个广义特征分解问题便可分别获得,并给出了算法实现及其收敛性定理。在两个实际的多标签视觉数据分类上分别进行深入实验分析,证实了所提框架的鲁棒有效性和优于现有相关方法的分类性能。 展开更多
关键词 特征选择 共享特征子空间 多源适应学习 多标签学习
下载PDF
自动图像标注技术研究进展 被引量:21
5
作者 鲍泓 徐光美 +1 位作者 冯松鹤 须德 《计算机科学》 CSCD 北大核心 2011年第7期35-40,共6页
近年来,自动图像标注(Automatic Image Annotation,AIA)技术已经成为图像语义理解研究领域的热点。其基本思想是利用已标注图像集或其他可获得的信息自动学习语义概念空间与视觉特征空间的潜在关联或者映射关系,来预测未知图像的标注。... 近年来,自动图像标注(Automatic Image Annotation,AIA)技术已经成为图像语义理解研究领域的热点。其基本思想是利用已标注图像集或其他可获得的信息自动学习语义概念空间与视觉特征空间的潜在关联或者映射关系,来预测未知图像的标注。随着机器学习理论的不断发展,包括相关模型、分类器模型等不同的学习模型已经被广泛地应用于自动图像标注研究领域。现有的自动图像标注算法可以大致分为基于分类的标注算法、基于概率关联模型的标注算法以及基于图学习的标注算法等三大类。首先根据自动图像标注算法的特征提取及表示机制不同,将现有算法划分为基于全局特征和基于区域划分的自动图像标注方法。其次,在基于区域划分的自动图像标注算法中,按照学习算法的不同,将其划分为基于分类的标注方法、基于概率关联模型的标注方法以及基于图学习的标注方法,并分别介绍各类别中具有代表性的标注算法及其优缺点。然后给出了自动图像标注最新的研究进展,最后探讨自动图像标注的进一步研究方向。 展开更多
关键词 自动图像标注 多示例学习 多标记学习 图学习 概率建模
下载PDF
多标记分类和标记相关性的联合学习 被引量:21
6
作者 何志芬 杨明 刘会东 《软件学报》 EI CSCD 北大核心 2014年第9期1967-1981,共15页
提出了多标记分类和标记相关性的联合学习(JMLLC),在JMLLC中,构建了基于类别标记变量的有向条件依赖网络,这样不仅使得标记分类器之间可以联合学习,从而增强各个标记分类器的学习效果,而且标记分类器和标记相关性可以联合学习,从而使得... 提出了多标记分类和标记相关性的联合学习(JMLLC),在JMLLC中,构建了基于类别标记变量的有向条件依赖网络,这样不仅使得标记分类器之间可以联合学习,从而增强各个标记分类器的学习效果,而且标记分类器和标记相关性可以联合学习,从而使得学习得到的标记相关性更为准确.通过采用两种不同的损失函数:logistic回归和最小二乘,分别提出了JMLLC-LR(JMLLC with logistic regression)和JMLLC-LS(JMLLC with least squares),并都拓展到再生核希尔伯特空间中.最后采用交替求解的方法求解JMLLC-LR和JMLLC-LS.在20个基准数据集上基于5种不同的评价准则的实验结果表明,JMLLC优于已提出的多标记学习算法. 展开更多
关键词 多标记学习 多标记分类 标记相关性 条件依赖网络 再生核希尔伯特空间 交替求解
下载PDF
基于互信息的粒化特征加权多标签学习k近邻算法 被引量:22
7
作者 李峰 苗夺谦 +1 位作者 张志飞 张维 《计算机研究与发展》 EI CSCD 北大核心 2017年第5期1024-1035,共12页
传统基于k近邻的多标签学习算法,在寻找近邻度量样本间的距离时,对所有特征给予同等的重要度.这些算法大多采用分解策略,对单个标签独立预测,忽略了标签间的相关性.多标签学习算法的分类效果跟输入的特征有很大的关系,不同的特征含有的... 传统基于k近邻的多标签学习算法,在寻找近邻度量样本间的距离时,对所有特征给予同等的重要度.这些算法大多采用分解策略,对单个标签独立预测,忽略了标签间的相关性.多标签学习算法的分类效果跟输入的特征有很大的关系,不同的特征含有的标签分类信息不同,故不同特征的重要度也不同.互信息是常用的度量2个变量间关联度的重要方法之一,能够有效度量特征含有标签分类的知识量.因此,根据特征含有标签分类知识量的大小,赋予相应的权重系数,提出一种基于互信息的粒化特征加权多标签学习k近邻算法(granular feature weighted k-nearest neighbors algorithm for multi-label learning,GFWML-kNN),该算法将标签空间粒化成多个标签粒,对每个标签粒计算特征的权重系数,以解决上述问题和标签组合爆炸问题.在计算特征权重时,考虑到了标签间可能的组合,把标签间的相关性融合进特征的权重系数.实验表明:相较于若干经典的多标签学习算法,所提算法GFWML-kNN整体上能取得较好的效果. 展开更多
关键词 互信息 特征权重 粒化 多标签学习 K-近邻
下载PDF
多标记学习研究综述 被引量:21
8
作者 李志欣 卓亚琦 +1 位作者 张灿龙 周生明 《计算机应用研究》 CSCD 北大核心 2014年第6期1601-1605,共5页
多标记学习是针对现实世界中普遍存在的多义性对象而提出的一种学习框架。对多标记学习的研究现状和进展作了综合论述,给出多标记学习的定义和求解策略,将当前多标记学习算法分为问题转换和算法改进两大类,并重点阐述各类算法的学习原理... 多标记学习是针对现实世界中普遍存在的多义性对象而提出的一种学习框架。对多标记学习的研究现状和进展作了综合论述,给出多标记学习的定义和求解策略,将当前多标记学习算法分为问题转换和算法改进两大类,并重点阐述各类算法的学习原理;探讨了多标记学习的各种评估措施的定义及其作用,并总结了在多标记学习研究背景下若干有价值的研究方向。 展开更多
关键词 多标记学习 机器学习 问题转换 算法改进 评估措施
下载PDF
基于信息粒化的多标记特征选择算法 被引量:20
9
作者 王晨曦 林耀进 +2 位作者 唐莉 傅为 林培榕 《模式识别与人工智能》 EI CSCD 北大核心 2018年第2期123-131,共9页
特征选择旨在从原始特征空间中选择一组规模较小的特征子集,在分类学习任务中提供与原集合近似或更好的性能.文中提出基于信息粒化的多标记特征选择算法,融合标记权重与样本平均间隔,将改进的邻域信息熵应用到特征选择过程中.在6组数据... 特征选择旨在从原始特征空间中选择一组规模较小的特征子集,在分类学习任务中提供与原集合近似或更好的性能.文中提出基于信息粒化的多标记特征选择算法,融合标记权重与样本平均间隔,将改进的邻域信息熵应用到特征选择过程中.在6组数据集以及5个评价指标上的实验表明文中算法在分类上的有效性. 展开更多
关键词 特征选择 信息粒化 标记权重 多标记学习
下载PDF
基于随机森林和多标记学习算法的慢性胃炎实证特征选择和证候分类识别研究 被引量:19
10
作者 徐玮斐 顾巍杰 +3 位作者 刘国萍 刘晏 颜建军 钟涛 《中国中医药信息杂志》 CAS CSCD 2016年第8期18-23,共6页
目的对慢性胃炎实证证候的特征症状进行选择,并建立证候模型,为慢性胃炎证候量化诊断的建立提供方法学参考。方法运用慢性胃炎中医问诊规范化量表采集临床症状和体征,并运用机器学习领域新提出的随机森林和多标记学习算法对慢性胃炎的... 目的对慢性胃炎实证证候的特征症状进行选择,并建立证候模型,为慢性胃炎证候量化诊断的建立提供方法学参考。方法运用慢性胃炎中医问诊规范化量表采集临床症状和体征,并运用机器学习领域新提出的随机森林和多标记学习算法对慢性胃炎的实证症状进行选择和模型构建。结果运用随机森林和信息增益算法,结合多标记学习算法对证候分别建模,随机森林算法挑选出15个特征症状,信息增益方法挑选出20个特征症状,二者的模型最高准确率分别为83%、82%。通过评价,随机森林算法选出的特征症状更加精简,提高了诊断模型的识别率。结论随机森林结合多标记学习算法可实现慢性胃炎实证证候特征症状的选择,同时还可解决几个证候相兼问题,弥补传统学习算法的不足。 展开更多
关键词 随机森林算法 多标记学习算法 慢性胃炎 特征选择 证候
下载PDF
一种基于正则化的半监督多标记学习方法 被引量:18
11
作者 李宇峰 黄圣君 周志华 《计算机研究与发展》 EI CSCD 北大核心 2012年第6期1272-1278,共7页
多标记学习主要用于解决单个样本同时属于多个类别的问题.传统的多标记学习通常假设训练数据集含有大量有标记的训练样本.然而在许多实际问题中,大量训练样本中通常只有少量有标记的训练样本.为了更好地利用丰富的未标记训练样本以提高... 多标记学习主要用于解决单个样本同时属于多个类别的问题.传统的多标记学习通常假设训练数据集含有大量有标记的训练样本.然而在许多实际问题中,大量训练样本中通常只有少量有标记的训练样本.为了更好地利用丰富的未标记训练样本以提高分类性能,提出了一种基于正则化的归纳式半监督多标记学习方法——MASS.具体而言,MASS首先在最小化经验风险的基础上,引入两种正则项分别用于约束分类器的复杂度及要求相似样本拥有相似结构化多标记输出,然后通过交替优化技术给出快速解法.在网页分类和基因功能分析问题上的实验结果验证了MASS方法的有效性. 展开更多
关键词 机器学习 多标记学习 半监督学习 网页分类 基因功能分析
下载PDF
基于专家特征的条件互信息多标记特征选择算法 被引量:17
12
作者 程玉胜 宋帆 +1 位作者 王一宾 钱坤 《计算机应用》 CSCD 北大核心 2020年第2期503-509,共7页
特征选择对于分类器的分类精度和泛化性能起重要作用。目前的多标记特征选择算法主要利用最大相关性最小冗余性准则在全部特征集中进行特征选择,没有考虑专家特征,因此多标记特征选择算法的运行时间较长、复杂度较高。实际上,在现实生... 特征选择对于分类器的分类精度和泛化性能起重要作用。目前的多标记特征选择算法主要利用最大相关性最小冗余性准则在全部特征集中进行特征选择,没有考虑专家特征,因此多标记特征选择算法的运行时间较长、复杂度较高。实际上,在现实生活中专家依据几个或者多个关键特征就能够直接决定整体的预测方向。如果提取关注这些信息,必将减少特征选择的计算时间,甚至提升分类器性能。基于此,提出一种基于专家特征的条件互信息多标记特征选择算法。首先将专家特征与剩余的特征相联合,再利用条件互信息得出一个与标记集合相关性由强到弱的特征序列,最后通过划分子空间去除冗余性较大的特征。该算法在7个多标记数据集上进行了实验对比,结果表明该算法较其他特征选择算法有一定优势,统计假设检验与稳定性分析进一步证明了所提出算法的有效性和合理性。 展开更多
关键词 特征选择 专家特征 条件互信息 多标记学习 局部子空间
下载PDF
基于共享背景主题的Labeled LDA模型 被引量:17
13
作者 江雨燕 李平 王清 《电子学报》 EI CAS CSCD 北大核心 2013年第9期1794-1799,共6页
隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labe... 隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labeled LDA模型(Shared Background Topics Labeled LDA,SBTL-LDA).在SBTL-LDA模型中每个标记除了存在若干个独享的局部主题外,还存在若干个共享的背景(Background)主题,这样可以有效分析不同标记所含主题之间的依赖关系,而文档标记被映射为局部主题和共享主题的组合,因此SBTL-LDA模型可以有效提升文档标记判别的准确性.同时SBTL-LDA模型还可以看成是一种半监督聚类模型,在对文档进行聚类分析的过程中模型可以有效的利用文档的标记信息提升文档聚类效果.实验证明SBTL-LDA模型能够有效解决PLDA模型中主题之间的相似性和依赖关系,具有良好的多标记判别能力,并且具有优于LDA、PLDA模型的文档聚类效果. 展开更多
关键词 隐藏狄利克雷分配 文本分析 多标记学习 半监督聚类
下载PDF
基于标签特征和相关性的多标签分类算法 被引量:15
14
作者 李锋 杨有龙 《计算机工程与应用》 CSCD 北大核心 2019年第4期48-55,共8页
针对标签特有特征和标签相关性的有效利用,提出了一种新的多标签算法LSFLC,它可以有效地集成标签特有特征和标签相关性。首先,对于每个标签,通过重采样技术生成新的正类实例以扩充其正类实例的数目;其次,通过特征映射函数将原始特征空... 针对标签特有特征和标签相关性的有效利用,提出了一种新的多标签算法LSFLC,它可以有效地集成标签特有特征和标签相关性。首先,对于每个标签,通过重采样技术生成新的正类实例以扩充其正类实例的数目;其次,通过特征映射函数将原始特征空间转换为特定的特征空间,得到每个标签的标签特征集;然后,对于每个标签,找到与其最相关标签,通过复制该标签的正类实例来扩大标签特征集,这不仅丰富了标签的信息,而且在一定程度上改善了类不平衡的问题;最后,对于不同的数据集进行实验分析,实验结果表明该算法的分类效果更好。 展开更多
关键词 多标签学习 局部标签相关性 标签特有特征 相关实例补充
下载PDF
标记分布学习与标记增强 被引量:13
15
作者 耿新 徐宁 《中国科学:信息科学》 CSCD 北大核心 2018年第5期521-530,共10页
本文主要介绍了标记分布学习和标记增强的相关概念及算法.标记分布学习是一种新型机器学习范式,传统的单标记和多标记学习都可以看做是该范式的特例.标记分布学习将不同标记对示例的重要程度用标记分布来显式刻画,已经在多个应用领域中... 本文主要介绍了标记分布学习和标记增强的相关概念及算法.标记分布学习是一种新型机器学习范式,传统的单标记和多标记学习都可以看做是该范式的特例.标记分布学习将不同标记对示例的重要程度用标记分布来显式刻画,已经在多个应用领域中取得很好的效果.然而,现有的多数数据集中却仅具有简单的逻辑标记而非完整的标记分布,因此无法直接应用标记分布学习.为解决这一问题,可以通过挖掘训练集中蕴含的标记重要性信息,恢复出每个示例的标记分布.我们将原始逻辑标记提升为标记分布的过程定义为标记增强.本文给出了标记分布学习和标记增强的形式化定义,介绍了典型标记分布学习和标记增强算法,并对这些算法进行了分析讨论. 展开更多
关键词 标记分布 标记分布学习 标记增强 多标记学习 标记多义性
原文传递
一种基于邻域粗糙集的多标记专属特征选择方法 被引量:15
16
作者 孙林 潘俊方 +2 位作者 张霄雨 王伟 徐久成 《计算机科学》 CSCD 北大核心 2018年第1期173-178,共6页
在多标记学习中,数据降维是一项重要且具有挑战性的任务,而特征选择又是一种高效的数据降维技术。在邻域粗糙集理论的基础上提出一种多标记专属特征选择方法,该方法从理论上确保了所得到的专属特征与相应标记具有较强的相关性,进而改善... 在多标记学习中,数据降维是一项重要且具有挑战性的任务,而特征选择又是一种高效的数据降维技术。在邻域粗糙集理论的基础上提出一种多标记专属特征选择方法,该方法从理论上确保了所得到的专属特征与相应标记具有较强的相关性,进而改善了约简效果。首先,该方法运用粗糙集理论的约简算法来减少冗余属性,在保持分类能力不变的情况下获得标记的专属特征;然后,在邻域精确度和邻域粗糙度概念的基础上,重新定义了基于邻域粗糙集的依赖度与重要度的计算方法,探讨了该模型的相关性质;最后,构建了一种基于邻域粗糙集的多标记专属特征选择模型,实现了多标记分类任务的特征选择算法。在多个公开的数据集上进行仿真实验,结果表明了该算法是有效的。 展开更多
关键词 多标记学习 邻域粗糙集 专属特征 特征选择
下载PDF
基于多标记与半监督学习的入侵检测方法研究 被引量:15
17
作者 钱燕燕 李永忠 余西亚 《计算机科学》 CSCD 北大核心 2015年第2期134-136,146,共4页
机器学习所关注的问题是系统如何随着经验积累自动提高分类性能,这与入侵检测通过对外界入侵进行自我学习来提高其检测率和降低误报率是一致的。因此把机器学习的理论和方法引入到入侵检测中已成为一种有效方案。文中结合多标记与半监... 机器学习所关注的问题是系统如何随着经验积累自动提高分类性能,这与入侵检测通过对外界入侵进行自我学习来提高其检测率和降低误报率是一致的。因此把机器学习的理论和方法引入到入侵检测中已成为一种有效方案。文中结合多标记与半监督学习理论,将ML-KNN算法应用于入侵检测系统。在KDD CUP99数据集上的仿真结果表明,该方法在入侵检测中能获得高检测率和低误报率。 展开更多
关键词 多标记学习 ML-KNN算法 半监督学习 入侵检测
下载PDF
多标记学习的嵌入式特征选择 被引量:12
18
作者 葛雷 李国正 尤鸣宇 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第5期671-676,共6页
维数约减是数据挖掘领域的关键技术.传统的降维方法主要解决单标记学习问题.由于多标记学习问题的复杂性,多标记降维方法很少.直接应用未监督的降维方法到多标记学习中,忽略了类标信息.而通过分解多标记问题为单标记问题,应用现有的有... 维数约减是数据挖掘领域的关键技术.传统的降维方法主要解决单标记学习问题.由于多标记学习问题的复杂性,多标记降维方法很少.直接应用未监督的降维方法到多标记学习中,忽略了类标信息.而通过分解多标记问题为单标记问题,应用现有的有监督降维方法到多标记学习中,忽略了类标间的关系.现有的多标记有监督的降维方法是基于依赖最大化的维数约简(multi-label dimensionalityreduction via depen dence maximization,MDDM),它是一种特征抽取的方法.目前还没有多标记的特征选择方法.因为在多标记学习中如何评估特征,是一个很有挑战性的问题.本文提出一个嵌入式的特征选择方法MEFS(multi-label embedded feature selection),其中采用预报风险准则作为特征的评价准则.在公开评测的yahoo网页分类数据集上进行了两个实验:(1)分析多标记学习的性能指标对特征评估的影响;(2)比较MEFS与MDDM,PCA(主成份分析),LPP(局部保留投影)的降维效果,实验显示MEFS的性能优于新近提出的MDDM等一些流行的多标记降维方法. 展开更多
关键词 多标记学习 特征选择 预报风险准则 K近邻 主成分分析
下载PDF
基于邻域粗糙集和Relief的弱标记特征选择方法 被引量:13
19
作者 孙林 黄苗苗 徐久成 《计算机科学》 CSCD 北大核心 2022年第4期152-160,共9页
在多标记学习与分类中,现有邻域粗糙集特征选择算法若将样本的分类间隔作为邻域半径,则会出现分类间隔过大导致分类无意义、样本距离过大容易造成异类样本和同类样本失效,以及无法处理弱标记数据等情况。为解决这些问题,提出一种基于多... 在多标记学习与分类中,现有邻域粗糙集特征选择算法若将样本的分类间隔作为邻域半径,则会出现分类间隔过大导致分类无意义、样本距离过大容易造成异类样本和同类样本失效,以及无法处理弱标记数据等情况。为解决这些问题,提出一种基于多标记邻域粗糙集和多标记Relief的弱标记特征选择方法。首先,引入异类样本数和同类样本数来改进分类间隔,在此基础上定义邻域半径,构造新的邻域近似精度与多标记邻域粗糙集模型,并有效度量边界域引起的集合不确定性。其次,利用迭代更新权重公式填补大部分缺失标记信息,将邻域近似精度与互信息相结合,以构造新的标记相关性,填补剩余的缺失标记信息。然后,使用异类样本数和同类样本数,以构造新的标记权重和特征权重计算公式,进而提出多标记Relief模型,并将其应用于多标记特征选择。最后,结合多标记邻域粗糙集模型和多标记Relief算法,设计一种新的弱标记特征选择算法,以处理带有缺失标记的高维数据,并有效地提升多标记分类性能。在11个公共多标记数据集上进行仿真实验,结果验证了所提出的弱标记特征选择算法的有效性。 展开更多
关键词 多标记学习 特征选择 邻域粗糙集 RELIEF 缺失标记
下载PDF
基于多特征融合的多尺度服装图像精准化检索 被引量:13
20
作者 王志伟 普园媛 +3 位作者 王鑫 赵征鹏 徐丹 钱文华 《计算机学报》 EI CSCD 北大核心 2020年第4期740-754,共15页
为了充分挖掘服装图像从全局到局部的多级尺度特征,同时发挥深度学习与传统特征各自在提取服装图像深层语义特征和底层特征上的优势,从而实现聚焦服装本身与服装全面特征的提取,提出基于多特征融合的多尺度服装图像精准化检索算法.首先... 为了充分挖掘服装图像从全局到局部的多级尺度特征,同时发挥深度学习与传统特征各自在提取服装图像深层语义特征和底层特征上的优势,从而实现聚焦服装本身与服装全面特征的提取,提出基于多特征融合的多尺度服装图像精准化检索算法.首先,为了不同类型特征的有效融合,本文设计了基于特征相似性的融合公式FSF(Feature Similarity Fusion).其次,基于YOLOv3模型同时提取服装全局、主体和款式部件区域构成三级尺度图像,极大减弱背景等干扰因素的影响,聚焦服装本身.之后全局、主体和款式部件三级尺度图像分别送入三路卷积神经网络(Convolutional Neural Network,CNN)进行特征提取,每路CNN均依次进行过服装款式属性分类训练和度量学习训练,分别提高了CNN对服装款式属性特征的提取能力,以及对不同服装图像特征的辨识能力.提取的三路CNN特征使用FSF公式进行特征融合,得到的多尺度CNN融合特征则包含了服装图像从全局到主体,再到款式部件的全面特征.然后,加入款式属性预测优化特征间欧氏距离,同时抑制语义漂移,得到初步检索结果.最后,由于底层特征可以很好的对CNN提取的深层语义特征进行补充,故引入传统特征对初步检索结果的纹理、颜色等特征进行约束,通过FSF公式将多尺度CNN融合特征与传统特征相结合,进一步优化初步检索结果的排序.实验结果表明,该算法可以实现对服装从全局到款式部件区域多尺度CNN特征的充分提取,同时结合传统特征有效优化排序结果,提升检索准确率.在返回Top-20的实验中,相比于FashionNet模型准确率提升了16.4%." 展开更多
关键词 服装图像检索 多尺度 多标签学习 度量学习 特征相似性融合
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部