期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
Constrained clustering with weak label prior
1
作者 Jing ZHANG Ruidong FAN +2 位作者 Hong TAO Jiacheng JIANG Chenping HOU 《Frontiers of Computer Science》 SCIE EI CSCD 2024年第3期117-132,共16页
Clustering is widely exploited in data mining.It has been proved that embedding weak label prior into clustering is effective to promote its performance.Previous researches mainly focus on only one type of prior.Howev... Clustering is widely exploited in data mining.It has been proved that embedding weak label prior into clustering is effective to promote its performance.Previous researches mainly focus on only one type of prior.However,in many real scenarios,two kinds of weak label prior information,e.g.,pairwise constraints and cluster ratio,are easily obtained or already available.How to incorporate them to improve clustering performance is important but rarely studied.We propose a novel constrained Clustering with Weak Label Prior method(CWLP),which is an integrated framework.Within the unified spectral clustering model,the pairwise constraints are employed as a regularizer in spectral embedding and label proportion is added as a constraint in spectral rotation.To approximate a variant of the embedding matrix more precisely,we replace a cluster indicator matrix with its scaled version.Instead of fixing an initial similarity matrix,we propose a new similarity matrix that is more suitable for deriving clustering results.Except for the theoretical convergence and computational complexity analyses,we validate the effectiveness of CWLP through several benchmark datasets,together with its ability to discriminate suspected breast cancer patients from healthy controls.The experimental evaluation illustrates the superiority of our proposed approach. 展开更多
关键词 CLUSTERING weak label prior cluster ratio pairwise constraints
原文传递
弱标签环境下基于语义邻域学习的图像标注 被引量:4
2
作者 田枫 沈旭昆 《计算机研究与发展》 EI CSCD 北大核心 2014年第8期1821-1832,共12页
图像语义自动标注是实现图像语义检索与管理的关键,是具有挑战性的研究课题.传统的图像标注方法需要具有完整、准确标签的数据集才能取得较好的标注性能.然而,在现实应用中获得数据的标签往往是不准确、不完整的,并且标签分布不均衡.对... 图像语义自动标注是实现图像语义检索与管理的关键,是具有挑战性的研究课题.传统的图像标注方法需要具有完整、准确标签的数据集才能取得较好的标注性能.然而,在现实应用中获得数据的标签往往是不准确、不完整的,并且标签分布不均衡.对于Web图像和社会化图像尤其如此.为了更好地利用这些弱标签样本,提出了一种基于语义邻域学习的图像自动标注方法(semantic neighborhood learning from weakly labeled image,SNLWL).首先在邻域标签损失误差最小化意义下,填充训练集样本标签.通过递进式的邻域选择过程,保证建立的语义一致邻域内样本具有全局相似性、部分相关性和语义一致性,并且语义标签分布平衡.在邻域标签重构误差最小化意义下进行标签预测,降低噪声标签对性能的影响.多个数据集上的实验结果表明,与已知的具有较好标注效果的方法相比,此方法更适用于处理弱标签数据集,标准评测集上的测试也表明了此方法的有效性. 展开更多
关键词 图像标注 自动标注 弱标签 语义邻域 邻域学习
下载PDF
弱标签环境下基于多尺度注意力融合的声音识别检测 被引量:4
3
作者 郑伟哲 仇鹏 韦娟 《计算机科学》 CSCD 北大核心 2020年第5期120-123,共4页
目前大多数声音识别检测的研究都是基于强标签数据集的,但在真实环境的声音识别与检测任务中,音频标签不完整并且含有大量噪声,使得获取强标签音频数据比较困难,进而影响对声音的准确识别与检测。为此,在卷积循环神经网络模型的基础上,... 目前大多数声音识别检测的研究都是基于强标签数据集的,但在真实环境的声音识别与检测任务中,音频标签不完整并且含有大量噪声,使得获取强标签音频数据比较困难,进而影响对声音的准确识别与检测。为此,在卷积循环神经网络模型的基础上,提出了一种多尺度注意力融合机制。该机制使用注意力门控单元,在降低声音时频图特征中噪声影响的同时,能够更多地利用有效特征。同时,通过结合多个尺寸的卷积核进行特征融合,进一步提升对声音特征的有效提取。此外,采用一种结合帧检测结果的加权法对声音信号进行识别。最后,在弱标签环境下,从AudioSet数据库中选取一个包含17种城市交通工具声音的弱标签数据集进行检测识别,所提模型对测试集声音识别结果的F 1值为58.9%,检测结果的F 1值为43.7%。结果表明,在弱标签城市交通工具声数据集下,网络模型相比传统的声音识别检测模型具有更高的识别检测精度;同时,重要性加权识别方法、多尺度注意力融合方法均可提升模型对声音识别检测的精度。 展开更多
关键词 弱标签 多尺度 注意力 声音识别 声音检测
下载PDF
任务引导的径向基网络对乳腺病理图像有丝分裂检测
4
作者 刘子仪 唐奇伶 蔡玉 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3146-3154,共9页
有丝分裂数目是判别乳腺癌恶性程度的重要指标,在诊断、治疗及预后中具有重要的意义.然而,在临床实践上乳腺癌切片中有丝分裂细胞的检测主要是通过病理学医生进行人工计数,这个过程繁琐耗时且具有很强主观性.本文提出了一种乳腺病理图... 有丝分裂数目是判别乳腺癌恶性程度的重要指标,在诊断、治疗及预后中具有重要的意义.然而,在临床实践上乳腺癌切片中有丝分裂细胞的检测主要是通过病理学医生进行人工计数,这个过程繁琐耗时且具有很强主观性.本文提出了一种乳腺病理图像有丝分裂自动检测的两阶段方法.在第一个阶段,利用卷积神经网络作为主干融合深监督与注意力机制进行有丝分裂细胞候选块的定位.在第二个阶段,将获取的候选块输入融合了径向基函数网络的验证模型,进一步提高有丝细胞识别准确率.针对有丝细胞类内存在较大差异的问题,本文通过任务来引导径向基函数中心的确定,利用径向基函数的“局部响应”特性来表达有丝分裂细胞的形态多样性.通过在弱标签数据集ICPR 2014和AMIDA 2013上进行评估,本文所提出的网络模型取得了最优的F-score,与竞争方法相比,分别提高了5.4%和3.0%,从而证明了该方法对于有丝分裂检测的有效性. 展开更多
关键词 有丝分裂检测 径向基函数 K-MEANS聚类 深监督 弱标签
下载PDF
一种基于弱标签的三维模型语义自动标注方法 被引量:3
5
作者 田枫 沈旭昆 +2 位作者 刘贤梅 周凯 杜睿山 《系统仿真学报》 CAS CSCD 北大核心 2012年第9期1873-1876,1881,共5页
随着三维应用的普及,三维模型大量产生并广泛传播。由于三维模型广泛应用于计算机辅助设计、三维游戏、电影特效制作等诸多领域,已经形成了大量的三维模型数据库。三维模型语义标注的目的是给出描述其语义的标注词,是三维模型管理和基... 随着三维应用的普及,三维模型大量产生并广泛传播。由于三维模型广泛应用于计算机辅助设计、三维游戏、电影特效制作等诸多领域,已经形成了大量的三维模型数据库。三维模型语义标注的目的是给出描述其语义的标注词,是三维模型管理和基于文本的三维检索的关键技术。针对互联网大量存在的弱标签三维模型现状,提出一种基于弱标签的三维模型语义标注方法LPMLL,首先,采用半监督学习方法进行标签传播,得到标注词置信度,达到提升训练集的目的。然后,采用一种基于最大后验概率准则的方法进行多标签学习,得到最终标注词。实验数据表明了该方法的有效性。 展开更多
关键词 三维模型自动标注 语义标注 半监督学习 弱标签
下载PDF
针对弱标记数据的多标签分类算法 被引量:8
6
作者 王晶晶 杨有龙 《计算机工程与应用》 CSCD 北大核心 2020年第5期65-73,共9页
针对标签信息不完整的多标签分类问题,一种新的多标签算法MCWD被提出。它通过有效地恢复训练数据中缺失的标签信息,能够产生更好的分类结果。在训练阶段,MCWD通过迭代更新每个训练实例的权重以及利用两两标签之间的相关性来恢复训练数... 针对标签信息不完整的多标签分类问题,一种新的多标签算法MCWD被提出。它通过有效地恢复训练数据中缺失的标签信息,能够产生更好的分类结果。在训练阶段,MCWD通过迭代更新每个训练实例的权重以及利用两两标签之间的相关性来恢复训练数据中缺失的标签信息;在标签恢复完毕后,利用新得到的训练集来训练分类模型;用此模型对测试集进行预测。实验结果表明,该算法在14个多标签数据集上具有一定的优势。 展开更多
关键词 多标签分类 缺失标签 弱标记学习 标签相关性
下载PDF
基于弱标签争议的半自动分类数据标注方法
7
作者 李自强 杨薇 +1 位作者 杨先凤 罗林 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2891-2899,共9页
当前,深度主动学习(Deep Active Learning,DAL)在分类数据标注工作中获得成功,但如何筛选出最能提升模型性能的样本仍是难题.本文提出基于弱标签争议的半自动分类数据标注方法(Dispute about Weak Label based Deep Active Learning,DWL... 当前,深度主动学习(Deep Active Learning,DAL)在分类数据标注工作中获得成功,但如何筛选出最能提升模型性能的样本仍是难题.本文提出基于弱标签争议的半自动分类数据标注方法(Dispute about Weak Label based Deep Active Learning,DWLDAL),迭代地筛选出模型难以区分的样本,交给人工进行准确标注.该方法包含伪标签生成器和弱标签生成器,伪标签生成器是在准确标注的数据集上训练而成,用于生成无标签数据的伪标签;弱标签生成器则是在带伪标签的随机子集上训练而成.弱标签生成器委员会决定哪些无标签数据最有争议,则交给人工标注.本文针对文本分类问题,在公开数据集IMDB(Internet Movie DataBase)、20NEWS(20NEW Sgroup)和chnsenticorp(chnsenticorp_htl_all)上进行实验验证.从数据标注和分类任务的准确性2个角度,对3种不同投票决策方式进行评估.DWLDAL方法中数据标注的F1分数比现有方法Snuba分别提高30.22%、14.07%和2.57%,DWLDAL方法中分类任务的F1分数比Snuba分别提高1.01%、22.72%和4.83%. 展开更多
关键词 深度主动学习 文本分类 伪标签生成器 弱标签生成器 投票委员会
下载PDF
局部特征引导标签平滑与优化的井下弱特征人员重识别
8
作者 张杰 缪小然 +3 位作者 赵作鹏 胡建峰 闵冰冰 高宇蒙 《工矿自动化》 CSCD 北大核心 2024年第2期83-89,共7页
煤矿井下低照度、强光扰、高粉尘等环境条件,以及井下人员服装的相似性和脸部落煤现象,导致井下弱特征人员重识别困难。现有人员重识别方法仅提取全局特征,未充分考虑局部特征,使得井下人员重识别准确率较低。针对上述问题,提出了一种... 煤矿井下低照度、强光扰、高粉尘等环境条件,以及井下人员服装的相似性和脸部落煤现象,导致井下弱特征人员重识别困难。现有人员重识别方法仅提取全局特征,未充分考虑局部特征,使得井下人员重识别准确率较低。针对上述问题,提出了一种局部特征引导标签平滑与优化的井下弱特征人员重识别方法。该方法首先通过卷积神经网络提取井下人员图像的全局特征与局部特征;然后利用k最近邻相似性计算全局特征和局部特征的互补性得分,来衡量全局特征和局部特征的相似程度;最后根据特征互补性得分对局部特征进行标签平滑及对全局特征进行标签优化,即动态调整每个局部特征的权重,以改进每个局部特征的标签,并对局部特征的预测结果进行汇总,利用更可靠的信息来完善标签以作为全局特征的标签,从而减少图像噪声并增强特征识别能力。实验结果表明,该方法在公开数据集和包含井下人员图像的自建数据集上的平均精度均值(mAP)、第一匹配正确率(Rank-1)和平均逆置负样本惩罚率(mINP)总体优于主流人员重识别方法,具有良好的泛化性和鲁棒性,能有效实现井下弱特征人员重识别。 展开更多
关键词 人员重识别 弱特征人员 局部特征 标签平滑 标签优化 特征互补性
下载PDF
基于正则化的半监督弱标签分类方法 被引量:3
9
作者 丁家满 刘楠 +2 位作者 周蜀杰 贾连印 李润鑫 《计算机学报》 EI CAS CSCD 北大核心 2022年第1期69-81,共13页
针对多标签学习中实例标签的缺失补全和预测问题,本文提出一种基于正则化的半监督弱标签分类方法(简称SWCMR),方法同时兼顾实例相似性和标签相关性.SWCMR首先根据标签相关性对弱标签实例的缺失标签进行初步预估,然后利用弱标签实例和无... 针对多标签学习中实例标签的缺失补全和预测问题,本文提出一种基于正则化的半监督弱标签分类方法(简称SWCMR),方法同时兼顾实例相似性和标签相关性.SWCMR首先根据标签相关性对弱标签实例的缺失标签进行初步预估,然后利用弱标签实例和无标签实例构造邻域图,从实例相似性和标签相关性角度构建基于平滑性假设的正则化项,接下来利用预估后的弱标签实例结合无标签实例训练半监督弱标签分类模型.在多种公共多标签数据集上的实验结果表明,SWCMR提高了分类性能,尤其是标签信息较少时,分类效果提升更显著. 展开更多
关键词 半监督弱标签学习 多标签分类 正则化 标签相关性
下载PDF
特征回归与检测结合的人数统计方法 被引量:5
10
作者 周治平 许伶俐 李文慧 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第3期425-432,共8页
针对目前特征回归与检测这2种主流的人流量统计方法的不足,提出一种基于特征回归与检测结合的人数统计方法.对于视频帧的远景区域,采用背景分割的方法提取出前景块,将前景块中的特征通过贝叶斯多核支持向量回归方法估计出人数;对于近景... 针对目前特征回归与检测这2种主流的人流量统计方法的不足,提出一种基于特征回归与检测结合的人数统计方法.对于视频帧的远景区域,采用背景分割的方法提取出前景块,将前景块中的特征通过贝叶斯多核支持向量回归方法估计出人数;对于近景区域提取HOG特征,采用弱标签结构训练出模型,并采用星型结构混合模型级联检测实现行人的准确定位并统计出人数.在视频数据库上的实验结果表明,该方法不仅能够较准确地实现人流量的统计,在一定程度上减少统计时间,还能够准确地定位出一定尺度范围内行人的位置. 展开更多
关键词 人流量统计 贝叶斯多核支持向量回归 行人检测 HOG特征 弱标签结构
下载PDF
基于多维相关性的弱类属属性学习
11
作者 王一宾 葛文信 +1 位作者 程玉胜 吴海峰 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期690-704,共15页
传统的多标签学习一般基于完整的标签信息,但随着数据量的增大,很难为每个实例获得完整的标签信息,导致弱标签问题在多标签数据集中广泛存在,严重影响了多标签的分类性能.为了提升相关性能,不少学者在实际分类中考虑特征、标签和实例部... 传统的多标签学习一般基于完整的标签信息,但随着数据量的增大,很难为每个实例获得完整的标签信息,导致弱标签问题在多标签数据集中广泛存在,严重影响了多标签的分类性能.为了提升相关性能,不少学者在实际分类中考虑特征、标签和实例部分的关联性,却忽略了它们之间的相关性.基于此,提出一种基于多维相关性的弱类属属性学习算法:首先,根据特征和标签之间的相关性,采用余弦相似度计算出标签之间的相关性;其次,根据特征与实例之间的相关性,采用密度峰值聚类获得实例相关性,并从中选择具有监督信息的标签矩阵,与分解希尔伯特矩阵获得的特征相关性结合构建流形正则化;最后,在多个不同缺省率的多标签数据集上进行了大量实验,验证了提出的算法的有效性. 展开更多
关键词 弱类属属性学习 标签相关性 特征相关性 密度峰值聚类 实例相关性
下载PDF
基于缩影的多时相遥感语义变化检测方法
12
作者 景维鹏 王健 +2 位作者 张文钧 谷俊涛 陈广胜 《华中农业大学学报》 CAS CSCD 北大核心 2023年第3期123-132,共10页
针对高分辨率遥感图像标签稀缺和标签技术增长缓慢限制了多时相语义变化检测发展的问题,提出了采用有噪声、低分辨率的弱标签替代高分辨率标签进行多时相语义变化检测的方法。首先,采用低分辨率卫星数据平滑高分辨率遥感图像输入的质量... 针对高分辨率遥感图像标签稀缺和标签技术增长缓慢限制了多时相语义变化检测发展的问题,提出了采用有噪声、低分辨率的弱标签替代高分辨率标签进行多时相语义变化检测的方法。首先,采用低分辨率卫星数据平滑高分辨率遥感图像输入的质量差异。其次,通过将缩影(epitomes)模型和标签超分辨率算法作为统计推理算法相结合的方法预估高分辨率遥感图像分类图,并拟合一个小型FCN网络对生成的遥感图像分类图进行后处理来改善其分类的效果。最后,通过对比不同时相土地覆盖分类图像之间的差异得出变化检测结果。结果表明,本研究提出的方法与其他多时相语义变化检测方法 FCN/all相比,平均交并比(mIoU)提高了8.9个百分点,能够有效检测土地覆盖分类变化。 展开更多
关键词 弱监督 标签超分辨率 缩影 土地覆盖变化图 语义分割 遥感影像 变化检测
下载PDF
离异图消歧引导的偏标记学习
13
作者 胡峰 刘鑫 +2 位作者 邓维斌 代劲 刘群 《控制与决策》 EI CSCD 北大核心 2023年第6期1753-1760,共8页
偏标记学习是一种弱监督学习框架,它试图从样本的多个候选标签中选择唯一正确的标签.消歧是偏标记学习中的一种重要手段,主要通过算法判别潜在的真实标签.目前,人们普遍采用单一的特征空间或者标签空间进行消歧,容易导致算法受到不准确... 偏标记学习是一种弱监督学习框架,它试图从样本的多个候选标签中选择唯一正确的标签.消歧是偏标记学习中的一种重要手段,主要通过算法判别潜在的真实标签.目前,人们普遍采用单一的特征空间或者标签空间进行消歧,容易导致算法受到不准确先验知识的引导而陷入鞍点.针对消歧过程中特征相似样本易受到异类样本影响从而影响消歧效果这一问题,定义了样本离异点和离异图;在此基础上,提出一种离异图引导消歧的偏标记学习方法.该方法利用标签空间的差异构建离异图,可以有效结合特征空间的相似性和标签空间的差异性,降低离异点为消歧过程带来的潜在风险.实验结果表明,与PLKNN、IPAL、SURE、PL-AGGD、SDIM、PL-BLC、PRODEN等方法相比较,所提出的算法在偏标签学习方法中表现更好,能够取得良好的消歧效果. 展开更多
关键词 弱监督 偏标记学习 消歧 流形假设 最大间隔 图嵌入
原文传递
基于标记与特征依赖最大化的弱标记集成分类 被引量:3
14
作者 谭桥宇 余国先 +1 位作者 王峻 郭茂祖 《软件学报》 EI CSCD 北大核心 2017年第11期2851-2864,共14页
弱标记学习是多标记学习的一个重要分支,近几年已被广泛研究并被应用于多标记样本的缺失标记补全和预测等问题.然而,针对特征集合较大、更容易拥有多个语义标记和出现标记缺失的高维数据问题,现有弱标记学习方法普遍易受这类数据包含的... 弱标记学习是多标记学习的一个重要分支,近几年已被广泛研究并被应用于多标记样本的缺失标记补全和预测等问题.然而,针对特征集合较大、更容易拥有多个语义标记和出现标记缺失的高维数据问题,现有弱标记学习方法普遍易受这类数据包含的噪声和冗余特征的干扰.为了对高维多标记数据进行准确的分类,提出了一种基于标记与特征依赖最大化的弱标记集成分类方法 En WL.En WL首先在高维数据的特征空间多次利用近邻传播聚类方法,每次选择聚类中心构成具有代表性的特征子集,降低噪声和冗余特征的干扰;再在每个特征子集上训练一个基于标记与特征依赖最大化的半监督多标记分类器;最后,通过投票集成这些分类器实现多标记分类.在多种高维数据集上的实验结果表明,En WL在多种评价度量上的预测性能均优于已有相关方法. 展开更多
关键词 弱标记学习 高维数据 特征子集 依赖最大化 集成分类
下载PDF
一种基于嵌入式的弱标记分类算法 被引量:2
15
作者 李亚重 杨有龙 仇海全 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第4期549-560,共12页
对于高维标签的分类问题,标签嵌入法已经受到广泛关注.现有的嵌入方法大都需要完整的标签信息,也没有将特征空间考虑在内;同时,由于数据进行人工标注的成本高以及噪声干扰等原因,仅能获得数据的部分标签信息,使得含有缺失标签的高维标... 对于高维标签的分类问题,标签嵌入法已经受到广泛关注.现有的嵌入方法大都需要完整的标签信息,也没有将特征空间考虑在内;同时,由于数据进行人工标注的成本高以及噪声干扰等原因,仅能获得数据的部分标签信息,使得含有缺失标签的高维标签分类问题变得更加复杂.为解决这一问题,提出一种弱标记嵌入算法(Label Embedding for Weak Label Classification,LEWL).该算法利用矩阵的低秩分解模型,结合样本的流形结构恢复缺失标签;同时采用希尔伯特‐施密特独立标准技术(Hilbert‐Schmidt Independence Criterion,HSIC)使特征和标签相互作用,联合学习获得一个低维的嵌入空间,可以有效地减少模型的训练时间.通过在七个多标签数据集上与其他算法的对比实验,结果表明了所提算法的有效性. 展开更多
关键词 弱标记学习 标签嵌入 低秩分解 希尔伯特‐施密特独立标准 缺失标签
下载PDF
Learning Multi Labels from Single Label——An Extreme Weak Label Learning Algorithm 被引量:1
16
作者 DUAN Junhong LI Xiaoyu MU Dejun 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2019年第2期161-168,共8页
This paper presents a novel algorithm for an extreme form of weak label learning, in which only one of all relevant labels is given for each training sample. Using genetic algorithm, all of the labels in the training ... This paper presents a novel algorithm for an extreme form of weak label learning, in which only one of all relevant labels is given for each training sample. Using genetic algorithm, all of the labels in the training set are optimally divided into several non-overlapping groups to maximize the label distinguishability in every group. Multiple classifiers are trained separately and ensembled for label predictions. Experimental results show significant improvement over previous weak label learning algorithms. 展开更多
关键词 weak-supervised LEARNING genetic algorithm MULTI-label classification
原文传递
基于可变形部件模型及稀疏特征的行人检测 被引量:2
17
作者 甘鹏坤 陶凌 龙伟 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2015年第6期563-570,共8页
针对方向梯度直方图算法无法处理模糊边界且忽略了物体内平滑的特征区域的问题,提出一种基于稀疏编码的可变形部件模型算法.通过稀疏学习得到稀疏编码直方图特征算子的图像特征,利用弱标签隐藏变量结构化支持向量机学习算法对特征进行... 针对方向梯度直方图算法无法处理模糊边界且忽略了物体内平滑的特征区域的问题,提出一种基于稀疏编码的可变形部件模型算法.通过稀疏学习得到稀疏编码直方图特征算子的图像特征,利用弱标签隐藏变量结构化支持向量机学习算法对特征进行训练得到部件模型,再结合级联检测算法对人体目标进行识别检测.实验结果显示,混合模型结合级联方法的检测耗时约是混合模型和语义模型平均检测耗时的1/4,与目前其他已有算法比较,所提方法更加鲁棒和具有识别力. 展开更多
关键词 图像处理 人体检测 稀疏特征 部件模型 弱标签隐藏变量支持向量机学习算法 级联检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部