期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于主动学习的中文依存句法分析 被引量:10
1
作者 车万翔 张梅山 刘挺 《中文信息学报》 CSCD 北大核心 2012年第2期18-22,共5页
目前依存句法分析仍主要采用有指导的机器学习方法,即需要大规模高质量的树库作为训练语料,而现阶段中文依存树库资源相对较少,树库标注又是一件费时费力的工作。面对大量未标注语料,该文将主动学习应用到中文依存句法分析,优先选择句... 目前依存句法分析仍主要采用有指导的机器学习方法,即需要大规模高质量的树库作为训练语料,而现阶段中文依存树库资源相对较少,树库标注又是一件费时费力的工作。面对大量未标注语料,该文将主动学习应用到中文依存句法分析,优先选择句法模型预测不准的实例交由人工标注。该文提出并比较了多种衡量依存句法模型预测可信度的准则。实验表明,一方面,与随机选择标注实例相比,当使用相同数目训练实例时,主动学习使中文依存分析性能最高提升0.8%;另一方面,主动学习使依存分析达到相同准确率时只需标注更少量实例,人工标注量最多可减少30%。 展开更多
关键词 主动学习 依存句法 不确定性度量 委员会投票
下载PDF
最小差异采样的主动学习图像分类方法 被引量:4
2
作者 吴健 盛胜利 +1 位作者 赵朋朋 崔志明 《通信学报》 EI CSCD 北大核心 2014年第1期107-114,共8页
针对委员会成员模型投票不一致性的度量问题,提出了一种基于最小差异采样的主动学习图像分类方法。该方法首先基于标注样本集的重采样结果构建决策委员会,然后利用投票概率较高的2个类别的概率值的差异来度量未标注样本集每个样本的投... 针对委员会成员模型投票不一致性的度量问题,提出了一种基于最小差异采样的主动学习图像分类方法。该方法首先基于标注样本集的重采样结果构建决策委员会,然后利用投票概率较高的2个类别的概率值的差异来度量未标注样本集每个样本的投票不一致性,选择概率差异最小的样本交由人工专家标注,如此迭代更新分类器。将新方法与EQB算法及nEQB算法在多个数据集上进行实验对比,实验结果表明所提方法能够有效提高分类的准确率。还对组成决策委员会的成员模型的数目设置进行了分析和讨论,结果表明在相同的成员模型数目时所提方法比nEQB算法更为有效。 展开更多
关键词 图像分类 主动学习 采样策略 委员会投票 最小差异
下载PDF
基于软间隔委员会投票主动学习的遥感影像分类 被引量:1
3
作者 程玉虎 汪婵 +1 位作者 王雪松 孙伟芳 《煤炭学报》 EI CAS CSCD 北大核心 2013年第7期1201-1206,共6页
针对遥感影像数据具有大量未标记样本的特性,采用主动学习方法从未标记样本中,挑选出最有利于改善遥感影像分类性能的样本添加到已标记样本中进行学习,以有效避免过多的人工干预,减少标记样本数量。进一步,针对传统基于委员会投票主动... 针对遥感影像数据具有大量未标记样本的特性,采用主动学习方法从未标记样本中,挑选出最有利于改善遥感影像分类性能的样本添加到已标记样本中进行学习,以有效避免过多的人工干预,减少标记样本数量。进一步,针对传统基于委员会投票主动学习难以处理噪声及线性不可分数据的问题,提出基于软间隔的委员会投票主动学习方法,对样本间隔添加考虑样本分布的松弛项,以弱化硬间隔对噪声数据分类的影响。遥感影像数据集上的仿真结果表明,所提算法能够使用较少的训练样本来获得较高的分类精度。 展开更多
关键词 软间隔 委员会投票 主动学习 遥感影像
下载PDF
基于委员会投票的主动学习中文分词方法
4
作者 顾磊 梁喜涛 《图书馆学研究》 CSSCI 2016年第1期36-40,70,共6页
主动学习方法可以减少人工标注海量数据时的代价,因此在中文信息处理领域中具有非常重要的作用。文章提出了一种基于委员会投票的主动学习分词方法。该方法的核心思想就是利用Bagging算法构建委员会并对其进行投票,然后采用新的样本选... 主动学习方法可以减少人工标注海量数据时的代价,因此在中文信息处理领域中具有非常重要的作用。文章提出了一种基于委员会投票的主动学习分词方法。该方法的核心思想就是利用Bagging算法构建委员会并对其进行投票,然后采用新的样本选择策略,选择样本进行人工标注。最后采用主动学习中文分词方法与利用投票选择样本的主动学习中文分词方法在3个数据集上进行了实验,实验结果表明文章提出的方法不仅可以用于中文分词,而且能够取得更好的分词效果。 展开更多
关键词 委员会投票 中文分词 主动学习
原文传递
基于改进的QBC和CS-SVM的故障检测 被引量:16
5
作者 唐明珠 阳春华 桂卫华 《控制与决策》 EI CSCD 北大核心 2012年第10期1489-1493,共5页
针对复杂工业过程样本集中的类不平衡、样本标注代价昂贵和样本孤点的问题,研究基于委员会投票选择(MQBC)和代价敏感支持向量机(CS-SVM)的故障检测方法.给出未标注样本信息度的定义,提出改进的委员会投票选择算法.主动代价敏感学习通过M... 针对复杂工业过程样本集中的类不平衡、样本标注代价昂贵和样本孤点的问题,研究基于委员会投票选择(MQBC)和代价敏感支持向量机(CS-SVM)的故障检测方法.给出未标注样本信息度的定义,提出改进的委员会投票选择算法.主动代价敏感学习通过MQBC选择信息度高的未标注样本对其标注并添加到训练集.CS-SVM将不同类样本的误分类赋予不同的误分类代价,从而提高CS-SVM的故障检测率.最后,以铜闪速熔炼过程为例,实验结果验证了所提出方法的有效性. 展开更多
关键词 主动学习 代价敏感支持向量机 委员会投票选择算法 故障检测
原文传递
基于委员会投票选择方法的主动学习的研究 被引量:7
6
作者 赵悦 穆志纯 《太原理工大学学报》 CAS 北大核心 2006年第4期469-472,共4页
讨论了利用QBC(委员会投票选择)的主动学习方法来学习贝叶斯网络分类器,通过对基于投票熵和基于KL-divergence的QBC算法的研究,指出了两者存在的缺陷;同时提出了基于投票熵与类条件后验最大熵相结合的QBC算法。实验证明,该算法提高了分... 讨论了利用QBC(委员会投票选择)的主动学习方法来学习贝叶斯网络分类器,通过对基于投票熵和基于KL-divergence的QBC算法的研究,指出了两者存在的缺陷;同时提出了基于投票熵与类条件后验最大熵相结合的QBC算法。实验证明,该算法提高了分类器的精度,并使用了较少的训练样本,这有效解决了大数据量训练样本获得困难的情况下分类器建模问题。 展开更多
关键词 主动学习 委员会投票选择 投票 最大熵
下载PDF
一种基于QBC的SVM主动学习算法 被引量:8
7
作者 徐海龙 别晓峰 +1 位作者 冯卉 吴天爱 《系统工程与电子技术》 EI CSCD 北大核心 2015年第12期2865-2871,共7页
针对支持向量机(souport vector machine,SVM)训练学习过程中样本分布不均衡、难以获得大量带有类标注样本的问题,提出一种基于委员会投票选择(query by committee,QBC)的SVM主动学习算法QBC-ASVM,将改进的QBC主动学习方法与加权SVM方... 针对支持向量机(souport vector machine,SVM)训练学习过程中样本分布不均衡、难以获得大量带有类标注样本的问题,提出一种基于委员会投票选择(query by committee,QBC)的SVM主动学习算法QBC-ASVM,将改进的QBC主动学习方法与加权SVM方法有机地结合应用于SVM训练学习中,通过改进的QBC主动学习,主动选择那些对当前SVM分类器最有价值的样本进行标注,在SVM主动学习中应用改进的加权SVM,减少了样本分布不均衡对SVM主动学习性能的影响,实验结果表明在保证不影响分类精度的情况下,所提出的算法需要标记的样本数量大大少于随机采样法需要标记的样本数量,降低了学习的样本标记代价,提高了SVM泛化性能而且训练速度同样有所提高。 展开更多
关键词 主动学习 支持向量机 委员会投票选择算法 分类
下载PDF
基于聚类和协同标注的TSVM算法 被引量:4
8
作者 杜红乐 张燕 《河南科学》 2017年第1期22-27,共6页
针对数据集中类样本不均衡、样本标注代价大的问题,结合聚类算法、委员会投票思想和TSVM算法,提出一种基于聚类和协同标注的TSVM算法,该方法利用聚类算法进行子集划分,保证每个子集都包含良好的空间信息,对样本的标注采用多个分类器进... 针对数据集中类样本不均衡、样本标注代价大的问题,结合聚类算法、委员会投票思想和TSVM算法,提出一种基于聚类和协同标注的TSVM算法,该方法利用聚类算法进行子集划分,保证每个子集都包含良好的空间信息,对样本的标注采用多个分类器进行投票,提高标记准确率,减少错误的累积和传递,提高标注准确率,增强最后分类器的泛化性能.KDDCUP99数据集上的实验结果表明该方法对未知攻击有较高的检测准确率. 展开更多
关键词 直推式支持向量机 聚类算法 委员会投票算法 协同标注
下载PDF
QBC主动采样学习在垃圾邮件在线过滤中的应用 被引量:3
9
作者 陈念 唐振民 《计算机工程与应用》 CSCD 2014年第22期170-174,共5页
针对垃圾邮件在线过滤的实际应用,在委员会投票算法采样学习的基础上,提出动态提升采样门槛,在无标签样本池中阶梯式获取高信息量训练样本的方法。该方法能够在稳定识别精度的前提下,进一步降低用于标注和学习的样本数量,压缩由此带来... 针对垃圾邮件在线过滤的实际应用,在委员会投票算法采样学习的基础上,提出动态提升采样门槛,在无标签样本池中阶梯式获取高信息量训练样本的方法。该方法能够在稳定识别精度的前提下,进一步降低用于标注和学习的样本数量,压缩由此带来的时间成本。通过在UCI的Spambase数据集上仿真,证明了该方法在改善学习效率方面的有效性。 展开更多
关键词 垃圾邮件过滤 版本空间 主动学习 投票 委员会投票算法
下载PDF
面向智能产前胎儿监护的QBC算法机制的研究 被引量:1
10
作者 杨蔓丽 陈彦杭 +6 位作者 李星烜 陈沁群 魏航 洪佳明 李丽 刘桂清 郝志峰 《中国数字医学》 2020年第11期1-5,共5页
介绍基于F1评分的平衡多样性加权委员会投票选择(Query-by-committee,QBC)的主动学习算法,阐明主动学习在智能产前胎儿监护中的作用。基于产前胎心宫缩图数据,在采用梯度提升决策树委员会投票选择的主动学习算法基础上,分歧度度量方式... 介绍基于F1评分的平衡多样性加权委员会投票选择(Query-by-committee,QBC)的主动学习算法,阐明主动学习在智能产前胎儿监护中的作用。基于产前胎心宫缩图数据,在采用梯度提升决策树委员会投票选择的主动学习算法基础上,分歧度度量方式是采用基于投票熵和类条件后验最大熵相结合的度量方法,创新性地提出平衡因子,并结合多样性因子和F1因子进行加权计算。实验结果表明该方法仅需约41%的标注样本,即可使模型的整体性能指标达到96%以上。 展开更多
关键词 产前胎儿监护 胎心宫缩数据 委员会投票选择算法 平衡因子
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部