期刊文献+
共找到85篇文章
< 1 2 5 >
每页显示 20 50 100
基于Tri-Training和数据剪辑的半监督聚类算法 被引量:30
1
作者 邓超 郭茂祖 《软件学报》 EI CSCD 北大核心 2008年第3期663-673,共11页
提出一种半监督聚类算法,该算法在用seeds集初始化聚类中心前,利用半监督分类方法Tri-training的迭代训练过程对无标记数据进行标记,并加入seeds集以扩大规模;同时,在Tri-training训练过程中结合基于最近邻规则的Depuration数据剪辑技术... 提出一种半监督聚类算法,该算法在用seeds集初始化聚类中心前,利用半监督分类方法Tri-training的迭代训练过程对无标记数据进行标记,并加入seeds集以扩大规模;同时,在Tri-training训练过程中结合基于最近邻规则的Depuration数据剪辑技术对seeds集扩大过程中产生的误标记噪声数据进行修正、净化,以提高seeds集质量.实验结果表明,所提出的基于Tri-training和数据剪辑的DE-Tri-training半监督聚类新算法能够有效改善seeds集对聚类中心的初始化效果,提高聚类性能. 展开更多
关键词 半监督聚类 半监督分类 K-均值 seeds集 tri-training Depuration数据剪辑
下载PDF
基于Tri-training的半监督SVM 被引量:15
2
作者 李昆仑 张伟 代运娜 《计算机工程与应用》 CSCD 北大核心 2009年第22期103-106,共4页
当前机器学习面临的主要问题之一是如何有效地处理海量数据,而标记训练数据是十分有限且不易获得的。提出了一种新的半监督SVM算法,该算法在对SVM训练中,只要求少量的标记数据,并能利用大量的未标记数据对分类器反复的修正。在实验中发... 当前机器学习面临的主要问题之一是如何有效地处理海量数据,而标记训练数据是十分有限且不易获得的。提出了一种新的半监督SVM算法,该算法在对SVM训练中,只要求少量的标记数据,并能利用大量的未标记数据对分类器反复的修正。在实验中发现,Tri-training的应用确实能够提高SVM算法的分类精度,并且通过增大分类器间的差异性能够获得更好的分类效果,所以Tri-training对分类器的要求十分宽松,通过SVM的不同核函数来体现分类器之间的差异性,进一步改善了协同训练的性能。理论分析与实验表明,该算法具有较好的学习效果。 展开更多
关键词 半监督学习 协同训练 tritraining 支持向量机 最小二乘支持向量机
下载PDF
基于自适应数据剪辑策略的Tri-training算法 被引量:15
3
作者 邓超 郭茂祖 《计算机学报》 EI CSCD 北大核心 2007年第8期1213-1226,共14页
Tri-training能有效利用无标记样例提高泛化能力.针对Tri-training迭代中无标记样例常被错误标记而形成训练集噪声,导致性能不稳定的缺点,文中提出ADE-Tri-training(Tri-training with Adaptive Data Editing)新算法.它不仅利用Remove O... Tri-training能有效利用无标记样例提高泛化能力.针对Tri-training迭代中无标记样例常被错误标记而形成训练集噪声,导致性能不稳定的缺点,文中提出ADE-Tri-training(Tri-training with Adaptive Data Editing)新算法.它不仅利用Remove Only剪辑操作对每次迭代可能产生的误标记样例识别并移除,更重要的是采用自适应策略来确定Remove Only触发与抑制的恰当时机.文中证明,PAC理论下自适应策略中一系列判别充分条件可同时确保新训练集规模迭代增大和新假设分类错误率迭代降低更多.UCI数据集上实验结果表明:ADE-Tri-training具有更好的分类泛化性能和健壮性. 展开更多
关键词 半监督学习 数据剪辑 自适应策略 PAC可学习 tri-training
下载PDF
面向产品评论的细粒度情感分析 被引量:17
4
作者 刘丽 王永恒 韦航 《计算机应用》 CSCD 北大核心 2015年第12期3481-3486,3505,共7页
针对传统粗粒度情感分析忽略具体评价对象,以及现有细粒度情感分析方法忽略无关评价要素的问题,提出结合条件随机场(CRF)和语法树剪枝的方法对产品评论进行细粒度情感分析。采用基于MapReduce的并行化协同训练(Tri-training)的方法对语... 针对传统粗粒度情感分析忽略具体评价对象,以及现有细粒度情感分析方法忽略无关评价要素的问题,提出结合条件随机场(CRF)和语法树剪枝的方法对产品评论进行细粒度情感分析。采用基于MapReduce的并行化协同训练(Tri-training)的方法对语料进行半自主标注,利用融合多种语言特征的条件随机场模型,获取评论中的评价对象和正负面评价词。通过建立领域本体和句法路径库实现语法树剪枝,对含有多个评价对象和评价词的文本,去掉无关评价对象的干扰,抽取出正确的评价单元,最后形成可视化产品报告。实验结果显示,提出的方法在两种不同领域数据集上,识别情感要素的综合准确率达89%左右,情感评价单元的综合准确率也达89%左右。实验结果表明,与传统方法相比,结合CRF和语法树剪枝的方法识别准确率更高,性能更好。 展开更多
关键词 产品评论 细粒度情感分析 MAPREDUCE 协同训练 条件随机场 语法树剪枝
下载PDF
基于Tri-Training-LASSO-BP网络的静态电压稳定裕度在线预测方法 被引量:15
5
作者 唐滢淇 董树锋 +2 位作者 朱承治 吴金城 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2020年第12期3824-3834,共11页
电力系统的静态电压稳定性,对于保证系统正常运行起着关键作用。传统的静态电压稳定裕度评估方法难以满足在线实时预测的要求,常用的离线监督预测方法则需要大量的训练样本,且容易出现过拟合,会对预测精度造成影响。研究能克服这些缺点... 电力系统的静态电压稳定性,对于保证系统正常运行起着关键作用。传统的静态电压稳定裕度评估方法难以满足在线实时预测的要求,常用的离线监督预测方法则需要大量的训练样本,且容易出现过拟合,会对预测精度造成影响。研究能克服这些缺点的方法,具有重要意义。该文将神经网络、半监督训练、集成学习等技术应用于电力系统静态电压稳定裕度的预测分析中,提出基于Tri-Training-LASSO-BP网络的在线预测方法,由三体训练法(Tri-Training)、最小绝对值收缩选择(least absolute shrinkage and select operator,LASSO)方法和误差反向传播(back propagation,BP)神经网络组成。在IEEE 39节点和IEEE 300节点算例上的结果和对其进行的非参数检验表明,该方法能够降低对训练集数据量的要求,发挥电力系统日常运行过程中采集的海量数据的优势,提高网络的预测精度,减少人工干预。 展开更多
关键词 静态电压稳定裕度 三体训练法 LASSO-BP神经网络 集成学习 Mann-Whitney U检验
下载PDF
基于改进三重训练算法的高光谱图像半监督分类 被引量:8
6
作者 王立国 杨月霜 刘丹凤 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2016年第6期849-854,共6页
高光谱数据维数高,有标签的样本数量少,给高光谱图像分类带来困难。本文针对传统三重训练(tri-training)算法在初始有标签样本数量较少的情况下分类器间差异性不足的问题提出了一种基于改进三重训练算法的半监督分类框架。该方法首先通... 高光谱数据维数高,有标签的样本数量少,给高光谱图像分类带来困难。本文针对传统三重训练(tri-training)算法在初始有标签样本数量较少的情况下分类器间差异性不足的问题提出了一种基于改进三重训练算法的半监督分类框架。该方法首先通过边缘采样策略(margin Sampling,MS)选取最富含信息量的无标签样本,然后在训练每个分类器之前通过差分进化算法(differential evolution,DE)利用所选取的无标签样本产生新的样本。这些新产生的样本将被标记并且加入训练样本集来帮助初始化分类器。实验结果表明,该方法不仅能够有效地利用无标签样本,而且在有标签数据很少的情况下能够有效地提高分类精度。 展开更多
关键词 高光谱图像 半监督分类 三重训练 边缘采样 差分进化
下载PDF
利用Tri-training算法解决推荐系统冷启动问题 被引量:6
7
作者 张栩晨 《计算机科学》 CSCD 北大核心 2016年第12期108-114,共7页
随着社交网络的发展,推荐系统日趋重要,而冷启动问题是推荐系统中的关键问题。设计了一种基于上下文的半监督学习框架TSEL,对矩阵分解模型SVD进行扩充以支持更多形式的上下文信息,利用Tri-training框架训练各个模型。与其他解决推荐系... 随着社交网络的发展,推荐系统日趋重要,而冷启动问题是推荐系统中的关键问题。设计了一种基于上下文的半监督学习框架TSEL,对矩阵分解模型SVD进行扩充以支持更多形式的上下文信息,利用Tri-training框架训练各个模型。与其他解决推荐系统冷启动问题的半监督方法(如Co-training)相比,该方法有着更好的效果。Tri-training框架能够更加方便地引入更多推荐模型,具有更好的可扩展性。将Tri-training框架加以扩展,提出了基于用户活跃度生成无标记教学集合的算法和更加丰富的对矩阵分解模型扩充的形式。在真实数据集MovieLens上进行验证,获得了更好的实验效果。 展开更多
关键词 推荐系统 机器学习 tri-training
下载PDF
基于Tri-Training算法的中文电子病历实体识别研究 被引量:6
8
作者 王润奇 关毅 《智能计算机与应用》 2017年第6期132-134,138,共4页
半监督学习是一种结合监督学习与无监督学习的学习方法,通过利用未标记数据,提高标记数据所建立模型的效果,目的是减少传统的机器学习任务中对大量标注数据的需求、降低人工成本。在中文电子病历实体识别领域,由于缺少足够的标注数据,... 半监督学习是一种结合监督学习与无监督学习的学习方法,通过利用未标记数据,提高标记数据所建立模型的效果,目的是减少传统的机器学习任务中对大量标注数据的需求、降低人工成本。在中文电子病历实体识别领域,由于缺少足够的标注数据,且医学文本专业性较强、人工标注成本高,可以利用半监督学习方法,提升少量标注数据的训练效果。本文介绍了中文电子病历实体识别的研究背景和半监督学习的相关研究,并应用改进后的Tri-Training算法,提升中文电子病历实体识别模型的效果。 展开更多
关键词 实体识别 半监督学习 tri-training
下载PDF
一种基于Tri-training的数据流集成分类算法 被引量:5
9
作者 胡学钢 马利伟 李培培 《数据采集与处理》 CSCD 北大核心 2017年第5期853-860,共8页
数据流分类是数据挖掘领域的重要研究任务之一,已有的数据流分类算法大多是在有标记数据集上进行训练,而实际应用领域数据流中有标记的数据数量极少。为解决这一问题,可通过人工标注的方式获取标记数据,但人工标注昂贵且耗时。考虑到未... 数据流分类是数据挖掘领域的重要研究任务之一,已有的数据流分类算法大多是在有标记数据集上进行训练,而实际应用领域数据流中有标记的数据数量极少。为解决这一问题,可通过人工标注的方式获取标记数据,但人工标注昂贵且耗时。考虑到未标记数据的数量极大且隐含大量信息,因此在保证精度的前提下,为利用这些未标记数据的信息,本文提出了一种基于Tri-training的数据流集成分类算法。该算法采用滑动窗口机制将数据流分块,在前k块含有未标记数据和标记数据的数据集上使用Tri-training训练基分类器,通过迭代的加权投票方式不断更新分类器直到所有未标记数据都被打上标记,并利用k个Tri-training集成模型对第k+1块数据进行预测,丢弃分类错误率高的分类器并在当前数据块上重建新分类器从而更新当前模型。在10个UCI数据集上的实验结果表明:与经典算法相比,本文提出的算法在含80%未标记数据的数据流上的分类精度有显著提高。 展开更多
关键词 数据流分类 tri-training 未标记数据 集成 加权投票
下载PDF
基于Tri-training的评价单元识别 被引量:4
10
作者 蒋润 顾春华 阮彤 《计算机应用》 CSCD 北大核心 2014年第4期1099-1104,共6页
评价单元的识别是情感倾向性分析中重要的一步,但由于标注语料匮乏,大多数研究集中在用人工构建规则、模板来识别评价单元的方法上。为了减轻标注训练语料的工作,同时进一步挖掘未标记样本的信息,提出一种基于协同训练机制的评价单元识... 评价单元的识别是情感倾向性分析中重要的一步,但由于标注语料匮乏,大多数研究集中在用人工构建规则、模板来识别评价单元的方法上。为了减轻标注训练语料的工作,同时进一步挖掘未标记样本的信息,提出一种基于协同训练机制的评价单元识别算法,以利用少量的已标记样本和大量的未标记样本来提高识别性能。该算法利用Tri-training的思想,将支持向量机(SVM)、最大熵(MaxEnt)以及条件随机场(CRF)三个不同分类器组合成一个分类体系,对生成的评价单元候选集进行分类。将Tri-training的算法思想应用于实验来对比采用单一分类器的方法,结果表明,该算法能够有效地识别主观句中的评价单元。 展开更多
关键词 半监督学习 协同训练 tri-training 评价单元 依存分析 评价对象
下载PDF
基于Tri-training半监督学习的中文组织机构名识别 被引量:4
11
作者 蔡月红 朱倩 程显毅 《计算机应用研究》 CSCD 北大核心 2010年第1期193-195,共3页
针对中文组织机构名识别中的标注语料匮乏问题,提出了一种基于协同训练机制的组织机构名识别方法。该算法利用Tri-training学习方式将基于条件随机场的分类器、基于支持向量机的分类器和基于记忆学习方法的分类器组合成一个分类体系,并... 针对中文组织机构名识别中的标注语料匮乏问题,提出了一种基于协同训练机制的组织机构名识别方法。该算法利用Tri-training学习方式将基于条件随机场的分类器、基于支持向量机的分类器和基于记忆学习方法的分类器组合成一个分类体系,并依据最优效用选择策略进行新加入样本的选择。在大规模真实语料上与co-training方法进行了比较实验,实验结果表明,此方法能有效利用大量未标注语料提高算法的泛化能力。 展开更多
关键词 中文组织机构名 半监督学习 协同训练 tritraining
下载PDF
支持向量机的半监督网络流量分类方法 被引量:6
12
作者 李平红 王勇 陶晓玲 《计算机应用》 CSCD 北大核心 2013年第6期1515-1518,共4页
针对传统网络流量分类方法准确率低、开销大、应用范围受限等问题,提出一种支持向量机(SVM)的半监督网络流量分类方法。该方法在SVM训练中,使用增量学习技术在初始和新增样本集中动态地确定支持向量,避免不必要的重复训练,改善因出现新... 针对传统网络流量分类方法准确率低、开销大、应用范围受限等问题,提出一种支持向量机(SVM)的半监督网络流量分类方法。该方法在SVM训练中,使用增量学习技术在初始和新增样本集中动态地确定支持向量,避免不必要的重复训练,改善因出现新样本而造成原分类器分类精度降低、分类时间长的情况;改进半监督Tri-training方法对分类器进行协同训练,同时使用大量未标记和少量已标记样本对分类器进行反复修正,减少辅助分类器的噪声数据,克服传统协同验证对分类算法及样本类型要求苛刻的不足。实验结果表明,该方法可明显提高网络流量分类的准确率和效率。 展开更多
关键词 网络流量分类 支持向量机 半监督 增量学习 协同训练
下载PDF
基于Tri-training GPR的半监督软测量建模方法
13
作者 马君霞 李林涛 熊伟丽 《化工学报》 EI CSCD 北大核心 2024年第7期2613-2623,共11页
集成学习因通过构建并结合多个学习器,常获得比单一学习器显著优越的泛化能力。但是在标记数据比例较少时,建立高性能的集成学习软测量模型依然是个挑战。针对这一个问题,提出一种基于半监督集成学习的软测量建模方法——Tri-training ... 集成学习因通过构建并结合多个学习器,常获得比单一学习器显著优越的泛化能力。但是在标记数据比例较少时,建立高性能的集成学习软测量模型依然是个挑战。针对这一个问题,提出一种基于半监督集成学习的软测量建模方法——Tri-training GPR模型。该建模策略充分发挥了半监督学习的优势,减轻建模过程对标记样本数据的需求,在低数据标签率下,仍能通过对无标记数据进行筛选从而扩充可用于建模的有标记样本数据集,并进一步结合半监督学习和集成学习的优势,提出一种新的选择高置信度样本的思路。将所提方法应用于青霉素发酵和脱丁烷塔过程,建立青霉素和丁烷浓度预测软测量模型,与传统的建模方法相比获得了更优的预测结果,验证了模型的有效性。 展开更多
关键词 软测量 集成学习 半监督学习 tri-training 高斯过程回归 过程控制 动力学模型 化学过程
下载PDF
基于密度峰值聚类的Tri-training算法
14
作者 罗宇航 吴润秀 +3 位作者 崔志华 张翼英 何业慎 赵嘉 《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1189-1198,共10页
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类... Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。 展开更多
关键词 tri-training 半监督学习 密度峰值聚类 空间结构 分类器
下载PDF
基于Tri-Training半监督学习的非功能性需求分类方法在工业软件中的应用
15
作者 宋百灵 何彦众 +4 位作者 张泽贤 曾诚 俞嘉怡 刘进 胡文华 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2024年第3期367-375,共9页
结合Word2Vec的Skip-gram模型在提取复杂软件需求文档中细微语义差异方面的优势,提出了一种基于Tri-Training半监督学习的非功能性需求分类方法,旨在应对软件需求工程领域中标记样本数量有限的挑战,从而解决非功能性需求分类性能下降的... 结合Word2Vec的Skip-gram模型在提取复杂软件需求文档中细微语义差异方面的优势,提出了一种基于Tri-Training半监督学习的非功能性需求分类方法,旨在应对软件需求工程领域中标记样本数量有限的挑战,从而解决非功能性需求分类性能下降的问题。与传统应用于完全冗余视图或单一分类器的半监督学习算法不同,半监督学习Tri-training算法通过用自举抽样产生的3个不同的标记数据集初始化3个不同的分类器,利用三个分类器以多数投票规则来产生伪标记数据,从而解除对训练集的限制,提高分类框架的通用性和可用性。将本文方法应用于涵盖多个工业领域的PROMISE软件需求数据集中,结果表明,基于Tri-Training半监督学习的非功能性需求分类方法在不同标记比例的数据集上具有良好的分类性能,特别是在标记数据不足的情况下,相比于监督学习和其他半监督学习算法,该方法在召回率和F1值上具有显著优势。 展开更多
关键词 软件需求分类 半监督学习 tri-training
原文传递
基于特征选择与改进的Tri-training的半监督网络流量分类
16
作者 李道全 祝圣凯 +1 位作者 翟豫阳 胡一帆 《计算机工程与应用》 CSCD 北大核心 2024年第23期275-285,共11页
网络流量分类对网络管理意义重大,目前基于机器学习的流量分类方法存在标注瓶颈、样本不平衡的问题。针对这两个问题,提出一种基于特征选择与改进的Tri-training算法结合的半监督网络流量分类模型。根据最大信息系数、皮尔逊系数选择出... 网络流量分类对网络管理意义重大,目前基于机器学习的流量分类方法存在标注瓶颈、样本不平衡的问题。针对这两个问题,提出一种基于特征选择与改进的Tri-training算法结合的半监督网络流量分类模型。根据最大信息系数、皮尔逊系数选择出与类高度相关但彼此不相关的特征,利用改进的Relief F选择出有利于少数类分类的特征,并将选择出的特征组合成最优特征子集缓解不平衡数据对分类的影响。结合集成思想,优化迭代和加权决策改进传统Tri-training算法,利用改进的Tri-training算法解决标注瓶颈问题。在Moore数据集上进行了实验,实验结果表明提出的方法在利用不平衡的少量有标记的数据下在F-measure上达到了95.26%,与先进的机器学习算法和原始Tri-training方法及其一些改进算法相比具有更好的分类性能。 展开更多
关键词 半监督网络 类不平衡 网络流量分类 特征选择 tri-training
下载PDF
基于Tri-training的半监督多标记学习算法 被引量:4
17
作者 刘杨磊 梁吉业 +1 位作者 高嘉伟 杨静 《智能系统学报》 CSCD 北大核心 2013年第5期439-445,共7页
传统的多标记学习是监督意义下的学习,它要求获得完整的类别标记.但是当数据规模较大且类别数目较多时,获得完整类别标记的训练样本集是非常困难的.因而,在半监督协同训练思想的框架下,提出了基于Tri-training的半监督多标记学习算法(SM... 传统的多标记学习是监督意义下的学习,它要求获得完整的类别标记.但是当数据规模较大且类别数目较多时,获得完整类别标记的训练样本集是非常困难的.因而,在半监督协同训练思想的框架下,提出了基于Tri-training的半监督多标记学习算法(SMLT).在学习阶段,SMLT引入一个虚拟类标记,然后针对每一对类别标记,利用协同训练机制Tri-training算法训练得到对应的分类器;在预测阶段,给定一个新的样本,将其代入上述所得的分类器中,根据类别标记得票数的多少将多标记学习问题转化为标记排序问题,并将虚拟类标记的得票数作为阈值对标记排序结果进行划分.在UCI中4个常用的多标记数据集上的对比实验表明,SMLT算法在4个评价指标上的性能大多优于其他对比算法,验证了该算法的有效性. 展开更多
关键词 多标记学习 半监督学习 tri-training
下载PDF
融合边缘采样和Tri-training的用户评论情感分析方法
18
作者 江亿平 张婷 +2 位作者 夏争鸣 李玉花 张兆同 《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第5期102-112,共11页
【目的】针对用户评论数据量大、情感倾向模糊、内容短小等特点,提出融合边缘采样和Tri-training的用户评论情感分析方法。【方法】通过构建基于一对多拆解策略的多分类支持向量机,并融合考虑余弦相似度的边缘采样策略构造初始集,提出... 【目的】针对用户评论数据量大、情感倾向模糊、内容短小等特点,提出融合边缘采样和Tri-training的用户评论情感分析方法。【方法】通过构建基于一对多拆解策略的多分类支持向量机,并融合考虑余弦相似度的边缘采样策略构造初始集,提出结合软投票机制的Tri-training算法。【结果】本文算法对Tri-training算法投票机制的改进,进一步减小了多个分类器对于样本分类投票判断失误的概率,使所有类别精确率均在79%以上。【局限】未考虑多媒体数据的信息提取。【结论】与传统及近年改进的半监督学习算法相比,本文提出的融合边缘采样和Tri-training的算法在分类准确率和效率上具有一定的优越性。 展开更多
关键词 用户评论 情感分析 边缘采样 tri-training
原文传递
基于Tri-training的社交媒体药物不良反应实体抽取
19
作者 何忠玻 严馨 +2 位作者 徐广义 张金鹏 邓忠莹 《计算机工程与应用》 CSCD 北大核心 2024年第3期177-186,共10页
社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题... 社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题,采用Tri-training半监督的方法进行社交媒体药物不良反应实体抽取,通过三个学习器Transformer+CRF、BiLSTM+CRF和IDCNN+CRF对未标注数据进行标注,再利用一致性评价函数迭代地扩展训练集,最后通过加权投票整合模型输出标签。针对社交媒体的文本不正式性(口语化严重、错别字等)问题,通过融合字与词两个粒度的向量作为整个模型嵌入层的输入,来提取更丰富的语义信息。实验结果表明,提出的模型在“好大夫在线”网站获取的数据集上取得了良好表现。 展开更多
关键词 中文社交媒体 药物不良反应 实体抽取 半监督学习 tri-training
下载PDF
基于Tri-training半监督学习的JPEG隐密分析方法 被引量:3
20
作者 郭艳卿 孔祥维 +1 位作者 尤新刚 何德全 《通信学报》 EI CSCD 北大核心 2008年第10期205-209,214,共6页
提出了一种基于半监督学习机制的JPEG隐密分析方法。通过三类DCT域统计特征和多超球面OC-SVM算法构建三种独立的隐密分析方法,并以Tri-training学习方式迭代地对未标记图像样本进行标记,来扩充原训练样本集,进而可以利用大量未标记属性... 提出了一种基于半监督学习机制的JPEG隐密分析方法。通过三类DCT域统计特征和多超球面OC-SVM算法构建三种独立的隐密分析方法,并以Tri-training学习方式迭代地对未标记图像样本进行标记,来扩充原训练样本集,进而可以利用大量未标记属性的图像样本提高隐密分析算法的泛化能力。由JSteg、F5、Outguess、MB1含密图像与载体图像所组成的混合图像库上的仿真实验结果验证了此方法的有效性。 展开更多
关键词 隐密分析 半监督学习 tri-training 多超球面 一类支持向量机
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部