期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Co-training机器学习方法在中文组块识别中的应用 被引量:8
1
作者 刘世岳 李珩 +1 位作者 张俐 姚天顺 《中文信息学报》 CSCD 北大核心 2005年第3期73-79,共7页
采用半指导机器学习方法co training实现中文组块识别。首先明确了中文组块的定义,co training算法的形式化定义。文中提出了基于一致性的co training选取方法将增益的隐马尔可夫模型(TransductiveHMM)和基于转换规则的分类器(fnTBL)组... 采用半指导机器学习方法co training实现中文组块识别。首先明确了中文组块的定义,co training算法的形式化定义。文中提出了基于一致性的co training选取方法将增益的隐马尔可夫模型(TransductiveHMM)和基于转换规则的分类器(fnTBL)组合成一个分类体系,并与自我训练方法进行了比较,在小规模汉语树库语料和大规模未带标汉语语料上进行中文组块识别,实验结果要比单纯使用小规模的树库语料有所提高,F值分别达到了85 34%和83 4 1% ,分别提高了2 13%和7 2 1%。 展开更多
关键词 计算机应用 中文信息处理 co-training算法 中文组块 分类器
下载PDF
用于在线产品评论质量分析的Co-training算法 被引量:6
2
作者 靳健 季平 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第3期289-295,共7页
在线评论广泛存在于电子商务网站平台,其中包含着客户对产品的评价及偏好.高效分析在线评论数据并满足客户需求,对许多谋求立足于竞争激烈的国际化市场的企业来说至关重要.但因在线评论的质量不一,使得如何分析在线评论的质量成为一项... 在线评论广泛存在于电子商务网站平台,其中包含着客户对产品的评价及偏好.高效分析在线评论数据并满足客户需求,对许多谋求立足于竞争激烈的国际化市场的企业来说至关重要.但因在线评论的质量不一,使得如何分析在线评论的质量成为一项重要工作.从两个方面提取特征对在线评论进行描述,并构建了一种Co-training算法来判断评论的质量.通过对比实验验证了该算法相对于单一分类算法的优势. 展开更多
关键词 数据质量 co-training算法 在线产品评论 评论质量 文本挖掘 产品设计
下载PDF
TFIDF_-NB协同训练算法 被引量:1
3
作者 彭雅 林亚平 陈治平 《小型微型计算机系统》 CSCD 北大核心 2004年第12期2243-2246,共4页
采用少量已标记和大量未标记文档进行文本分类已成为一种重要研究趋势 .在分析了 EM和联合训练 (Co-training)两类算法的基础上 ,提出一种新的协同训练算法 .该算法利用 Bayes和 TFIDF两种分类器结合少量已标记和大量未标记文档协同增... 采用少量已标记和大量未标记文档进行文本分类已成为一种重要研究趋势 .在分析了 EM和联合训练 (Co-training)两类算法的基础上 ,提出一种新的协同训练算法 .该算法利用 Bayes和 TFIDF两种分类器结合少量已标记和大量未标记文档协同增量训练 .实验结果表明 ,协同训练算法正确率较高 ,平均错误率较 EM和联合训练低 。 展开更多
关键词 文本分类 半监督算法 联合训练算法 EM算法 协同增量训练
下载PDF
协同半监督的构造性学习方法 被引量:1
4
作者 李萍 吴涛 《计算机工程与应用》 CSCD 北大核心 2015年第3期129-132,207,共5页
利用构造性学习(CML)算法训练分类器需要大量已标记样本,然而获取大量已标记的样本较为困难。为此,提出了一种协同半监督的构造性学习算法。将已标记样本等分为三个训练集,分别使用构造性学习算法训练三个单分类器,以共同投票的方式对... 利用构造性学习(CML)算法训练分类器需要大量已标记样本,然而获取大量已标记的样本较为困难。为此,提出了一种协同半监督的构造性学习算法。将已标记样本等分为三个训练集,分别使用构造性学习算法训练三个单分类器,以共同投票的方式对未标记样本进行标记,从而依次扩充三个单分类器训练集直到不能再扩充为止。将三个训练集合并训练出最终的分类器。选取UCI数据集进行实验,结果表明,与CML算法、Tri-CML算法、NB算法及Tri-NB相比,该方法的分类更为有效。 展开更多
关键词 半监督学习 构造性机器学习 co-training算法 tri-training算法 覆盖算法
下载PDF
基于Co-training的图像自动标注
5
作者 柯逍 李绍滋 陈国龙 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第4期486-492,共7页
图像自动标注是图像理解与模式识别等领域中具有挑战性的关键研究问题.目前图像自动标注领域存在着一些问题,如未标注数据规模要远大于标注数据规模,只能单独使用某种图像分割策略与某类图像表示方法.针对上述问题,提出了基于Co-trainin... 图像自动标注是图像理解与模式识别等领域中具有挑战性的关键研究问题.目前图像自动标注领域存在着一些问题,如未标注数据规模要远大于标注数据规模,只能单独使用某种图像分割策略与某类图像表示方法.针对上述问题,提出了基于Co-training的图像自动标注方法,通过构建4个独立的特征属性进而建立4个子分类器,将不同的图像分割方法与特征表示方法整合到一个统一框架中,利用提出的基于投票与一致性相结合的自适应算法扩展原始训练集.该方法通过使用Co-training算法,利用大量未标注数据来提升图像自动标注的性能.通过在Corel 5K数据库上进行实验,验证了提出方法的有效性. 展开更多
关键词 图像自动标注 cotraining算法 统一框架 相关模型
下载PDF
一种交互学习的属性划分算法
6
作者 宋华珠 钟珞 +1 位作者 赵广辉 夏红霞 《武汉理工大学学报(信息与管理工程版)》 CAS 2005年第2期187-191,共5页
首先给出了属性分割的有效性测试算法,它能检测基于当前分割的交互学习算法是否优越于传统的不划分属性的单一数据集的学习算法;进一步,给出了渐进式自动属性集合的划分算法。基于大规模卫星环境监测数据的实验表明,上述两种算法能对有... 首先给出了属性分割的有效性测试算法,它能检测基于当前分割的交互学习算法是否优越于传统的不划分属性的单一数据集的学习算法;进一步,给出了渐进式自动属性集合的划分算法。基于大规模卫星环境监测数据的实验表明,上述两种算法能对有效地分割数据集合,使学习能力得到明显提高。 展开更多
关键词 标记数据 交互学习 视图有效性检测 自动视图测试
下载PDF
基于协同训练的CRF模型评价信息识别的设计
7
作者 乔磊 《山西电子技术》 2020年第4期65-67,70,共4页
随着电商的飞速发展,越来越多的人选择通过网络来购物,随之而来的是消费者在各大购物网站上发表的大量评价信息。为了从中快速识别出关键的评价信息,本文基于协同训练算法(Co-training),利用条件随机场(CRF)模型,设计了一种自动识别关... 随着电商的飞速发展,越来越多的人选择通过网络来购物,随之而来的是消费者在各大购物网站上发表的大量评价信息。为了从中快速识别出关键的评价信息,本文基于协同训练算法(Co-training),利用条件随机场(CRF)模型,设计了一种自动识别关键的评价信息的方法。与2014COAE评测对比,该方法的效果优于评测平均水平,验证了该方法的有效性。 展开更多
关键词 条件随机场模型 协同训练算法 评价信息
下载PDF
基于半监督学习的恶意URL检测方法 被引量:4
8
作者 麻瓯勃 刘雪娇 +2 位作者 唐旭栋 周宇轩 胡亦承 《计算机系统应用》 2020年第11期11-20,共10页
检测恶意URL对防御网络攻击有着重要意义.针对有监督学习需要大量有标签样本这一问题,本文采用半监督学习方式训练恶意URL检测模型,减少了为数据打标签带来的成本开销.在传统半监督学习协同训练(co-training)的基础上进行了算法改进,利... 检测恶意URL对防御网络攻击有着重要意义.针对有监督学习需要大量有标签样本这一问题,本文采用半监督学习方式训练恶意URL检测模型,减少了为数据打标签带来的成本开销.在传统半监督学习协同训练(co-training)的基础上进行了算法改进,利用专家知识与Doc2Vec两种方法预处理的数据训练两个分类器,筛选两个分类器预测结果相同且置信度高的数据打上伪标签(pseudo-labeled)后用于分类器继续学习.实验结果表明,本文方法只用0.67%的有标签数据即可训练出检测精确度(precision)分别达到99.42%和95.23%的两个不同类型分类器,与有监督学习性能相近,比自训练与协同训练表现更优异. 展开更多
关键词 恶意URL检测 半监督学习 协同训练改进算法 Doc2Vec 分类器训练
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部