期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
不平衡数据的迁移学习分类算法 被引量:8
1
作者 陈琼 徐洋洋 陈林清 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第1期122-130,共9页
以Tr Adaboost算法为基础,提出了一个针对不平衡数据的二分类迁移学习算法Unbalanced Tr Adaboost(UBTA).UBTA算法利用不同类别的Precision-Recall曲线下的面积auprc(the Area Under the Precision-Recall Curve)计算弱分类器权重,对不... 以Tr Adaboost算法为基础,提出了一个针对不平衡数据的二分类迁移学习算法Unbalanced Tr Adaboost(UBTA).UBTA算法利用不同类别的Precision-Recall曲线下的面积auprc(the Area Under the Precision-Recall Curve)计算弱分类器权重,对不同类别的样本采取不同的权重更新策略;AUC指标对数据分布变化不敏感,结合G-mean和BER能更准确地评估不平衡分类算法的性能.实验结果表明,UBTA具有较好的分类性能,既能提升对少数类的关注,又能保持多数类的分类准确度. 展开更多
关键词 不平衡数据 分类 迁移学习 分类准确度 precision-recall曲线
下载PDF
基于“precision-recall”曲线分析的?高被引论文识别研究 被引量:2
2
作者 李信 程齐凯 《图书馆杂志》 CSSCI 北大核心 2019年第1期83-90,共8页
文章首先对高被引论文识别的现状、问题进行梳理和分析,在此基础上,选取地球物理学、计算机与自动化、力学、图书情报学和药学5个学科的90本中文核心期刊在2004-2016年间刊载的448 749篇研究文献,将高被引论文识别问题转化为信息检索问... 文章首先对高被引论文识别的现状、问题进行梳理和分析,在此基础上,选取地球物理学、计算机与自动化、力学、图书情报学和药学5个学科的90本中文核心期刊在2004-2016年间刊载的448 749篇研究文献,将高被引论文识别问题转化为信息检索问题,利用文献下载量(DS)和期刊引用分数(JCS)两个指标对高被引论文进行识别,并引入新的观测视角——"precisionrecall"曲线,对识别效果进行分析和可视化。结果表明,"precision-recall"曲线可以较好地对指标的高被引论文识别能力进行直观反映;文献下载量和期刊引用分数均可作为高被引论文识别指标,且文献下载量的高被引论文识别能力优于期刊引用分数。 展开更多
关键词 高被引论文“precision-recall曲线 文献下载量 期刊引用分数 补充指标
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部