期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
针对大规模动态图流三角形计数的边哈希分布式抽样算法
1
作者
何玉林
吴波
+2 位作者
吴定明
黄哲学
菲律普弗尼尔-
维格
《计算机研究与发展》
EI
CSCD
北大核心
2024年第8期1882-1903,共22页
三角形计数是大图分析的一个经典问题,近年的研究工作主要集中在针对静态流式图的三角形数量估计上,相关流式图抽样算法只能处理边的插入操作,无法处理边的删除操作;而现有的动态流式图抽样算法估计准确性又偏低.针对上述问题,提出了基...
三角形计数是大图分析的一个经典问题,近年的研究工作主要集中在针对静态流式图的三角形数量估计上,相关流式图抽样算法只能处理边的插入操作,无法处理边的删除操作;而现有的动态流式图抽样算法估计准确性又偏低.针对上述问题,提出了基于边哈希分配的分布式抽样(edge hashing assignmentbased distributed sampling,EHADS)算法,它是一个用于估计动态流式图中三角形数量的分布式流算法,可以快速准确地估计动态流式图中的全局三角形数量以及每个顶点的局部三角形数量.EHADS算法只对输入的图流进行1次处理,并在多台机器上对边进行抽样.与先进的单机流算法相比,EHADS算法具有2点优势:1)在相同样本容量的情况下,EHADS算法以更短的运行时间获得了更小的估计误差,估计全局三角形数量的误差平均降低了31.79%,估计局部三角形数量的误差平均降低了23.35%;2)EHADS算法能够提供流式图中三角形数量的无偏估计,并且严格的数学证明显示该无偏估计具有更小的方差.
展开更多
关键词
三角形计数
动态图流
边抽样
分布式流算法
边哈希分配
下载PDF
职称材料
自训练新类探测半监督学习算法
2
作者
何玉林
陈佳琪
+2 位作者
黄启航
菲律普弗尼尔-
维格
黄哲学
《计算机科学与探索》
CSCD
北大核心
2023年第9期2184-2197,共14页
传统的半监督学习算法(SSL)存在适用范围有限和泛化能力不足的缺陷,尤其是当训练数据集中出现未见标签的新类样本时,算法的性能将在很大程度上受到影响。基于人工标注的有标记样本获取方式需要领域专家的参与,消耗了高昂的时间和财力成...
传统的半监督学习算法(SSL)存在适用范围有限和泛化能力不足的缺陷,尤其是当训练数据集中出现未见标签的新类样本时,算法的性能将在很大程度上受到影响。基于人工标注的有标记样本获取方式需要领域专家的参与,消耗了高昂的时间和财力成本,且由于专家背景知识的局限,无法避免标记过程中的人为错标现象。为此,以提高对未见标签样本标注正确性为出发点的半监督学习算法具有迫切的实际需要。在对自训练算法进行了详细剖析之后,提出了一种有效的新类探测半监督学习算法(NCD-SSL)。首先,基于经典的极限学习机模型,构造了可处理标签增量和样本增量学习的通用增量极限学习机;然后,对自训练算法进行改进,利用标注可信度高的样本进行样本增量学习,同时设置了缓存池用以存储标注可信度低的样本;之后,使用聚类和分布一致性判定方法进行新类探测,进而实现类增量学习;最后,在仿真数据集和真实数据集上对提出算法的可行性和有效性进行了实验验证,实验结果显示在缺失类别数为3、2、1时,新算法的测试精度普遍比其他6种半监督学习算法高出30、20、10个百分点左右,从而证实了提出的算法能够获得更好的新类探测半监督学习表现。
展开更多
关键词
半监督学习(SSL)
新类探测
自训练
极限学习机
最大平均差异
分布一致性
下载PDF
职称材料
题名
针对大规模动态图流三角形计数的边哈希分布式抽样算法
1
作者
何玉林
吴波
吴定明
黄哲学
菲律普弗尼尔-
维格
机构
人工智能与数字经济广东省实验室(深圳)
深圳大学计算机与软件学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第8期1882-1903,共22页
基金
广东省自然科学基金项目(2314050006683)
深圳市基础研究重点项目(JCYJ20220818100205012)
深圳市基础研究项目(JCYJ20210324093609026)。
文摘
三角形计数是大图分析的一个经典问题,近年的研究工作主要集中在针对静态流式图的三角形数量估计上,相关流式图抽样算法只能处理边的插入操作,无法处理边的删除操作;而现有的动态流式图抽样算法估计准确性又偏低.针对上述问题,提出了基于边哈希分配的分布式抽样(edge hashing assignmentbased distributed sampling,EHADS)算法,它是一个用于估计动态流式图中三角形数量的分布式流算法,可以快速准确地估计动态流式图中的全局三角形数量以及每个顶点的局部三角形数量.EHADS算法只对输入的图流进行1次处理,并在多台机器上对边进行抽样.与先进的单机流算法相比,EHADS算法具有2点优势:1)在相同样本容量的情况下,EHADS算法以更短的运行时间获得了更小的估计误差,估计全局三角形数量的误差平均降低了31.79%,估计局部三角形数量的误差平均降低了23.35%;2)EHADS算法能够提供流式图中三角形数量的无偏估计,并且严格的数学证明显示该无偏估计具有更小的方差.
关键词
三角形计数
动态图流
边抽样
分布式流算法
边哈希分配
Keywords
triangle counting
dynamic graph stream
edge sampling
distributed streaming algorithm
edge hashing assignment
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
自训练新类探测半监督学习算法
2
作者
何玉林
陈佳琪
黄启航
菲律普弗尼尔-
维格
黄哲学
机构
深圳大学计算机与软件学院
人工智能与数字经济广东省实验室(深圳)
出处
《计算机科学与探索》
CSCD
北大核心
2023年第9期2184-2197,共14页
基金
国家自然科学基金面上项目(61972261)
广东省自然科学基金面上项目(2023A1515011667)
+1 种基金
深圳市基础研究重点项目(JCYJ20220818100205012)
深圳市基础研究面上项目(JCYJ20210324093609026)。
文摘
传统的半监督学习算法(SSL)存在适用范围有限和泛化能力不足的缺陷,尤其是当训练数据集中出现未见标签的新类样本时,算法的性能将在很大程度上受到影响。基于人工标注的有标记样本获取方式需要领域专家的参与,消耗了高昂的时间和财力成本,且由于专家背景知识的局限,无法避免标记过程中的人为错标现象。为此,以提高对未见标签样本标注正确性为出发点的半监督学习算法具有迫切的实际需要。在对自训练算法进行了详细剖析之后,提出了一种有效的新类探测半监督学习算法(NCD-SSL)。首先,基于经典的极限学习机模型,构造了可处理标签增量和样本增量学习的通用增量极限学习机;然后,对自训练算法进行改进,利用标注可信度高的样本进行样本增量学习,同时设置了缓存池用以存储标注可信度低的样本;之后,使用聚类和分布一致性判定方法进行新类探测,进而实现类增量学习;最后,在仿真数据集和真实数据集上对提出算法的可行性和有效性进行了实验验证,实验结果显示在缺失类别数为3、2、1时,新算法的测试精度普遍比其他6种半监督学习算法高出30、20、10个百分点左右,从而证实了提出的算法能够获得更好的新类探测半监督学习表现。
关键词
半监督学习(SSL)
新类探测
自训练
极限学习机
最大平均差异
分布一致性
Keywords
semi-supervised learning(SSL)
new class detection
self-training
extreme learning machine
maximum mean discrepancy
distribution consistency
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
针对大规模动态图流三角形计数的边哈希分布式抽样算法
何玉林
吴波
吴定明
黄哲学
菲律普弗尼尔-
维格
《计算机研究与发展》
EI
CSCD
北大核心
2024
0
下载PDF
职称材料
2
自训练新类探测半监督学习算法
何玉林
陈佳琪
黄启航
菲律普弗尼尔-
维格
黄哲学
《计算机科学与探索》
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部