期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Spark的高效并行自动编码机 被引量:1
1
作者 庄福振 钱明达 +2 位作者 申恩 张大鹏 何清 《数据采集与处理》 CSCD 北大核心 2018年第1期65-74,共10页
机器学习中一个非常关键的问题就是如何获取良好的数据特征表示,许多经典的特征提取方法是基于数据间关系或利用简单线性组合降维后得到数据的特征表示。其中深度学习算法在各种学习任务中都可以取得良好的效果,而且可以学到很好的数据... 机器学习中一个非常关键的问题就是如何获取良好的数据特征表示,许多经典的特征提取方法是基于数据间关系或利用简单线性组合降维后得到数据的特征表示。其中深度学习算法在各种学习任务中都可以取得良好的效果,而且可以学到很好的数据特征表示。但现有深度学习算法或模型大多为单机串行实现,不能处理较大规模的数据且运行时间较长。本文设计实现了一种基于Spark分布式平台的高效并行自动编码机,该编码机可以有效地进行特征表示学习,并且利用分布式计算平台Spark对算法进行加速,优化了对稀疏数据的操作,大大提升了运行效率。本文通过在文本数据特征学习以及协同过滤两个任务上的实验,表明本文所实现的并行自动编码机的有效性和高效性。 展开更多
关键词 自动编码机 SPARK 机器学习 深度学习 特征学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部