期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Mahout的新用户推荐算法的设计与实现 被引量:3
1
作者 师智斌 《计算机工程与科学》 CSCD 北大核心 2015年第8期1444-1449,共6页
为了解决大数据背景下新用户因没有历史数据而导致推荐难和推荐效率低等问题,提出将基于Mahout的协同过滤算法与基于MapReduce的Top N算法相结合的技术方法,来实现新用户推荐算法,从而构建新用户推荐系统的架构,并对Hadoop Top N算法以... 为了解决大数据背景下新用户因没有历史数据而导致推荐难和推荐效率低等问题,提出将基于Mahout的协同过滤算法与基于MapReduce的Top N算法相结合的技术方法,来实现新用户推荐算法,从而构建新用户推荐系统的架构,并对Hadoop Top N算法以及Mahout中协同过滤算法进行设计与实现。理论分析和实验验证表明,该新用户推荐算法在推荐效率、对大规模数据处理的伸缩性以及推荐质量上都明显优于单独使用协同过滤算法的新用户推荐。 展开更多
关键词 新用户推荐 Mahout 推荐系统 HADOOP 大数据
下载PDF
一种包含属性蕴含语义的数据立方体结构 被引量:2
2
作者 师智斌 刘忠宝 《小型微型计算机系统》 CSCD 北大核心 2014年第5期1005-1009,共5页
为降低数据立方体结构的复杂度及提高数据立方体的查询效率,深入挖掘数据内部关系,研究包含属性蕴含语义的数据立方体构建和查询技术.通过研究从完整形式背景中获取属性蕴含语义以及由属性蕴含确定概念内涵的方法,提出包含前件是真前提... 为降低数据立方体结构的复杂度及提高数据立方体的查询效率,深入挖掘数据内部关系,研究包含属性蕴含语义的数据立方体构建和查询技术.通过研究从完整形式背景中获取属性蕴含语义以及由属性蕴含确定概念内涵的方法,提出包含前件是真前提的属性蕴含语义的数据立方体结构:SDC-AI,提出SDC-AI的构建、查询处理和增量维护方法.经过理论分析和实验验证,SDC-AI结构包含所有聚集概念,并记录基本表中的属性蕴含语义,使查询响应时间大大缩小,可用于主流的关系数据库系统. 展开更多
关键词 形式概念分析 语义 属性蕴 含真前提 数据立方体
下载PDF
基于Hadoop二阶段并行模糊c-Means数据聚类算法 被引量:2
3
作者 师智斌 《计算机测量与控制》 2015年第3期842-846,共5页
为了解决MapReduce机制下算法通信时间占用比过高实际应用价值受限的问题,提出了基于Hadoop二阶段并行c-Means聚类算法;首先,采用成员管理协议方式实现成员管理与MapReduce降低操作的同步化方法,改进MapReduce机制下的MPI通讯管理方法;... 为了解决MapReduce机制下算法通信时间占用比过高实际应用价值受限的问题,提出了基于Hadoop二阶段并行c-Means聚类算法;首先,采用成员管理协议方式实现成员管理与MapReduce降低操作的同步化方法,改进MapReduce机制下的MPI通讯管理方法;其次,实行典型个体组降低操作代替全局个体降低操作,并定义二阶段缓冲算法,通过第一阶段的缓冲进一步降低第二阶段MapReduce操作的数据量,尽可能降低大数据带来的对算法负面影响;通过仿真实验表明该算法在处理大数据上的性能表现较为优异;该算法在大规模数据集上的并行率和加速比都优于小型数据集上的表现,说明了该算法能够实时根据数据量的大小对自身进行调整。 展开更多
关键词 二阶段 模糊c—Means 大数据 数据聚类 HADOOP
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部