融合SOM功能聚类与DeepFM质量预测的API服务推荐方法被引量：23

An API Service Recommendation Method via Combining Self-Organization Map-Based Functionality Clustering and Deep Factorization Machine-Based Quality Prediction

下载PDF

导出

摘要由于越来越多的企业和组织纷纷将自己的业务、数据或资源封装成服务,并通过API的形式发布到互联网上,API服务的数量呈现倍增趋势.在此背景下,如何从这样一个大规模的API服务集合中,快速有效地找到满足开发者用户Mashup需求的API服务,已成为一个挑战性问题.为此,本文聚焦于“推荐合适的API服务以构建高质量Mashup应用”问题,以面向服务内容的功能聚类为基础,结合基于多维服务质量的评分预测,提出一种融合SOM功能聚类与DeepFM质量预测的API服务推荐方法,用于创建高质量的Mashup应用.该方法首先采用Wikipedia 作为外部语料库扩充API服务文档的内容并利用HDP模型建模其主题分布.通过WikiExtractor抽取出Wikipedia中的语料数据,并利用Word2vec工具训练该语料数据获得其词向量模型.利用训练好的Wikipedia词向量模型对API服务描述文档进行扩充.针对扩充后的API服务文档,使用HDP主题建模技术,挖掘出其隐含的主题信息,自动确定最优主题个数,以准确地度量API服务文档之间的语义相似度.然后,采用SOM神经网络进行面向主题的API服务聚类.在HDP主题建模之后,对获得的“API服务文档-主题”向量采用SOM神经网络聚类算法进行主题聚类,通过自组织过程,将众多的API服务划分到不同的功能类簇中,每一个功能类中包含多个具有相似功能的API服务.接下来,针对API服务类簇中所有具有相似功能的API服务,利用DeepFM模型建模和挖掘其多维QoS属性之间的复杂交互关系,预测并排序API服务的质量得分.DeepFM模型自动地提取出QoS数据中(包括流行度、共现次数等)的有效的特征组合关系(包括高阶特征和低阶特征组合关系),预测并排序每一个API服务相对于目标Mashup应用的质量得分,推荐得分靠前的 N 个API服务给开发者用户.最后,在真实Web服务数据集上进行了实验比较与分析,实验结果表明:本文� More and more enterprises and organizations encapsulate their business, data or resources as API services and publish then on Internet, and the number of API services is growing fast. In this context, to find API services quickly and effectively that meets Mashup requirements of developers from such a large collection of API services, has become a challenging problem. To address this problem, aiming to the issue of recommending appropriate API services to build high-quality Mashup applications, on top of service content-oriented functionality clustering and score prediction of quality of service with multi-dimension, an API service recommendation method via combining self-organization map-based functionality clustering and deep factorization machine - based quality prediction, is proposed in this paper to create novel Mashup applications with high-quality. This method, firstly uses Wikipedia as an external corpus to expand the contents of API service documents and models their topic distribution by adopting HDP model. WikiExtractor is used to extract corpus data from Wikipedia, and Word2vec tool is exploited to train the corpus data to obtain its word vector model. The trained Wikipedia word vector is regarded as the extension source of API service documents. As for the extended API service documents, hierarchical Dirichlet processes topic modeling technology is deployed to mine their implicit topic information, which automatically identifies the optimal number of topics to accurately measure semantic similarity between API service documents. Then, it exploits SOM neural network to cluster API services into various clusters with similar topic and functionality. After HDP topic modeling, the derived vector of API service document-topic is clustered with different topics by using the clustering algorithm of self-organization map-based neural network. That is to say, numerous API services are divided into different clusters through self-organizing process, each of which contains multiple API services with similar fu

作者曹步清肖巧翔张祥平刘建勋 CAO Bu-Qing;XIAO Qiao-Xiang;ZHANG Xiang-Ping;LIU Jian-Xun(School of Computer Science and Engineering, Hunan University of Science and Technology, Xiangtan, Hunan 411201)

机构地区湖南科技大学计算机科学与工程学院

出处《计算机学报》 EI CSCD 北大核心 2019年第6期1367-1383,共17页 Chinese Journal of Computers

基金国家自然科学基金(61873316,61872139,61772193,61702181) 湖南省自然科学基金(2017JJ2098,2017JJ4036,2018JJ2139,2018JJ2136)资助~~

关键词 API推荐 Mashup应用 HDP主题模型 SOM神经网络深度因子分解机 API recommendation Mashup application Hierarchical Dirichlet Processes topic model Self-Organizing Map-based neural network deep factorization machine

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1田刚,何克清,王健,孙承爱,徐建建.面向领域标签辅助的服务聚类方法[J].电子学报,2015,43(7):1266-1274. 被引量：30
2TIAN Gang,WANG Jian,HE Keqing,SUN Cheng'ai.Leveraging Auxiliary Knowledge for Web Service Clustering[J].Chinese Journal of Electronics,2016,25(5):858-865. 被引量：5
3李征,王健,张能,李昭,何成万,何克清.一种面向主题的领域服务聚类方法[J].计算机研究与发展,2014,51(2):408-419. 被引量：17

二级参考文献23

1叶蕾,张斌.基于功能语义的Web服务发现方法[J].计算机研究与发展,2007,44(8):1357-1364. 被引量：24
2L-J Zhang,J Zhang,H Cai.Services Computing[M].Beijing:Tsinghua University,2007. 被引量：1
3Chen Liang,Hu Liukai,Zheng Zibin,et al.WTCluster:Utilizing tags for Web services clustering[A].Proceedings of International Conference on Service-Oriented Computing[C].Berlin:Springer,2011.204-218. 被引量：1
4Elgazzar K,Hassan A E,Martin P.Clustering WSDL documents to bootstrap the discovery of web services[A].Proceedings of International Conference on Web Services[C].USA:Piscataway,2010.147-154. 被引量：1
5Yu Q,Rege M.On service community learning:A co-clustering approach[A].Proceedings of IEEE International Conference on Web Services[C].USA:Piscataway,2010.283-290. 被引量：1
6Liu Jianxiao,He Keqing,Wang Jian,et al.A clustering method for web service discovery[A].Proceedings of International Conference on Services Computing[C].USA:Piscataway,2011.729-730. 被引量：1
7Cassar G,Barnaghi P,Moessner K.Probabilistic methods for service clustering[A].Proceedings of International Workshop on Semantic Web Service Matchmaking and Resource Retrieval[C].Shanghai:SRI,2010.4-20. 被引量：1
8Blei D M,Ng A Y,Jordan M I.Latent dirichlet allocation[J].Journal of Machine Learning Research,2003,3(2):993-1022. 被引量：1
9Rosen-Zvi M,Griths T,Steyvers M,Smyth P.The author-topic model for authors and documents[A].Proceedings of the 20th Conference on Uncertainty in Artificial Intelligence[C].USA:UAI,2004.487-494. 被引量：1
10Wang Jian,Zhang Jia,Hung P C K,et al.Leveraging fragmental semantic data to enhance services discovery[A].Proceedings of the 13th International Conference on High Performance Computing and Communications[C].Piscataway,NJ:IEEE,2011.687-694. 被引量：1

共引文献41

1赵一,李昭,陈鹏,何泾沙,何克清.一种面向领域的Web服务语义聚类方法[J].小型微型计算机系统,2019,40(1):81-88. 被引量：5
2田刚,何克清,王健,孙承爱,徐建建.面向领域标签辅助的服务聚类方法[J].电子学报,2015,43(7):1266-1274. 被引量：30
3田刚,何克清,高莹,黄颖.迁移知识辅助的语义稀疏服务聚类方法[J].四川大学学报（工程科学版）,2015,47(5):116-122. 被引量：1
4郑杰.舰载网络中未知协议识别方法研究与仿真[J].舰船科学技术,2015,37(9):166-170.
5耿德志.基于聚类权重调度的大数据采样技术[J].世界有色金属,2015,40(12):93-95.
6周小榛,邹美蓉.嵌入式冶金系统下数据结构优化存储设计[J].世界有色金属,2015,40(12):124-126.
7刘炜.基于线性调频盲卷积的大数据聚类控制方法[J].电力与能源,2015,36(6):822-825.
8陈志椿.基于时频熵的放电脉冲取特征提取算法[J].电力与能源,2015,36(6):826-830.
9叶骏宏,王勇,强保华.基于Lucene的Web服务查询系统设计与实现[J].桂林电子科技大学学报,2016,36(1):29-34.
10陈红玉,孟彩霞.基于相干函数无偏估计的数据恢复技术[J].科技通报,2016,32(3):105-108. 被引量：4

同被引文献121

1郅志刚,郭齐胜,孟庆均,吕良栋.基于WER的指挥信息系统功能需求指标体系构建方法[J].装甲兵工程学院学报,2007,21(1):13-16. 被引量：2
2童红霞,曹健,张申生,章义,傅一峰.面向服务的Agent模型研究[J].广西师范大学学报（自然科学版）,2008,26(2):110-113. 被引量：2
3焦玉英,袁静.基于情景模型的数字图书馆个性化服务研究[J].中国图书馆学报,2008(6):58-63. 被引量：33
4宋恩梅,袁琳.移动的书海：国内移动图书馆现状及发展趋势[J].中国图书馆学报,2010,36(5):34-48. 被引量：276
5胡慕海,蔡淑琴,张宇,谭婷婷.情境化信息推荐机制的研究[J].情报学报,2011,30(10):1053-1064. 被引量：21
6涂丹丹,舒承椿,余海燕.基于联合概率矩阵分解的上下文广告推荐算法[J].软件学报,2013,24(3):454-464. 被引量：50
7张李义,殷聪.面向知识挖掘的情境感知应用研究综述[J].图书情报工作,2013,57(5):140-146. 被引量：6
8张秀伟,何克清,王健,刘建晓.Web服务个性化推荐研究综述[J].计算机工程与科学,2013,35(9):132-140. 被引量：14
9柴变芳,于剑,贾彩燕,王静红.一种基于随机块模型的快速广义社区发现算法[J].软件学报,2013,24(11):2699-2709. 被引量：10
10李征,王健,张能,李昭,何成万,何克清.一种面向主题的领域服务聚类方法[J].计算机研究与发展,2014,51(2):408-419. 被引量：17

引证文献23

1刘海鸥,黄文娜,姚苏梅,佟林杰.基于深度学习的移动图书馆用户画像情境化推荐[J].图书馆学研究,2019,0(21):57-64. 被引量：20
2李智君.基于协同过滤算法的室内设计推荐技术[J].现代电子技术,2020,43(13):176-179. 被引量：1
3陈彬,张荣梅,张琦.DCFM:基于深度学习的混合推荐模型[J].计算机工程与应用,2021,57(3):150-155. 被引量：11
4唐海贤,李光辉.基于C-LSTM的传感器数据流半监督在线异常检测算法[J].传感技术学报,2021,34(3):330-339. 被引量：7
5陆佳炜,吴涵,张元鸣,梁倩卉,肖刚.融合功能语义关联计算与密度峰值检测的Mashup服务聚类方法[J].计算机学报,2021,44(7):1501-1515. 被引量：9
6胡强,沈嘉吉,荆广辉,杜军威.基于描述语境特征词与改进GSDMM模型的服务聚类方法[J].通信学报,2021,42(8):176-187. 被引量：7
7陈明,高铁梁,张志锋,季肖辉,唐启光.基于用户多兴趣的服务流程推荐方法[J].计算机集成制造系统,2021,27(9):2701-2707. 被引量：2
8路凯峰,杨溢龙,李智.一种基于BERT和DPCNN的Web服务分类方法[J].广西师范大学学报（自然科学版）,2021,39(6):87-98. 被引量：8
9高文斌,董晨辰,王睿,胡谷雨.基于QoS感知的Web服务推荐算法综述[J].计算机时代,2022(3):1-4. 被引量：1
10郭炳,邓丽平.一种基于主题相似性的Mashup服务聚类方法研究[J].电脑编程技巧与维护,2022(3):22-23.

二级引证文献75

1陈金山.基于密度峰值的电子商务用户行为数据聚类方法[J].哈尔滨师范大学自然科学学报,2023,39(4):65-69.
2刘海鸥,姚苏梅,黄文娜,苏妍嫄.移动图书馆用户画像大数据应用的困境与对策——基于区块链理念[J].图书馆学研究,2019(23):26-33. 被引量：23
3张弸,李强.基于情景要素适配的高校图书馆资源推荐服务研究[J].数字图书馆论坛,2020(8):42-47. 被引量：8
4胡淏嵎,徐延章,缪海燕.基于用户体验的智慧图书馆服务设计研究[J].美与时代（创意）（上）,2020(7):25-27. 被引量：1
5刘海鸥,黄文娜,张源强,苏妍嫄.移动社交网络情境化推荐关键问题研究综述[J].小型微型计算机系统,2020,41(9):1812-1819. 被引量：5
6李菲菲,何柯,王喜.深度学习技术在智慧图书馆建设中的应用研究[J].内蒙古科技与经济,2020(22):157-159. 被引量：2
7徐延章.乡村振兴战略中公共文化传播策略[J].图书馆,2020(12):8-13. 被引量：22
8杨忠.面向视听体验的“5G+学习情境”研究[J].新世纪图书馆,2020(12):34-41. 被引量：1
9余艳娜.移动图书馆数字资源情境化推荐路径研究[J].图书馆研究与工作,2021(2):43-47. 被引量：4
10徐延章.算法赋能:移动阅读的智慧体验进化策略[J].出版发行研究,2021(3):54-60. 被引量：14

1代金晶.基于Mashup的大学生个人学习环境构建研究[J].图书馆研究,2017,47(5):81-85. 被引量：1
2罗立群,李广建.智慧情报服务与知识融合[J].情报资料工作,2019,40(2):87-94. 被引量：40
3周华.动态心电图与常规心电图在冠心病心律失常诊断中的对比分析[J].医学信息,2017,30(2):284-285. 被引量：3
4王晓耘,李贤,袁媛.基于因子分解机和隐马尔可夫的推荐算法[J].计算机技术与发展,2019,29(6):85-89. 被引量：2
5丁华杰,叶云,高强,钟英英.白藜芦醇处理乳腺癌细胞基因表达通路分析[J].广西科技大学学报,2019,30(2):79-85. 被引量：6
6常艳艳.基于知识图谱的阅读习惯研究[J].科教导刊,2019(8):156-157.
7沈冬明,严春霞,李虎.血清同型半胱氨酸与胱抑素C检测在妊娠期高血压疾病中的应用价值[J].海南医学,2019,30(10):1319-1321. 被引量：18
8吴浩,彭亦楠,何鹏,黄权.基于利用可靠用户网络补充标签的服务推荐[J].物联网技术,2019,9(2):48-51.
9刘怀昌,肖磊,徐智立,谈炯新,李妙根,李蕊,张晓婷,冯任维,刘正平.妊娠期高血压疾病对孕妇动脉弹性和血管内皮功能的影响[J].中华高血压杂志,2019,27(4):372-375. 被引量：65
10成天龙,许维胜.基于微服务架构的一体化教务系统研究[J].中国教育信息化,2019,25(5):73-77. 被引量：7

计算机学报

2019年第6期

浏览历史

内容加载中请稍等...

融合SOM功能聚类与DeepFM质量预测的API服务推荐方法被引量：23

参考文献3

二级参考文献23

共引文献41

同被引文献121

引证文献23

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

融合SOM功能聚类与DeepFM质量预测的API服务推荐方法 被引量：23

参考文献3

二级参考文献23

共引文献41

同被引文献121

引证文献23

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

融合SOM功能聚类与DeepFM质量预测的API服务推荐方法被引量：23