基于聚类和高斯LDA的服务发现方法

Service Discovery Method Based on Clustering and Gaussian LDA

导出

摘要服务发现研究面临两个主要问题:(1)Web服务数量大量增长,服务管理和匹配难度大;(2)API市场中用户常用的基于搜索引擎的服务发现,存在用户查询语义稀疏问题。针对这两个挑战,提出了一种基于聚类和高斯LDA的服务发现方法。该方法首先使用Doc2Vec将服务数据集映射为服务段落向量,接着用K-Means++聚类方法对服务向量聚类。然后,使用Word2Vec生成的上下文信息来扩展用户查询和丰富服务描述,然后将服务描述加载到高斯LDA中获取服务描述表示。最后,按照服务描述表示和扩展的服务查询之间的概率相关性对服务进行排序。实验结果表明,该服务发现模型在Precision@5,Recall@50,F-Measure@50实验结果优于TFIDF-K,LDA,Doc2Vec-K、GLDA-QE方法,提高了查询服务搜索的准确性。 There are two main problems in the research of service discovery:(1) The number of Web services is increasing rapidly, and the service management and matching are difficult;(2) The service discovery based on search engine commonly used by users in API market has the problem of user query semantic sparseness. Aiming at these two challenges, this paper proposes a service discovery method based on clustering and Gaussian LDA. Firstly, Doc2 Vec is used to map the service dataset to service paragraph vector, and then K-means++ clustering method is used to cluster the service vector. Then, the context information generated by Word2 Vec is used to extend the users’ query and enrich the service description, and then the service description is loaded into the Gaussian LDA to obtain the service description representation. Finally, the services are sorted according to the probability correlation between the service description representation and the extended service query. The experimental results show that the service discovery model in the Precision@5, Recall@50, F-Measure@50 are superior to the TFIDF-K, LDA, Doc2 Vec-K and GLDA-QE methods, which improves the accuracy of the query service search.

作者唐菊聂彤羽 TANG Ju;NIE Tongyu(Sichuan Instrument Industry School,Chongqing 400702,China;School of Bigdata and Software Engineering,Chongqing University 400044,China)

机构地区四川仪表工业学校重庆大学大数据与软件学院

出处《自动化与仪器仪表》 2022年第12期36-43,50,共9页 Automation & Instrumentation

关键词服务发现聚类语义稀疏高斯LDA 词嵌入 service discovery clustering semantic sparseness Gaussian LDA word embedding

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1曹步清,肖巧翔,张祥平,刘建勋.融合SOM功能聚类与DeepFM质量预测的API服务推荐方法[J].计算机学报,2019,42(6):1367-1383. 被引量：23
2石敏,刘建勋,周栋,曹步清,文一凭.基于多重关系主题模型的Web服务聚类方法[J].计算机学报,2019,42(4):820-836. 被引量：19
3孟仕林,赵蕴龙,关东海,翟象平.融合情感与语义信息的情感分析方法[J].计算机应用,2019,39(7):1931-1935. 被引量：14

二级参考文献9

1李征,王健,张能,李昭,何成万,何克清.一种面向主题的领域服务聚类方法[J].计算机研究与发展,2014,51(2):408-419. 被引量：17
2赵国栋,周莹,宋丽亚.基于半监督ISHC层次描述的Mashup服务聚类[J].吉林大学学报（理学版）,2015,53(4):698-704. 被引量：1
3田刚,何克清,王健,孙承爱,徐建建.面向领域标签辅助的服务聚类方法[J].电子学报,2015,43(7):1266-1274. 被引量：30
4TIAN Gang,WANG Jian,HE Keqing,SUN Cheng'ai.Leveraging Auxiliary Knowledge for Web Service Clustering[J].Chinese Journal of Electronics,2016,25(5):858-865. 被引量：5
5丁晟春,吴靓婵媛,李红梅.基于SVM的中文微博观点倾向性识别[J].情报学报,2016,35(12):1235-1243. 被引量：21
6赵刚,徐赞.基于机器学习的商品评论情感分析模型研究[J].信息安全研究,2017,3(2):166-170. 被引量：17
7何炎祥,孙松涛,牛菲菲,李飞.用于微博情感分析的一种情感语义增强的深度学习模型[J].计算机学报,2017,40(4):773-790. 被引量：131
8於雯,周武能.基于LSTM的商品评论情感分析[J].计算机系统应用,2018,27(8):159-163. 被引量：18
9吴鹏,应杨,沈思.基于双向长短期记忆模型的网民负面情感分类研究[J].情报学报,2018,37(8):845-853. 被引量：36

共引文献45

1杨丹,张梦,朱毅.基于深度学习的中文情感分析研究[J].电脑知识与技术,2019,15(7X):188-190. 被引量：1
2刘海鸥,黄文娜,姚苏梅,佟林杰.基于深度学习的移动图书馆用户画像情境化推荐[J].图书馆学研究,2019,0(21):57-64. 被引量：20
3陈平平,耿笑冉,邹敏,谭定英.基于机器学习的文本情感倾向性分析[J].计算机与现代化,2020,0(3):77-81. 被引量：14
4夏丽华,韩冬梅.面向社交媒体评论的子话题挖掘研究[J].情报杂志,2020,39(4):110-116. 被引量：5
5李智君.基于协同过滤算法的室内设计推荐技术[J].现代电子技术,2020,43(13):176-179. 被引量：1
6张忠林,李林川,朱向其,马海云.ON-LSTM和自注意力机制的方面情感分析[J].小型微型计算机系统,2020,41(9):1839-1844. 被引量：13
7贾莉,江涛,马宁,孟家豪.一种融合性格线索的微博情感分类[J].云南大学学报（自然科学版）,2020,42(5):870-876. 被引量：2
8Yong Huang,Siwei Liu,Liangdong Qu,Yongsheng Li.Effective Vietnamese Sentiment Analysis Model Using Sentiment Word Embedding and Transfer Learning[J].国际计算机前沿大会会议论文集,2020(2):36-46.
9陈彬,张荣梅,张琦.DCFM:基于深度学习的混合推荐模型[J].计算机工程与应用,2021,57(3):150-155. 被引量：11
10邹德芳,胡秦斌.基于树到串模型强化的神经机器翻译模型构建[J].计算机仿真,2021,38(2):344-347. 被引量：3

1Последствия отказа США от монетарной политики QE[J].中国（俄文版）,2014(2):5-5.
2吴迪,李婷,万琴.基于背景先验与中心先验的显著性目标检测[J].光电子．激光,2022,33(8):799-806. 被引量：2
3高宇,冷锋,李萌,朱江,邵轶旭,罗微.基于上下游转录调控的特征数据识别关键microRNA[J].自动化与仪器仪表,2022(11):22-26. 被引量：2
4姚红革,董泽浩,喻钧,白小军.深度EM胶囊网络全重叠手写数字识别与分离[J].自动化学报,2022,48(12):2996-3005. 被引量：3
5邓涵铖,熊德意.机器翻译译文质量估计综述[J].中文信息学报,2022,36(11):20-37. 被引量：6
6卢美华,高晓波.形式无约束下偏好集映射、拓扑交和一致性[J].江西师范大学学报（自然科学版）,2022,46(6):610-616. 被引量：1
7赵峰涛.基于协同过滤算法的高校图书书目推荐系统设计[J].微型电脑应用,2022,38(12):67-69. 被引量：1
8李想,特日根,赵宇恒,陈文韬,徐国成.针对遥感影像的MSA-YOLO储油罐目标检测[J].电子技术应用,2022,48(11):24-32.
9王孝平,冯奕鹏,陈红云.农村地区家庭医生签约服务研究现状分析[J].中国农村卫生事业管理,2022,42(11):801-806. 被引量：9
10何玉平,袁贤,胡军平,李未,黄海宾.非晶硅/晶体硅异质结太阳能电池结构设计研究[J].南昌工程学院学报,2022,41(6):97-101.

自动化与仪器仪表

2022年第12期

浏览历史

内容加载中请稍等...

基于聚类和高斯LDA的服务发现方法

参考文献3

二级参考文献9

共引文献45

相关作者

相关机构

相关主题

浏览历史