Microblogging provides a new platform for com- municating and sharing information among Web users. Users can express opinions and record daily life using microblogs. Microblogs that are posted by users indicate their ...Microblogging provides a new platform for com- municating and sharing information among Web users. Users can express opinions and record daily life using microblogs. Microblogs that are posted by users indicate their interests to some extent. We aim to mine user interests via keyword extraction from microblogs. Traditional keyword extraction methods are usually designed for formal documents such as news articles or scientific papers. Messages posted by mi- croblogging users, however, are usually noisy and full of new words, which is a challenge for keyword extraction. In this paper, we combine a translation-based method with a frequency-based method for keyword extraction. In our ex- periments, we extract keywords for microblog users from the largest microblogging website in China, Sina Weibo. The re- suits show that our method can identify users' interests accu- rately and efficiently.展开更多
伴随着互联网的高速发展与普及,微博作为信息交流与传播的载体,已成为新型社会化媒体的代表。在中国,微博用户规模已经达到了2.42亿。微博用户影响力计算对社会日常信息在微博中有效传播、正确传播、健康传播有着非常重要的意义。以新...伴随着互联网的高速发展与普及,微博作为信息交流与传播的载体,已成为新型社会化媒体的代表。在中国,微博用户规模已经达到了2.42亿。微博用户影响力计算对社会日常信息在微博中有效传播、正确传播、健康传播有着非常重要的意义。以新浪微博数据为实验对象,通过改进传统的PageRank模型,提出了新的微博用户影响力排名算法——MBUI-Rank(micro-blog user influence rank)算法。该算法在传统的PageRank算法模型上加入了微博用户自身在微博中的行为活动,同时考虑到了微博用户的自身行为,结合用户权值得到最终影响力。实验结果表明,与传统的PageRank算法相比,MBUI-Rank算法可以更加真实有效地反映微博用户的实际影响力。展开更多
相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进...相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进行相似用户挖掘的方法。该方法首先使用TextRank话题提取方法对用户进行兴趣话题提取,再对用户发表内容进行训练,计算出所有词之间的相似度。提出CP(Corresponding Position similarity)、CPW(Corresponding Position Weighted similarity)、AP(All Position similarity)、APW(All Position Weighted similarity)四种用户兴趣话题词相似度计算方法,通过用户和相似用户间关注、粉丝重合率验证相似用户挖掘效果,APW similarity的相似用户的关注/粉丝重合百分比为1.687%,优于提出的其他三种算法,分别提高了26.3%、2.8%、12.4%,并且比传统的文本相似度方法 Jaccard相似度、编辑距离算法、余弦相似度分别提高了20.4%、21.2%、45.0%。因此APW方法可以更加有效地挖掘出用户的相似用户。展开更多
文摘Microblogging provides a new platform for com- municating and sharing information among Web users. Users can express opinions and record daily life using microblogs. Microblogs that are posted by users indicate their interests to some extent. We aim to mine user interests via keyword extraction from microblogs. Traditional keyword extraction methods are usually designed for formal documents such as news articles or scientific papers. Messages posted by mi- croblogging users, however, are usually noisy and full of new words, which is a challenge for keyword extraction. In this paper, we combine a translation-based method with a frequency-based method for keyword extraction. In our ex- periments, we extract keywords for microblog users from the largest microblogging website in China, Sina Weibo. The re- suits show that our method can identify users' interests accu- rately and efficiently.
文摘伴随着互联网的高速发展与普及,微博作为信息交流与传播的载体,已成为新型社会化媒体的代表。在中国,微博用户规模已经达到了2.42亿。微博用户影响力计算对社会日常信息在微博中有效传播、正确传播、健康传播有着非常重要的意义。以新浪微博数据为实验对象,通过改进传统的PageRank模型,提出了新的微博用户影响力排名算法——MBUI-Rank(micro-blog user influence rank)算法。该算法在传统的PageRank算法模型上加入了微博用户自身在微博中的行为活动,同时考虑到了微博用户的自身行为,结合用户权值得到最终影响力。实验结果表明,与传统的PageRank算法相比,MBUI-Rank算法可以更加真实有效地反映微博用户的实际影响力。
文摘相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进行相似用户挖掘的方法。该方法首先使用TextRank话题提取方法对用户进行兴趣话题提取,再对用户发表内容进行训练,计算出所有词之间的相似度。提出CP(Corresponding Position similarity)、CPW(Corresponding Position Weighted similarity)、AP(All Position similarity)、APW(All Position Weighted similarity)四种用户兴趣话题词相似度计算方法,通过用户和相似用户间关注、粉丝重合率验证相似用户挖掘效果,APW similarity的相似用户的关注/粉丝重合百分比为1.687%,优于提出的其他三种算法,分别提高了26.3%、2.8%、12.4%,并且比传统的文本相似度方法 Jaccard相似度、编辑距离算法、余弦相似度分别提高了20.4%、21.2%、45.0%。因此APW方法可以更加有效地挖掘出用户的相似用户。