期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
短文本相似度研究及其在微博话题检测中的应用 被引量:11
1
作者 黄贤英 陈红阳 刘英涛 《计算机工程与设计》 北大核心 2015年第11期3128-3133,共6页
针对微博短文本特征稀疏导致文本相似性度量不精确的问题,提出一种基于多视角的微博短文本相似度算法。根据词形相同与词义相近寻找微博短文本中的公共块,以公共块所含词项总数与公共块之间的组合顺序,构建基于公共块序列的语义相似度;... 针对微博短文本特征稀疏导致文本相似性度量不精确的问题,提出一种基于多视角的微博短文本相似度算法。根据词形相同与词义相近寻找微博短文本中的公共块,以公共块所含词项总数与公共块之间的组合顺序,构建基于公共块序列的语义相似度;利用微博短文本发布时间、转发与评论等信息来修正该语义相似度,形成新的微博短文本相似度算法,度量微博短文本之间的相似性;将新的微博短文本相似度算法融入Single-Pass聚类算法中以检测微博话题。实验结果表明,将该算法应用于微博话题检测时,能够有效降低话题检测的平均漏检率与误检率等,提高了话题检测的质量。 展开更多
关键词 微博短文本相似度 微博话题检测 结构化信息 公共序列 语义相似度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部