-
题名基于社交网络分析和LDA主题挖掘的短文本挖掘研究
被引量:5
- 1
-
-
作者
武帅
施奕
杨秀璋
项美玉
-
机构
贵州财经大学信息学院
涟水县高层次人才发展中心
贵州财经大学贵阳大数据金融学院
-
出处
《现代电子技术》
2022年第20期124-128,共5页
-
基金
贵州省科技计划项目(黔科合基础[2019]1041)
贵州省科技计划项目(黔科合基础[2019]1403)
+4 种基金
贵州省科技计划项目(黔科合基础[2020]1Y279)
贵州省科技计划项目(黔科合基础[2020]1Y420)
贵州省教育厅青年科技人才成长项目(黔教合KY字[2016]175
黔教合KY字[2021]135)
贵州财经大学2019年度校级项目(2019XQN01)。
-
文摘
随着自媒体技术的不断发展,如何高效挖掘短文本数据信息已成为现阶段的研究重点。传统主题挖掘方法进行短文本数据分析时,仅考虑单位词出现频率进行判断,未考虑语义关联结构信息,分析效果欠佳。针对短文本数据的稀缺性,文中提出一种基于社交网络分析和LDA的主题挖掘分析模型。首先结合共词分析算法,分析不同文档间主题词的关系;然后结合社交网络分析算法,提高共词网络主题词耦合度;再借助隐含空间模型对共词网络进行降维,提高社交网络耦合性;最后结合隐含位置聚类算法发掘潜在社区,提高主题识别效果。实验结果表明,所提方法能够在一定程度上优化主题挖掘算法在识别短文本主题的效果,便于进行短文本研究,具有实用价值,也可为后续应用于前沿主题识别提供参考。
-
关键词
LDA主题挖掘
共词分析
社交网络分析
短文本挖掘
隐含空间模型
隐含位置聚类
主题识别
吉布斯抽样
-
Keywords
LDA topic mining
co-word analysis
social network analysis
short text mining
implicit space model
hidden location clustering
frontier theme recognition
Gibbs sampling
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP391
[电子电信—信息与通信工程]
-