-
题名基于逻辑回归的微博用户可信度建模
被引量:8
- 1
-
-
作者
徐建民
粟武林
吴树芳
武晓波
-
机构
河北大学数学与计算机学院
河北大学管理学院
-
出处
《计算机工程与设计》
北大核心
2015年第3期772-777,共6页
-
基金
河北省自然科学基金项目(F2011201146)
-
文摘
针对微博虚假用户问题,以新浪微博为研究平台,对微博用户的行为进行分析,从在线时长、发帖时间、互动程度等方面,提取用于区分用户类别的特征变量,运用逻辑回归算法,提出一个基于逻辑回归的微博用户可信度评价模型。实验结果表明,该模型能够对传统的虚假用户"僵尸粉"进行识别,对新型虚假用户有较高的识别率,可以根据置信值的大小对用户进行大致分类,实用性较强。
-
关键词
微博
逻辑回归
可信度
虚假用户
僵尸粉
-
Keywords
micro-blog
logistic regression
reliability
fake users
zombie fans
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于WB-MMSB模型的微博网络社区发现
被引量:1
- 2
-
-
作者
徐建民
武晓波
吴树芳
粟武林
-
机构
河北大学数学与计算机学院
河北大学管理学院
-
出处
《计算机科学》
CSCD
北大核心
2015年第3期65-70,共6页
-
基金
中国博士后科学基金项目(20070420700)
河北省自然科学基金项目(F2011201146)资助
-
文摘
提出了一个用于微博网络社区发现的模型WB-MMSB,该模型考虑了微博网络中节点存在的单向关系,节点的社区隶属度从链入主题隶属度和链出主题隶属度两个方面表示。用指数族分布和平均场变分推理方法推导了模型中各变量的表示,并用SVI算法计算模型涉及的参数。实验在新浪微博数据集上进行,采用归一化互信息和困惑度进行评估,结果表明,WB-MMSB模型的社区发现能力优于aMMSB模型,并且其收敛速度快于aMMSB模型。
-
关键词
微博网络
社区发现
混合隶属度随机块模型
重叠社区
-
Keywords
Micro-blog network
Community detection
Mixed membership stochastic block model
Overlapping commu-nities
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于词义降维的主题特征选择算法
被引量:1
- 3
-
-
作者
肖雷
王旭
粟武林
-
机构
河北大学电子信息工程学院
河北大学数学与计算机学院
-
出处
《计算机应用与软件》
CSCD
2016年第3期244-247,263,共5页
-
基金
国家自然科学基金项目(60903089)
河北大学博士项目(Y2009157)
-
文摘
在文本特征选择中,由于词语概率空间和词义概率空间的差异,完全基于词语概率的主题特征往往不能很好地表达文章的思想,也不利于文本的分类。为达到主题特征更能反映文章思想这一目的,提取出一种基于词义降维的主题特征选择算法。该算法通过在词林基础上构建"同义词表",作为词到词义的映射矩阵,构造一个基于词义之上的概率分布,通过LDA提取文本特征用于分类,分类准确率得到了明显提高。实验表明,基于此种方法所建立的主题模型将有更强的主题表示维度,通过该算法基本解决文本特征提取中词语概率和词义概率之间差异的问题。
-
关键词
LDA
主题模型
主题表示维度
-
Keywords
Linear discriminant analysis(LDA)
Theme model
Theme representation dimension
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-