期刊文献+
共找到498篇文章
< 1 2 25 >
每页显示 20 50 100
自然语言处理中主题模型的发展 被引量:238
1
作者 徐戈 王厚峰 《计算机学报》 EI CSCD 北大核心 2011年第8期1423-1436,共14页
主题模型在自然语言处理领域受到了越来越多的关注.在该领域中,主题可以看成是词项的概率分布.主题模型通过词项在文档级的共现信息抽取出语义相关的主题集合,并能够将词项空间中的文档变换到主题空间,得到文档在低维空间中的表达.作者... 主题模型在自然语言处理领域受到了越来越多的关注.在该领域中,主题可以看成是词项的概率分布.主题模型通过词项在文档级的共现信息抽取出语义相关的主题集合,并能够将词项空间中的文档变换到主题空间,得到文档在低维空间中的表达.作者从主题模型的起源隐性语义索引出发,对概率隐性语义索引以及LDA等在主题模型发展中的重要阶段性工作进行了介绍和分析,着重描述这些工作之间的关联性.LDA作为一个概率生成模型,很容易被扩展成其它形式的概率模型.作者对由LDA派生出的各种模型作了粗略分类,并选择了各类的代表性模型简单介绍.主题模型中最重要的两组参数分别是各主题下的词项概率分布和各文档的主题概率分布,作者对期望最大化算法在主题模型参数估计中的使用进行了分析,这有助于更深刻理解主题模型发展中各项工作的联系. 展开更多
关键词 自然语言处理 主题模型 隐性语义索引 LDA 期望最大化算法 gibbs采样
下载PDF
我国农村消费行为变迁及城乡联动机制研究 被引量:124
2
作者 周建 杨秀祯 《经济研究》 CSSCI 北大核心 2009年第1期83-95,105,共14页
本文选取1981—2006年农村消费支出结构数据为研究对象,构建了具有城镇"示范性"影响效应的农民消费行为理论模型。在此基础上,通过基于均值漂移的Gibbs抽样对所有变量进行结构突变诊断及实证检验,发现了农村消费行为中存在着... 本文选取1981—2006年农村消费支出结构数据为研究对象,构建了具有城镇"示范性"影响效应的农民消费行为理论模型。在此基础上,通过基于均值漂移的Gibbs抽样对所有变量进行结构突变诊断及实证检验,发现了农村消费行为中存在着显著的城乡联动机制及其重要影响因素。主要研究结论表明:诊断出的结构突变表明存在城镇对农村消费行为显著的"示范性"影响作用;农村消费行为中的预防性储蓄动机效应和攀附效应可以通过城乡联动机制表现出来;七类消费支出中的重要结构突变大小体现出城镇对农村的影响力度及其方向。建立起长久而有效的城镇"示范性"效应机制是有效启动农村消费的重要途径和措施。 展开更多
关键词 农村消费 “示范性”效应 gibbs抽样 城乡联动
原文传递
受限波尔兹曼机 被引量:104
3
作者 张春霞 姬楠楠 王冠伟 《工程数学学报》 CSCD 北大核心 2015年第2期159-173,共15页
受限波尔兹曼机(restricted Boltzmann machines,RBM)是一类具有两层结构、对称连接且无自反馈的随机神经网络模型,层间全连接,层内无连接.近年来,随着RBM的快速学习算法一对比散度的出现,机器学习界掀起了研究RBM理论及应用的热潮.实... 受限波尔兹曼机(restricted Boltzmann machines,RBM)是一类具有两层结构、对称连接且无自反馈的随机神经网络模型,层间全连接,层内无连接.近年来,随着RBM的快速学习算法一对比散度的出现,机器学习界掀起了研究RBM理论及应用的热潮.实践表明,RBM是一种有效的特征提取方法,用于初始化前馈神经网络可明显提高泛化能力,堆叠多个RBM组成的深度信念网络能提取更抽象的特征.鉴于RBM的优点及其在深度学习中的广泛应用,本文对RBM的基本模型、学习算法、参数设置、评估方法、变形算法等进行了详细介绍,最后探讨了RBM在未来值得研究的方向. 展开更多
关键词 机器学习 深度学习 受限波尔兹曼机 对比散度 gibbs采样
下载PDF
基于LDA主题模型的文本相似度计算 被引量:98
4
作者 王振振 何明 杜永萍 《计算机科学》 CSCD 北大核心 2013年第12期229-232,共4页
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏... LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布来计算文本之间的相似度,最后对文本相似度矩阵进行聚类实验来评估聚类效果。实验结果表明,该方法能够明显提高文本相似度计算的准确率和文本聚类效果。 展开更多
关键词 主题模型 LDA 文本相似度 gibbs抽样
下载PDF
我国经济周期波动的非对称性和持续性研究 被引量:87
5
作者 陈浪南 刘宏伟 《经济研究》 CSSCI 北大核心 2007年第4期43-52,共10页
本文利用1979年至2004年之间中国GDP季度数据,采用三区制马尔可夫均值和方差转移的二阶自回归(MSMV(3)-AR(2))模型和贝叶斯Gibbs抽样非参数估计方法,对我国经济周期波动的非对称性和持续性进行了实证分析。实证结果表明,MSMV(3)-AR(2)... 本文利用1979年至2004年之间中国GDP季度数据,采用三区制马尔可夫均值和方差转移的二阶自回归(MSMV(3)-AR(2))模型和贝叶斯Gibbs抽样非参数估计方法,对我国经济周期波动的非对称性和持续性进行了实证分析。实证结果表明,MSMV(3)-AR(2)模型对我国经济状况提供了很好的拟合,显著支持增长率序列具有三区制状态:低速增长阶段,适速增长阶段和高速增长阶段。我国经济周期的非对称性主要体现在各个增长阶段的均值、方差、阶段性之间的转移概率的不同。我国经济周期的持续性主要体现在各个增长阶段的自维持概率和阶段性之间的转移概率的不同。此外,我国经济"适速增长阶段"的稳定性最高,"高速增长阶段"的平均持续期最长。 展开更多
关键词 经济周期 非对称性 持续性 Markov-Switching模型 gibbs抽样
原文传递
玻尔兹曼机研究进展 被引量:71
6
作者 刘建伟 刘媛 罗雄麟 《计算机研究与发展》 EI CSCD 北大核心 2014年第1期1-16,共16页
深度学习是机器学习中的新兴研究领域,能够很好地用于解决目标识别、语言理解等复杂问题.玻尔兹曼机作为深度学习的典型代表近年来受到了广泛研究.鉴于玻尔兹曼机的理论意义和实际应用价值,系统综述了玻尔兹曼机的研究进展,首先概述了... 深度学习是机器学习中的新兴研究领域,能够很好地用于解决目标识别、语言理解等复杂问题.玻尔兹曼机作为深度学习的典型代表近年来受到了广泛研究.鉴于玻尔兹曼机的理论意义和实际应用价值,系统综述了玻尔兹曼机的研究进展,首先概述了玻尔兹曼机的相关概念,包括单层反馈网络的结构和拓扑结构分类,然后详细描述了玻尔兹曼机的学习过程和几种典型学习算法,接着对近几年玻尔兹曼机研究的新进展进行了阐述,最后提出了玻尔兹曼机中有待进一步研究解决的问题. 展开更多
关键词 玻尔兹曼机 可见单元 隐单元 概率分布 期望值 模拟退火 吉布斯采样 马尔可夫链
下载PDF
基于LDA模型的文本分类研究 被引量:56
7
作者 姚全珠 宋志理 彭程 《计算机工程与应用》 CSCD 北大核心 2011年第13期150-153,共4页
针对传统的降维算法在处理高维和大规模的文本分类时存在的局限性,提出了一种基于LDA模型的文本分类算法,在判别模型SVM框架中,应用LDA概率增长模型,对文档集进行主题建模,在文档集的隐含主题-文本矩阵上训练SVM,构造文本分类器。参数... 针对传统的降维算法在处理高维和大规模的文本分类时存在的局限性,提出了一种基于LDA模型的文本分类算法,在判别模型SVM框架中,应用LDA概率增长模型,对文档集进行主题建模,在文档集的隐含主题-文本矩阵上训练SVM,构造文本分类器。参数推理采用Gibbs抽样,将每个文本表示为固定隐含主题集上的概率分布。应用贝叶斯统计理论中的标准方法,确定最优主题数T。在语料库上进行的分类实验表明,与文本表示采用VSM结合SVM,LSI结合SVM相比,具有较好的分类效果。 展开更多
关键词 文本分类 潜在狄利克雷分配(LDA)模型 gibbs抽样 贝叶斯统计理论
下载PDF
基于LDA模型的主题词抽取方法 被引量:47
8
作者 石晶 李万龙 《计算机工程》 CAS CSCD 北大核心 2010年第19期81-83,共3页
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的... 以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。 展开更多
关键词 LDA模型 gibbs抽样 主题词抽取
下载PDF
基于LDA模型的主题分析 被引量:34
9
作者 石晶 范猛 李万龙 《自动化学报》 EI CSCD 北大核心 2009年第12期1586-1592,共7页
在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片... 在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片段边界.依据词汇的香农信息提取片段主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵.实验表明,文本分析的结果明显好于其他方法,可以为下一步文本推理的工作提供有价值的预处理. 展开更多
关键词 主题分析 LDA模型 文本分割 gibbs抽样
下载PDF
基于局部语义聚类的语义重叠社区发现算法 被引量:36
10
作者 辛宇 杨静 +1 位作者 汤楚蘅 葛斯乔 《计算机研究与发展》 EI CSCD 北大核心 2015年第7期1510-1521,共12页
语义社会网络是一种包含信息节点及社会关系构成的新型复杂网络,因此以节点邻接关系为挖掘对象的传统社会网络社区发现算法无法有效处理语义社会网络重叠社区发现问题.针对这一问题,提出基于局部语义聚类的语义社会网络重叠社区发现算法... 语义社会网络是一种包含信息节点及社会关系构成的新型复杂网络,因此以节点邻接关系为挖掘对象的传统社会网络社区发现算法无法有效处理语义社会网络重叠社区发现问题.针对这一问题,提出基于局部语义聚类的语义社会网络重叠社区发现算法,该算法:1)以LDA(latent Dirichlet allocation)模型为语义信息模型,利用Gibbs取样法建立节点语义信息到语义空间的量化映射;2)以节点间语义坐标的相对熵作为节点语义相似度的度量,建立节点相似度矩阵;3)根据社会网络的局部小世界特性,提出语义社会网络的局部社区结构S-fitness模型,并根据S-fitness模型建立了局部语义聚类算法(local semantic clusterm,LSC);4)提出可度量语义社区发现结果的语义模块度模型,并通过实验分析,验证了算法及语义模块度模型的有效性及可行性. 展开更多
关键词 语义社会网络 重叠社区发现 LDA模型 相对熵 gibbs取样 局部语义聚类
下载PDF
基于LDA-wSVM模型的文本分类研究 被引量:29
11
作者 李锋刚 梁钰 +1 位作者 GAO Xiao-zhi ZENGER Kai 《计算机应用研究》 CSCD 北大核心 2015年第1期21-25,共5页
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了一种新的LDA-w SVM高效分类算法模... SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了一种新的LDA-w SVM高效分类算法模型。利用LDA主题模型进行建模和特征选择,确定主题数和隐主题—文本矩阵;在经典权重计算方法上作改进,考虑各特征项与类别的关联度,设计了一种新的权重计算方法;在特征词空间上使用这种基于权重计算的w SVM分类器进行分类。实验基于R软件平台对搜狗实验室的新闻文本集进行分类,得到了宏平均值为0.943的高精确度分类结果。实验结果表明,提出的LDA-w SVM模型在文本自动分类中具有很好的优越性能。 展开更多
关键词 文本分类 潜在狄利克雷分布 支持向量机 权重计算 吉普斯抽样
下载PDF
三参数Weibull分布参数的Bayes估计 被引量:22
12
作者 汤银才 侯道燕 《系统科学与数学》 CSCD 北大核心 2009年第1期109-115,共7页
给出了三参数Weibull分布参数Bayes估计的两种方法,其一基于Laplace数值积分法,其二基于Gibbs抽样方法.模拟例子说明了估计方法的有效性.
关键词 WEIBULL分布 Laplace方法 BAYES估计 自适应抽样 gibbs抽样
原文传递
一种话题演化建模与分析方法 被引量:26
13
作者 胡艳丽 白亮 张维明 《自动化学报》 EI CSCD 北大核心 2012年第10期1690-1697,共8页
根据时序关系将文本流划分为连续时间片中的文本集,在线抽取各时间片中隐含的子话题,采用模型选择方法动态确定各时间片包含的子话题数,以历史时间片的子话题信息作为当前子话题发现的先验知识,基于OLDA(Online latent Dirichlet alloca... 根据时序关系将文本流划分为连续时间片中的文本集,在线抽取各时间片中隐含的子话题,采用模型选择方法动态确定各时间片包含的子话题数,以历史时间片的子话题信息作为当前子话题发现的先验知识,基于OLDA(Online latent Dirichlet allocation)模型抽取各时间片包含的子话题,通过Gibbs抽样对话题模型参数进行估计;对子话题进行关联分析,定义子话题产生、消亡、继承、分裂和合并五种演化类型,提出基于相对熵的子话题关联分析方法,根据子话题语义相似度和时序关系建立子话题间的关联,由具有时序关系和内容关联的子话题组成话题,通过子话题内容和强度的变化描述话题演化.基于真实网络新闻的话题演化分析实验表明,本文提出的话题演化分析方法能够有效检测网络新闻话题内容和强度的演化. 展开更多
关键词 话题演化 OLDA 模型 模型选择 gibbs 抽样 相对熵 关联分析
下载PDF
具有杠杆效应SV模型的贝叶斯分析及其应用 被引量:20
14
作者 孟利锋 张世英 何信 《系统工程》 CSCD 北大核心 2004年第3期47-51,共5页
对具有杠杆效应的 SV模型进行了的贝叶斯分析 ,使用基于 Gibbs取样的 BUGS软件对模型的参数进行了估计。用上海和深圳股市的指数收益时间序列对杠杆效应 SV模型进行检验 ,指出沪。
关键词 金融市场 股票价格 贝叶斯分析 杠杆效应 SV模型 股票市场 金融风险
下载PDF
一种面向微博主题挖掘的改进LDA模型 被引量:27
15
作者 谢昊 江红 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第6期93-101,共9页
随着新浪微博用户的不断增长,微博网站成为很多人获取信息的平台.但是微博是一种特殊的文本,其字数受到严格限制,传统的主题模型并不能很好地分析微博的内容.本文提出了一个基于LDA的微博生成模型RT-LDA来解决微博字数受限的问题.模型... 随着新浪微博用户的不断增长,微博网站成为很多人获取信息的平台.但是微博是一种特殊的文本,其字数受到严格限制,传统的主题模型并不能很好地分析微博的内容.本文提出了一个基于LDA的微博生成模型RT-LDA来解决微博字数受限的问题.模型采用吉布斯抽样法来推导,不仅能准确地挖掘每条微博的主题,还能归纳出用户关注的主题分布情况.在真实数据集上的实验表明,RT-LDA模型能很好地对微博进行主题挖掘. 展开更多
关键词 新浪微博 文本挖掘 RT-LDA 吉布斯抽样
下载PDF
基于BIC准则和Gibbs采样的有限混合模型无监督学习算法 被引量:24
16
作者 刘伟峰 杨爱兰 《电子学报》 EI CAS CSCD 北大核心 2011年第A03期134-139,共6页
针对有限混合模型无监督学习算法分布元个数未知,本文提出了一种基于BIC准则和Gibbs采样的无监督学习算法,通过Gibbs采样算法对混合模型的参数进行估计,进一步计算观测数据的Bayes信息准则(BIC)指标,确定混合分布元个数.仿真实验以高斯... 针对有限混合模型无监督学习算法分布元个数未知,本文提出了一种基于BIC准则和Gibbs采样的无监督学习算法,通过Gibbs采样算法对混合模型的参数进行估计,进一步计算观测数据的Bayes信息准则(BIC)指标,确定混合分布元个数.仿真实验以高斯混合分布为例,分别利用具有不同个数的分布模型拟合观测数据,分析表明,该算法能够很好地学习混合高斯分布参数及个数. 展开更多
关键词 BIC准则 gibbs采样 无监督学习 有限混合模型
下载PDF
基于动态主题模型融合多维数据的微博社区发现算法 被引量:25
17
作者 刘冰玉 王翠荣 +3 位作者 王聪 王军伟 王兴伟 黄敏 《软件学报》 EI CSCD 北大核心 2017年第2期246-261,共16页
随着微博用户的不断增加,微博网络已成为用户进行信息交流的平台.针对由于博文长度受限,传统的社区发现算法无法有效解决微博网络的稀疏性等问题,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先将微博... 随着微博用户的不断增加,微博网络已成为用户进行信息交流的平台.针对由于博文长度受限,传统的社区发现算法无法有效解决微博网络的稀疏性等问题,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先将微博网络映射为有向加权网络,网络中边的方向反映节点之间的关注关系,利用所提出的DTM(dynamic topic model)计算出节点之间的语义相似度,并将其作为节点间连边的权重.DTM是一种微博主题模型.该模型不仅能够挖掘博客的主题分布,而且能够计算出某一主题中用户的影响力大小.其次,利用所提出的复杂度较低的标签传播算法WLPA(weighted lebel propagation)进行微博网络的社区发现.该算法的初始化阶段将影响力大的用户节点作为初始节点,标签按照节点的影响力从大到小进行传播,避免了传统标签传播算法逆流现象的发生,提高了标签传播算法的稳定性.真实数据上的实验结果表明,DTM模型能够很好地对微博进行主题挖掘,DC-DTM算法能够有效地挖掘出微博网络的社区. 展开更多
关键词 新浪微博 文本挖掘 DC-DTM 吉布斯采样 LDA 主题模型
下载PDF
作者主题演化模型及其在研究兴趣演化分析中的应用 被引量:25
18
作者 史庆伟 乔晓东 +1 位作者 徐硕 农国武 《情报学报》 CSSCI 北大核心 2013年第9期912-919,共8页
从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内... 从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内容本身,很少考虑作者等外部特征。基于此,本文在AT和ToT模型的基础上构建了作者主题演化(AToT)模型,并给出了一种估计AToT模型参数的吉布斯采样方法。该模型集成了AT和ToT模型的优势,不仅可以揭示科技文献中隐含的主题、作者的研究兴趣,而且可以挖掘研究兴趣随时间变化的规律。最后,以1740篇NIPS会议论文集作为实验数据,通过与AT模型的对比分析验证了AToT模型的可行性和有效性。 展开更多
关键词 主题模型 作者主题演化模型 研究兴趣演化分析 吉布斯采样 困惑度
下载PDF
中国经济周期运行特点及拐点识别分析 被引量:22
19
作者 郭庆旺 贾俊雪 杨运杰 《财贸经济》 CSSCI 北大核心 2007年第6期11-17,共7页
本文运用吉布斯抽样方法估算了我国经济周期的多变量动态马可夫转换因素模型,对我国经济周期进行拐点识别和同步指数分析,进而揭示出我国经济周期的长期和短期运行特点。分析表明,就长期而言,我国经济周期运行表现出明显的协动性和非线... 本文运用吉布斯抽样方法估算了我国经济周期的多变量动态马可夫转换因素模型,对我国经济周期进行拐点识别和同步指数分析,进而揭示出我国经济周期的长期和短期运行特点。分析表明,就长期而言,我国经济周期运行表现出明显的协动性和非线性特征,改革开放以前,宏观经济波动剧烈,情势转换发生得较为频繁,改革开放以后,宏观经济波动明显趋缓;就短期而言,尤其是20世纪90年代以来,我国经济周期运行平稳,协动性特征依然显著但非线性特征明显减弱。 展开更多
关键词 经济周期拐点 同步指数 多变量动态马可夫转换因素模型 吉布斯抽样
原文传递
基于状态转换的货币危机预警模型——时变概率马尔可夫转换模型的Griddy-Gibbs取样法和应用 被引量:19
20
作者 朱钧钧 谢识予 +1 位作者 朱弘鑫 卢书泉 《数量经济技术经济研究》 CSSCI 北大核心 2010年第9期118-132,F0003,共16页
区别于目前基于信号分析的货币危机预警模型,本文采用时变概率马尔可夫状态转换模型来构建货币危机的预警模型。相对于信号模型中主观设定危机的定义和阈值,该模型将危机的识别内生于模型估计中,并通过汇率剧烈波动期的发生概率对货币... 区别于目前基于信号分析的货币危机预警模型,本文采用时变概率马尔可夫状态转换模型来构建货币危机的预警模型。相对于信号模型中主观设定危机的定义和阈值,该模型将危机的识别内生于模型估计中,并通过汇率剧烈波动期的发生概率对货币危机预警,使预警系统更客观。本文的主要贡献为在Bauwens等(2007)基础上改进了Griddy-Gibbs取样法的使用效率,并应用此MCMC方法估计了多个马尔可夫转换模型。对东南亚金融危机的研究证实了状态转换模型的预警能力,并且时变概率马尔可夫转换-GARCH模型揭示了关于汇率波动的更多特性。 展开更多
关键词 货币危机 信号模型 状态转换模型 gibbs取样
原文传递
上一页 1 2 25 下一页 到第
使用帮助 返回顶部