-
题名一种基于动态词汇表的在线LDA算法
- 1
-
-
作者
张健伟
严建峰
刘晓升
杨璐
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2016年第12期120-124,134,共6页
-
基金
国家自然科学基金(61373092
61572339
+1 种基金
61272449)
江苏省科技支撑计划重点项目(BE2014005)资助
-
文摘
目前的在线潜在狄利克雷分布模型(LDA)算法大多是基于固定的词汇表,在实际应用中经常会出现词汇表和处理的语料不匹配的情况,影响了模型的实用性。针对这个现象,在置信传播算法(BP)的框架下,使主题单词分布服从狄利克雷过程,重新推导公式,使得词汇表在模型运行之前为空,并且在处理时不断向词汇表中增加发现的新词。实验证明,这种新的基于动态词汇表的算法不仅使得词汇表与语料的贴合度更高,而且使其在混淆度以及互信息指数这两个指标上能够比基于固定词汇表的LDA模型表现得更加优越。
-
关键词
潜在狄利克雷分配
动态词汇表
狄利克雷过程
流处理
-
Keywords
Latent dirichlet allocation, Dynamic vocabulary,Dirichlet process, Streaming process
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双语动态心理词汇表征模式的二语词汇习得研究
被引量:1
- 2
-
-
作者
匡倩
-
机构
四川警察学院基础部
-
出处
《黑龙江教育学院学报》
2011年第6期149-150,160,共3页
-
文摘
双语心理词汇表征是渐变发展的。双语者一方面通过二语目的词汇输入构建出习得该词的心理词汇模型,另一方面这个已构建的心理词汇模式受到目的词汇的输入的种类和刺激强度,以及学习者内在因素等多方面影响,不停地进行调试、发现、改变。词汇掌握水平越高,二语词义层和概念层之间的联系就越紧密。
-
关键词
双语动态心理词汇表征
二语词汇习得
熟练度
-
Keywords
bilingual mental lexicon representation
second language acquisition
language efficiency
-
分类号
H031
[语言文字—语言学]
-