期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于LDA与深度神经网络的维吾尔文情感分类 被引量:6
1
作者 买买提阿依甫 吾守尔·斯拉木 +1 位作者 帕丽旦·木合塔尔 杨文忠 《计算机仿真》 北大核心 2019年第10期194-201,205,共9页
针对维吾尔论坛文本具有稀疏性、主题不明确性、不规范性等问题,并考虑到普通神经网络只将词粒度层面的词向量作为输入,忽略语义粒度层面的全局语义特征的表示,而导致文档特征表示不充分的现象.提出一种基于主题联合词向量的多通道卷积... 针对维吾尔论坛文本具有稀疏性、主题不明确性、不规范性等问题,并考虑到普通神经网络只将词粒度层面的词向量作为输入,忽略语义粒度层面的全局语义特征的表示,而导致文档特征表示不充分的现象.提出一种基于主题联合词向量的多通道卷积神经网络的情感分类方法.方法结合word2Vec和LDA模型生成主题特征矩阵,获取语义粒度层面特征信息,以丰富卷积网络的池化层特征,从而提高了情感分类的准确率.在维吾尔文情感二分类和五分类数据集上的实验结果表明,提出的模型相比于传统机器学习方法取得了更好的情感分类性能. 展开更多
关键词 情感分类 卷积神经网络 主题概率模型 词向量 维吾尔语
下载PDF
主题概率模型在微博主题挖掘方面的研究综述 被引量:4
2
作者 陈静 刘琰 王煦中 《信息工程大学学报》 2017年第1期103-110,共8页
近年来,微博凭借着自身的特点发展成为社会公共舆论的重要平台,对国家安全和社会发展产生了深远的影响,由此对微博文本主题提取显得格外重要。目前,文本主题挖掘的主流技术是主题概率模型。为此,首先对主题概率模型中LDA模型进行了详细... 近年来,微博凭借着自身的特点发展成为社会公共舆论的重要平台,对国家安全和社会发展产生了深远的影响,由此对微博文本主题提取显得格外重要。目前,文本主题挖掘的主流技术是主题概率模型。为此,首先对主题概率模型中LDA模型进行了详细地介绍;其次分析了微博的数据特点,从存在噪音词汇、微博文本短小以及微博的时序性等3个方面综述了主题概率模型在微博主题挖掘方面的研究;近一步又综述了利用主题模型发现基于主题的社团关系的研究;最后总结了未来主题模型在挖掘微博主题方面存在的挑战。 展开更多
关键词 微博 主题概率模型 主题 主题提取 社团发现
下载PDF
基于文本挖掘的文章特征提取及流量控制 被引量:1
3
作者 曾颖 李志涛 周燕 《电子技术与软件工程》 2020年第2期176-177,共2页
本文探究微信公众号文章阅读量预测的可行性及预测所需特征。首先爬取公众号文章并估计其阅读量达到稳定所需的时间,再对数据进行分词处理,提取文章的多个特征构成变量。最后通过随机森林和XGBoost训练模型并预测文章阅读量,验证了通过... 本文探究微信公众号文章阅读量预测的可行性及预测所需特征。首先爬取公众号文章并估计其阅读量达到稳定所需的时间,再对数据进行分词处理,提取文章的多个特征构成变量。最后通过随机森林和XGBoost训练模型并预测文章阅读量,验证了通过文本挖掘提取公众号文章特征并预测流量的可行性。 展开更多
关键词 文本数据挖掘 中文分词 主题概率模型 随机森林 XGBoost
下载PDF
主题相关的虚拟读者社区推荐方法研究 被引量:1
4
作者 洪亮 冉从敬 《现代图书情报技术》 CSSCI 北大核心 2014年第9期51-57,共7页
【目的】为了帮助读者从海量的虚拟读者社区中选择符合其兴趣的社区。【方法】提出基于主题概率模型的读者社区推荐方法,通过发现读者社区的隐含主题,建立起读者与读者社区在不同主题上的联系,并根据社区和读者的主题相似度进行读者社... 【目的】为了帮助读者从海量的虚拟读者社区中选择符合其兴趣的社区。【方法】提出基于主题概率模型的读者社区推荐方法,通过发现读者社区的隐含主题,建立起读者与读者社区在不同主题上的联系,并根据社区和读者的主题相似度进行读者社区推荐。【结果】在真实数据上的实验证明该方法能够有效地发现读者社区的隐含主题,相比现有的推荐方法,能够准确地推荐虚拟读者社区。【局限】存在推荐的冷启动问题。【结论】该推荐方法帮助读者准确迅速地找到感兴趣的主题相关虚拟读者社区,能够促进读者的沟通交流和虚拟读者社区的发展。 展开更多
关键词 读者社区 推荐 主题概率模型 协同过滤
原文传递
面向文章流量预测的特征筛选与分析
5
作者 胡宝灵 李志涛 周燕 《通信技术》 2020年第4期885-889,共5页
探究微信公众号文章阅读量预测所需特征。首先,爬取目标公众号在指定期限内的所有文章,估计其阅读量达到稳定所需的时间,再对数据进行清洗。其次,通过包括分词模型、主题概率模型等多种技术和数据处理方法进行特征筛选,提取到文章及文... 探究微信公众号文章阅读量预测所需特征。首先,爬取目标公众号在指定期限内的所有文章,估计其阅读量达到稳定所需的时间,再对数据进行清洗。其次,通过包括分词模型、主题概率模型等多种技术和数据处理方法进行特征筛选,提取到文章及文章的标题、正文等包括词频、主题、文章发布情况等多种特征,构成125个变量。最后,通过假设检验探究所提取特征与阅读量之间的关系,分析并为公众号提供具有指导意义的文章流量影响因素。 展开更多
关键词 文本数据挖掘 中文分词 主题概率模型 特征筛选 假设检验
下载PDF
基于隐藏主题概率模型的图像结构感知SISR重建方法
6
作者 马丽红 王小娥 +1 位作者 田菁 张宇 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第4期1-9,共9页
在基于示例学习的单幅图像超分辨率(SISR)重建中,假设从低分辨率(LR)到高分辨率(HR)图像块的映射关系是一对一的,但同一LR块会与多个HR块对应,导致了LR与HR块的匹配误差.为解决HR复原块的失配问题,文中首先导出了LR块主题模式的概率模型... 在基于示例学习的单幅图像超分辨率(SISR)重建中,假设从低分辨率(LR)到高分辨率(HR)图像块的映射关系是一对一的,但同一LR块会与多个HR块对应,导致了LR与HR块的匹配误差.为解决HR复原块的失配问题,文中首先导出了LR块主题模式的概率模型,引入信号的隐藏主题这一种新的观察信息.然后提出了一种基于块主题差异和上下文最大概率的结构感知复原机制,通过主题模式与邻域块内容的关联,形成LR块的流形描述;在重构中通过自适应主题决策树选择和节点回归矩阵映射,从相似的LR流形信号中准确区分和复原HR信号.主题模型优化实验结果表明,文中基于主题约束信息的算法比未引入隐藏主题的决策树SISR方法的峰值信噪比(PSNR)值提升了0.25 dB;在5种算法的对比实验中,相对于稀疏字典SISR方法,文中方法的PSNR值平均提升了0.92 dB,表明引入隐藏的主题信息和主题流形结构辨识是可行的. 展开更多
关键词 超分辨率重建 主题概率模型 结构感知 流形约束 节点回归映射
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部