期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
融合显著信息的LDA极光图像分类 被引量:20
1
作者 韩冰 杨辰 高新波 《软件学报》 EI CSCD 北大核心 2013年第11期2758-2766,共9页
美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(latent Dirichlet allocation)模型基础上提出了一种融合显著信息的LDA方法(LDA with saliency information,简称SI-LDA),利用... 美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(latent Dirichlet allocation)模型基础上提出了一种融合显著信息的LDA方法(LDA with saliency information,简称SI-LDA),利用极光图像的谱残差(spectral residual,简称SR)显著信息生成视觉字典,加强极光图像的语义信息,并将其用于极光图像的特征表示.最后,利用SVM分类器对极光图像进行分类.实验结果表明,所提出的算法获得了良好的分类结果. 展开更多
关键词 极光图像 词袋模型 潜在狄利克雷分配 谱残差 显著信息
下载PDF
利用组合模型生成微博热点话题事件摘要 被引量:8
2
作者 戴天 吴渝 雷大江 《计算机应用研究》 CSCD 北大核心 2016年第7期2026-2029,2038,共5页
针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统的主题模型提取出微博文本中的热点主题,根据各主题下文档的概... 针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统的主题模型提取出微博文本中的热点主题,根据各主题下文档的概率分布提取出新的话题文档,引入词激活力模型计算各个词之间的词激活力,生成词激活力矩阵,最后利用词激活力矩阵生成有序的词序列作为热点事件摘要。实验验证了该方法的可行性,表明所提出的方法能够很好地识别出热点词并生成可读性高的事件摘要。 展开更多
关键词 微博 话题检测 潜在狄利克雷分布 词激活力
下载PDF
基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法 被引量:4
3
作者 邢金彪 崔超远 +1 位作者 孙丙宇 宋良图 《计算机应用》 CSCD 北大核心 2016年第8期2257-2261,共5页
传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LD... 传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LDA主题模型预测短文本对应的主题分布,将主题中的词作为特征扩展的基础;其次,在特征扩展时结合文本类别信息提取背景领域特征,以降低其对文本分类的影响;最后,将扩展后的特征向量作为分类器的输入,根据支持向量机(SVM)的分类结果过滤广告。实验结果表明,与现有的仅基于短文本分类的过滤方法相比,其准确率平均提升4个百分点。因此,该方法能有效扩展文本特征,并降低背景领域特征的影响,更适用于数据量较大的微博广告过滤。 展开更多
关键词 广告过滤 隐含狄列克雷分配 短文本分类 支持向量机 特征扩展
下载PDF
基于近义词分配的铁路扣件状态检测 被引量:4
4
作者 李爽 李柏林 《铁道标准设计》 北大核心 2018年第6期30-33,共4页
针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉... 针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉单词间的语义距离,从而获取语义相关的近义词;然后,在"视觉词包模型"的基础上,结合柔性分配策略将底层特征映射至若干近义词上;最后,利用支持向量机实现扣件检测。对4类扣件图像的分类实验证明该模型能够有效提高扣件分类精确度。 展开更多
关键词 铁路扣件 检测 词包模型 相对熵 潜在狄利克雷分布 近义词 视觉单词
下载PDF
教学视频的文本语义镜头分割和标注 被引量:3
5
作者 王敏 王斌 +1 位作者 沈钧戈 高新波 《数据采集与处理》 CSCD 北大核心 2016年第6期1171-1177,共7页
为了对教学视频这一专门类别视频进行自动标注,本文首先提取视频中的字幕信息,通过文本预处理后,使用视频中的字幕文本信息内容结合潜在狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型方法获得视频镜头在主题上的概率分布,通... 为了对教学视频这一专门类别视频进行自动标注,本文首先提取视频中的字幕信息,通过文本预处理后,使用视频中的字幕文本信息内容结合潜在狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型方法获得视频镜头在主题上的概率分布,通过计算主题概率分布差异,进行语义层面镜头分割。然后以镜头为样本,使用安全的半监督支持向量机(Safe semi-supervised support vector machine,S4VM)方法,通过少量的标注镜头样本,完成对未标注镜头的自动标注。实验结果表明,本文方法利用字幕文本信息和LDA模型,有效完成了视频的语义镜头分割,不仅可以对镜头完成标注,而且可以对整个视频进行关键词标注。 展开更多
关键词 教学视频 字幕文本 半监督学习 潜在狄利克雷分布
下载PDF
基于主题模型的改进随机森林算法在文本分类中的应用 被引量:7
6
作者 姚立 张曦煌 《计算机应用与软件》 2017年第8期173-178,212,共7页
针对传统随机森林算法在维度高、噪声大的文本分类上出现计算复杂度高和分类效果较差的问题,提出一种基于隐狄利克雷分配(LDA)主题模型的改进随机森林算法。该算法利用LDA主题模型对原始文本建立模型,将原始文本映射到主题空间上,保证... 针对传统随机森林算法在维度高、噪声大的文本分类上出现计算复杂度高和分类效果较差的问题,提出一种基于隐狄利克雷分配(LDA)主题模型的改进随机森林算法。该算法利用LDA主题模型对原始文本建立模型,将原始文本映射到主题空间上,保证了文本主旨与原始文本的一致性,同时也大大降低了文本噪声对分类的影响;并且针对随机森林中决策树特征的随机选择方法,提出在决策树生成过程中,利用对称不确定计算各个特征之间的相关性,从而可以降低不同决策树之间的关联度。最终在主题空间上利用改进的随机森林算法对文本进行分类。经过实验证明,该算法在文本分类上具有良好的优越性。 展开更多
关键词 隐狄利克雷模型 主题模型 随机森林 特征评估 文本分类
下载PDF
基于LDA主题模型的标签传递算法 被引量:5
7
作者 刘培奇 孙捷焓 《计算机应用》 CSCD 北大核心 2012年第2期403-406,410,共5页
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基... 标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。 展开更多
关键词 lda主题模型 标签传递算法 半监督学习 数据降维 流行假设
下载PDF
公共自行车系统的租赁点聚类与功能识别 被引量:2
8
作者 申兴发 王兰迪 《计算机工程》 CAS CSCD 北大核心 2018年第1期44-50,共7页
租赁点功能识别对公共自行车系统的平衡调度和布局规划具有重要作用,而系统中积累的大量历史数据可反映用户在不同时间和地点的社会经济活动,并且与租赁点功能紧密联系。为此,对系统历史数据进行分析,构建公共自行车系统租赁点聚类模型... 租赁点功能识别对公共自行车系统的平衡调度和布局规划具有重要作用,而系统中积累的大量历史数据可反映用户在不同时间和地点的社会经济活动,并且与租赁点功能紧密联系。为此,对系统历史数据进行分析,构建公共自行车系统租赁点聚类模型。结合租赁点的时空属性,利用潜在狄利克雷分布模型挖掘租赁点的功能特征,使用K-means聚类算法进行特征聚类。通过集群模式特征分析并使用兴趣点数据和租赁点名称信息对聚类结果进行验证,结果表明,该模型可以有效地辅助系统管理者掌握公共自行车系统租赁点的功能分布。 展开更多
关键词 公共自行车系统 区域功能 潜在狄利克雷分布模型 K-MEANS算法 数据挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部