期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合显著信息的LDA极光图像分类
被引量:
20
1
作者
韩冰
杨辰
高新波
《软件学报》
EI
CSCD
北大核心
2013年第11期2758-2766,共9页
美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(latent Dirichlet allocation)模型基础上提出了一种融合显著信息的LDA方法(LDA with saliency information,简称SI-LDA),利用...
美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(latent Dirichlet allocation)模型基础上提出了一种融合显著信息的LDA方法(LDA with saliency information,简称SI-LDA),利用极光图像的谱残差(spectral residual,简称SR)显著信息生成视觉字典,加强极光图像的语义信息,并将其用于极光图像的特征表示.最后,利用SVM分类器对极光图像进行分类.实验结果表明,所提出的算法获得了良好的分类结果.
展开更多
关键词
极光图像
词袋模型
潜在狄利克雷分配
谱残差
显著信息
下载PDF
职称材料
利用组合模型生成微博热点话题事件摘要
被引量:
8
2
作者
戴天
吴渝
雷大江
《计算机应用研究》
CSCD
北大核心
2016年第7期2026-2029,2038,共5页
针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统的主题模型提取出微博文本中的热点主题,根据各主题下文档的概...
针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统的主题模型提取出微博文本中的热点主题,根据各主题下文档的概率分布提取出新的话题文档,引入词激活力模型计算各个词之间的词激活力,生成词激活力矩阵,最后利用词激活力矩阵生成有序的词序列作为热点事件摘要。实验验证了该方法的可行性,表明所提出的方法能够很好地识别出热点词并生成可读性高的事件摘要。
展开更多
关键词
微博
话题检测
潜在狄利克雷分布
词激活力
下载PDF
职称材料
基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法
被引量:
4
3
作者
邢金彪
崔超远
+1 位作者
孙丙宇
宋良图
《计算机应用》
CSCD
北大核心
2016年第8期2257-2261,共5页
传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LD...
传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LDA主题模型预测短文本对应的主题分布,将主题中的词作为特征扩展的基础;其次,在特征扩展时结合文本类别信息提取背景领域特征,以降低其对文本分类的影响;最后,将扩展后的特征向量作为分类器的输入,根据支持向量机(SVM)的分类结果过滤广告。实验结果表明,与现有的仅基于短文本分类的过滤方法相比,其准确率平均提升4个百分点。因此,该方法能有效扩展文本特征,并降低背景领域特征的影响,更适用于数据量较大的微博广告过滤。
展开更多
关键词
广告过滤
隐含狄列克雷分配
短文本分类
支持向量机
特征扩展
下载PDF
职称材料
基于近义词分配的铁路扣件状态检测
被引量:
4
4
作者
李爽
李柏林
《铁道标准设计》
北大核心
2018年第6期30-33,共4页
针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉...
针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉单词间的语义距离,从而获取语义相关的近义词;然后,在"视觉词包模型"的基础上,结合柔性分配策略将底层特征映射至若干近义词上;最后,利用支持向量机实现扣件检测。对4类扣件图像的分类实验证明该模型能够有效提高扣件分类精确度。
展开更多
关键词
铁路扣件
检测
词包模型
相对熵
潜在狄利克雷分布
近义词
视觉单词
下载PDF
职称材料
教学视频的文本语义镜头分割和标注
被引量:
3
5
作者
王敏
王斌
+1 位作者
沈钧戈
高新波
《数据采集与处理》
CSCD
北大核心
2016年第6期1171-1177,共7页
为了对教学视频这一专门类别视频进行自动标注,本文首先提取视频中的字幕信息,通过文本预处理后,使用视频中的字幕文本信息内容结合潜在狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型方法获得视频镜头在主题上的概率分布,通...
为了对教学视频这一专门类别视频进行自动标注,本文首先提取视频中的字幕信息,通过文本预处理后,使用视频中的字幕文本信息内容结合潜在狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型方法获得视频镜头在主题上的概率分布,通过计算主题概率分布差异,进行语义层面镜头分割。然后以镜头为样本,使用安全的半监督支持向量机(Safe semi-supervised support vector machine,S4VM)方法,通过少量的标注镜头样本,完成对未标注镜头的自动标注。实验结果表明,本文方法利用字幕文本信息和LDA模型,有效完成了视频的语义镜头分割,不仅可以对镜头完成标注,而且可以对整个视频进行关键词标注。
展开更多
关键词
教学视频
字幕文本
半监督学习
潜在狄利克雷分布
下载PDF
职称材料
基于主题模型的改进随机森林算法在文本分类中的应用
被引量:
7
6
作者
姚立
张曦煌
《计算机应用与软件》
2017年第8期173-178,212,共7页
针对传统随机森林算法在维度高、噪声大的文本分类上出现计算复杂度高和分类效果较差的问题,提出一种基于隐狄利克雷分配(LDA)主题模型的改进随机森林算法。该算法利用LDA主题模型对原始文本建立模型,将原始文本映射到主题空间上,保证...
针对传统随机森林算法在维度高、噪声大的文本分类上出现计算复杂度高和分类效果较差的问题,提出一种基于隐狄利克雷分配(LDA)主题模型的改进随机森林算法。该算法利用LDA主题模型对原始文本建立模型,将原始文本映射到主题空间上,保证了文本主旨与原始文本的一致性,同时也大大降低了文本噪声对分类的影响;并且针对随机森林中决策树特征的随机选择方法,提出在决策树生成过程中,利用对称不确定计算各个特征之间的相关性,从而可以降低不同决策树之间的关联度。最终在主题空间上利用改进的随机森林算法对文本进行分类。经过实验证明,该算法在文本分类上具有良好的优越性。
展开更多
关键词
隐狄利克雷模型
主题模型
随机森林
特征评估
文本分类
下载PDF
职称材料
基于LDA主题模型的标签传递算法
被引量:
5
7
作者
刘培奇
孙捷焓
《计算机应用》
CSCD
北大核心
2012年第2期403-406,410,共5页
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基...
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。
展开更多
关键词
lda
主题模型
标签传递算法
半监督学习
数据降维
流行假设
下载PDF
职称材料
公共自行车系统的租赁点聚类与功能识别
被引量:
2
8
作者
申兴发
王兰迪
《计算机工程》
CAS
CSCD
北大核心
2018年第1期44-50,共7页
租赁点功能识别对公共自行车系统的平衡调度和布局规划具有重要作用,而系统中积累的大量历史数据可反映用户在不同时间和地点的社会经济活动,并且与租赁点功能紧密联系。为此,对系统历史数据进行分析,构建公共自行车系统租赁点聚类模型...
租赁点功能识别对公共自行车系统的平衡调度和布局规划具有重要作用,而系统中积累的大量历史数据可反映用户在不同时间和地点的社会经济活动,并且与租赁点功能紧密联系。为此,对系统历史数据进行分析,构建公共自行车系统租赁点聚类模型。结合租赁点的时空属性,利用潜在狄利克雷分布模型挖掘租赁点的功能特征,使用K-means聚类算法进行特征聚类。通过集群模式特征分析并使用兴趣点数据和租赁点名称信息对聚类结果进行验证,结果表明,该模型可以有效地辅助系统管理者掌握公共自行车系统租赁点的功能分布。
展开更多
关键词
公共自行车系统
区域功能
潜在狄利克雷分布模型
K-MEANS算法
数据挖掘
下载PDF
职称材料
题名
融合显著信息的LDA极光图像分类
被引量:
20
1
作者
韩冰
杨辰
高新波
机构
西安电子科技大学电子工程学院
出处
《软件学报》
EI
CSCD
北大核心
2013年第11期2758-2766,共9页
基金
国家自然科学基金(41031064
60902082)
+4 种基金
教育部留学回国人员科研启动基金
2010年海洋公益性行业科研专项经费(201005017)
陕西省自然科学基础研究计划(2011JQ8019)
中央高校基本科研业务费专项资金(K5051302008
K5051202048)
文摘
美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(latent Dirichlet allocation)模型基础上提出了一种融合显著信息的LDA方法(LDA with saliency information,简称SI-LDA),利用极光图像的谱残差(spectral residual,简称SR)显著信息生成视觉字典,加强极光图像的语义信息,并将其用于极光图像的特征表示.最后,利用SVM分类器对极光图像进行分类.实验结果表明,所提出的算法获得了良好的分类结果.
关键词
极光图像
词袋模型
潜在狄利克雷分配
谱残差
显著信息
Keywords
aurora
image
bag
of
words
model
latent
diriehlet
allocation
(
lda
)
spectral
residual
saliency
information
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
利用组合模型生成微博热点话题事件摘要
被引量:
8
2
作者
戴天
吴渝
雷大江
机构
重庆邮电大学网络智能研究所
出处
《计算机应用研究》
CSCD
北大核心
2016年第7期2026-2029,2038,共5页
基金
重庆市教委科学技术研究项目(KJ130527)
重庆市自然科学基金资助项目(CSTC
+1 种基金
2014jcyj A40049)
国家级大学生创新创业训练计划项目(201310617003)
文摘
针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统的主题模型提取出微博文本中的热点主题,根据各主题下文档的概率分布提取出新的话题文档,引入词激活力模型计算各个词之间的词激活力,生成词激活力矩阵,最后利用词激活力矩阵生成有序的词序列作为热点事件摘要。实验验证了该方法的可行性,表明所提出的方法能够很好地识别出热点词并生成可读性高的事件摘要。
关键词
微博
话题检测
潜在狄利克雷分布
词激活力
Keywords
microblog
topic
detection
latent
diriehlet
allocation
(
lda
)
word
active
force
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法
被引量:
4
3
作者
邢金彪
崔超远
孙丙宇
宋良图
机构
中国科学院合肥智能机械研究所
中国科学技术大学信息科学技术学院
出处
《计算机应用》
CSCD
北大核心
2016年第8期2257-2261,共5页
基金
国家科技支撑计划项目(2014BAD10B08)
安徽省科技攻关计划项目(1401032010)~~
文摘
传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LDA主题模型预测短文本对应的主题分布,将主题中的词作为特征扩展的基础;其次,在特征扩展时结合文本类别信息提取背景领域特征,以降低其对文本分类的影响;最后,将扩展后的特征向量作为分类器的输入,根据支持向量机(SVM)的分类结果过滤广告。实验结果表明,与现有的仅基于短文本分类的过滤方法相比,其准确率平均提升4个百分点。因此,该方法能有效扩展文本特征,并降低背景领域特征的影响,更适用于数据量较大的微博广告过滤。
关键词
广告过滤
隐含狄列克雷分配
短文本分类
支持向量机
特征扩展
Keywords
advertisement
filtering
latent
diriehlet
allocation
(
lda
)
short
text
classification
Support
Vector
Machine
(SVM)
feature
extension
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于近义词分配的铁路扣件状态检测
被引量:
4
4
作者
李爽
李柏林
机构
西南交通大学机械工程学院
出处
《铁道标准设计》
北大核心
2018年第6期30-33,共4页
基金
四川省科技支撑计划项目(2016GZ0194)
文摘
针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉单词间的语义距离,从而获取语义相关的近义词;然后,在"视觉词包模型"的基础上,结合柔性分配策略将底层特征映射至若干近义词上;最后,利用支持向量机实现扣件检测。对4类扣件图像的分类实验证明该模型能够有效提高扣件分类精确度。
关键词
铁路扣件
检测
词包模型
相对熵
潜在狄利克雷分布
近义词
视觉单词
Keywords
Railway
fastener
Inspection
Bag-of-Words
(BOW)
model
Relative
entropy
latent
diriehlet
allocation
(
lda
)
Homoionym
Visual
word
分类号
U213.53 [交通运输工程—道路与铁道工程]
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
教学视频的文本语义镜头分割和标注
被引量:
3
5
作者
王敏
王斌
沈钧戈
高新波
机构
西安电子科技大学电子工程学院
出处
《数据采集与处理》
CSCD
北大核心
2016年第6期1171-1177,共7页
基金
国家杰出青年科学基金(61125204)资助项目
陕西省科技攻关(2013K06-30)资助项目
西安电子科技大学宁波信息技术研究院种子基金资助项目
文摘
为了对教学视频这一专门类别视频进行自动标注,本文首先提取视频中的字幕信息,通过文本预处理后,使用视频中的字幕文本信息内容结合潜在狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型方法获得视频镜头在主题上的概率分布,通过计算主题概率分布差异,进行语义层面镜头分割。然后以镜头为样本,使用安全的半监督支持向量机(Safe semi-supervised support vector machine,S4VM)方法,通过少量的标注镜头样本,完成对未标注镜头的自动标注。实验结果表明,本文方法利用字幕文本信息和LDA模型,有效完成了视频的语义镜头分割,不仅可以对镜头完成标注,而且可以对整个视频进行关键词标注。
关键词
教学视频
字幕文本
半监督学习
潜在狄利克雷分布
Keywords
lecture
video
lcaption
text
sem-supervised
learning
latent
diriehlet
allocation
(
lda
)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于主题模型的改进随机森林算法在文本分类中的应用
被引量:
7
6
作者
姚立
张曦煌
机构
江南大学物联网工程学院
出处
《计算机应用与软件》
2017年第8期173-178,212,共7页
基金
江苏省产学研合作项目(BY2015019-30)
文摘
针对传统随机森林算法在维度高、噪声大的文本分类上出现计算复杂度高和分类效果较差的问题,提出一种基于隐狄利克雷分配(LDA)主题模型的改进随机森林算法。该算法利用LDA主题模型对原始文本建立模型,将原始文本映射到主题空间上,保证了文本主旨与原始文本的一致性,同时也大大降低了文本噪声对分类的影响;并且针对随机森林中决策树特征的随机选择方法,提出在决策树生成过程中,利用对称不确定计算各个特征之间的相关性,从而可以降低不同决策树之间的关联度。最终在主题空间上利用改进的随机森林算法对文本进行分类。经过实验证明,该算法在文本分类上具有良好的优越性。
关键词
隐狄利克雷模型
主题模型
随机森林
特征评估
文本分类
Keywords
latent
diriehlet
allocation
(
lda
)
Topic
model
Random
forest
Feature
evaluation
Text
categoriza-tion
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于LDA主题模型的标签传递算法
被引量:
5
7
作者
刘培奇
孙捷焓
机构
西安建筑科技大学信息与控制工程学院
出处
《计算机应用》
CSCD
北大核心
2012年第2期403-406,410,共5页
文摘
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。
关键词
lda
主题模型
标签传递算法
半监督学习
数据降维
流行假设
Keywords
latent
diriehlet
allocation
(
lda
)
model
Label
Propagation
(LP)
algorithm
semi-supervised
learning
dimensional
reduction
manifold
assumption
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
TP391.4 [自动化与计算机技术—控制科学与工程]
下载PDF
职称材料
题名
公共自行车系统的租赁点聚类与功能识别
被引量:
2
8
作者
申兴发
王兰迪
机构
杭州电子科技大学计算机应用技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第1期44-50,共7页
基金
国家自然科学基金"无线网络基于链路相关性的路由协议优化方法研究"(61672198)
浙江省自然科学基金面上项目"低占空比无线/传感器网络通信模型与协议研究"(Y14F020197)
文摘
租赁点功能识别对公共自行车系统的平衡调度和布局规划具有重要作用,而系统中积累的大量历史数据可反映用户在不同时间和地点的社会经济活动,并且与租赁点功能紧密联系。为此,对系统历史数据进行分析,构建公共自行车系统租赁点聚类模型。结合租赁点的时空属性,利用潜在狄利克雷分布模型挖掘租赁点的功能特征,使用K-means聚类算法进行特征聚类。通过集群模式特征分析并使用兴趣点数据和租赁点名称信息对聚类结果进行验证,结果表明,该模型可以有效地辅助系统管理者掌握公共自行车系统租赁点的功能分布。
关键词
公共自行车系统
区域功能
潜在狄利克雷分布模型
K-MEANS算法
数据挖掘
Keywords
Public
Bicycle
System
(
PBS
)
region
function
latent
diriehlet
allocation
(
lda
)
model
K-meansalgorithm
data
mining
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合显著信息的LDA极光图像分类
韩冰
杨辰
高新波
《软件学报》
EI
CSCD
北大核心
2013
20
下载PDF
职称材料
2
利用组合模型生成微博热点话题事件摘要
戴天
吴渝
雷大江
《计算机应用研究》
CSCD
北大核心
2016
8
下载PDF
职称材料
3
基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法
邢金彪
崔超远
孙丙宇
宋良图
《计算机应用》
CSCD
北大核心
2016
4
下载PDF
职称材料
4
基于近义词分配的铁路扣件状态检测
李爽
李柏林
《铁道标准设计》
北大核心
2018
4
下载PDF
职称材料
5
教学视频的文本语义镜头分割和标注
王敏
王斌
沈钧戈
高新波
《数据采集与处理》
CSCD
北大核心
2016
3
下载PDF
职称材料
6
基于主题模型的改进随机森林算法在文本分类中的应用
姚立
张曦煌
《计算机应用与软件》
2017
7
下载PDF
职称材料
7
基于LDA主题模型的标签传递算法
刘培奇
孙捷焓
《计算机应用》
CSCD
北大核心
2012
5
下载PDF
职称材料
8
公共自行车系统的租赁点聚类与功能识别
申兴发
王兰迪
《计算机工程》
CAS
CSCD
北大核心
2018
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部