期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
融合交互信息和能量特征的三维复杂人体行为识别 被引量:4
1
作者 王永雄 曾艳 +3 位作者 李璇 尹钟 张孙杰 刘丽 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1828-1834,共7页
基于与人交互的物体对人体行为识别的重要作用,本文提出了融合交互物体和能量信息等特征的三维复杂人体识别方法.首先提取手持物体的Hu矩作为交互物体特征,然后根据人体行为的生物学和运动学特征,从人体运动的能量角度提取人体骨架动能... 基于与人交互的物体对人体行为识别的重要作用,本文提出了融合交互物体和能量信息等特征的三维复杂人体识别方法.首先提取手持物体的Hu矩作为交互物体特征,然后根据人体行为的生物学和运动学特征,从人体运动的能量角度提取人体骨架动能、姿态势能、关节点位置等构建了局部特征矩阵,并聚类为词袋(Bag Of Word,BOW),与交互物体特征构成最终的组合特征;为了自动分割交互物体,我们提出了基于Harris角点的种子区域生长法,快速完整地分割手持物体;最后利用RBFSVM方法进行人体行为识别.实验结果表明融合交互物体信息和能量特征的三维人体行为识别方法具有较高的识别率,尤其能够较大幅度降低易混淆复杂动作的误识别率. 展开更多
关键词 人体行为识别 HU矩 能量特征 词袋 SVM
下载PDF
基于关键词学习的文本分类方法 被引量:2
2
作者 王天时 张龙 +2 位作者 刘怀泉 刘丽 陈思琦 《山东师范大学学报(自然科学版)》 CAS 2019年第1期54-60,共7页
提出一种基于关键词学习的文本分类方法.采用LDA主题模型抽取文本的关键词,通过关键词的词袋构造文本的特征矩阵并进行PCA降维,将低阶特征矩阵输入由卷积神经网络和BP神经网络的混合网络中对文本分类进行学习.为提高文本分类效果,引入... 提出一种基于关键词学习的文本分类方法.采用LDA主题模型抽取文本的关键词,通过关键词的词袋构造文本的特征矩阵并进行PCA降维,将低阶特征矩阵输入由卷积神经网络和BP神经网络的混合网络中对文本分类进行学习.为提高文本分类效果,引入与BP神经网络同构的深度神经网络对BP神经网络的初始权值进行初始化.在多数据集上的实验表明,本文方法明显提高文本分类的准确率. 展开更多
关键词 抽取 词袋 特征矩阵 卷积神经网络 BP神经网络
下载PDF
一种新的视频摘要可视化算法 被引量:2
3
作者 彭帝超 刘琳 +3 位作者 陈广宇 陈海东 左伍衡 陈为 《计算机研究与发展》 EI CSCD 北大核心 2013年第2期371-378,共8页
提出一种摘要式浏览视频文件的可视化方法,将顺序视频转化成图像形式摘要,能够帮助读者快速有效地获得视频数据的结构信息.算法通过检测视频中每帧的尺度不变特征(SIFT),应用改进的词袋模型构建特征词库并统计词频,将整段视频映射为高... 提出一种摘要式浏览视频文件的可视化方法,将顺序视频转化成图像形式摘要,能够帮助读者快速有效地获得视频数据的结构信息.算法通过检测视频中每帧的尺度不变特征(SIFT),应用改进的词袋模型构建特征词库并统计词频,将整段视频映射为高维词库空间的一条曲线.通过多维尺度分析(MDS)方法对该曲线降维,生成反映视频语义信息的一条三维平滑曲线.实验结果表明,该曲线很好地体现视频中各帧之间的关联性和语义转折,可辅助读者快速理解视频情节结构. 展开更多
关键词 可视化 视频摘要 词袋 低维嵌入
下载PDF
Image Classification Based on Histogram Intersection Kernel
4
作者 Hanbin Xi Tiantian Chang 《Journal of Computer and Communications》 2015年第11期158-163,共6页
Histogram Intersection Kernel Support Vector Machines (SVM) was used for the image classification problem. Specifically, each image was split into blocks, and each block was represented by the Scale Invariant Feature ... Histogram Intersection Kernel Support Vector Machines (SVM) was used for the image classification problem. Specifically, each image was split into blocks, and each block was represented by the Scale Invariant Feature Transform (SIFT) descriptors;secondly, k-means cluster method was applied to separate the SIFT descriptors into groups, each group represented a visual keywords;thirdly, count the number of the SIFT descriptors in each image, and histogram of each image should be constructed;finally, Histogram Intersection Kernel should be built based on these histograms. In our experimental study, we use Corel-low images to test our method. Compared with typical RBF kernel SVM, the Histogram Intersection kernel SVM performs better than RBF kernel SVM. 展开更多
关键词 Classification bag of word Support VECTOR MACHINE KERNEL Function Visual KEYwordS
下载PDF
基于相异性空间和多分类器融合的文本分类方法 被引量:1
5
作者 徐安德 赵亚康 +1 位作者 张月群 鲁杨 《兵器装备工程学报》 CAS 北大核心 2019年第12期136-141,共6页
提出了基于相异性表征和多分类器融合的文本分类方法。首先,文档特征向量通过不同的相异性表征变换词袋法获得低维表示形式;然后,为了避免最优表征集的搜索陷入局部最优,对多分类器的响应进行合并,并在不同的相异性空间上训练数据。最后... 提出了基于相异性表征和多分类器融合的文本分类方法。首先,文档特征向量通过不同的相异性表征变换词袋法获得低维表示形式;然后,为了避免最优表征集的搜索陷入局部最优,对多分类器的响应进行合并,并在不同的相异性空间上训练数据。最后,在测试阶段,通过表征变换的多个分类器融合获得分类结果。多个数据库的实验结果表明了所提方法的有效性。与其他方法相比,所提方法在微观平均F1得分和宏观平均F1得分表现较优,准确率和稳定性较好。 展开更多
关键词 词袋法 相异性表征 多分类器融合 低维表示 局部最优
下载PDF
基于显著图的特征字典构造方法
6
作者 吴晓燕 王海燕 《计算机工程与设计》 北大核心 2016年第8期2243-2247,共5页
为解决传统字典模型在两类问题中的局限性,提出一种基于视觉注意机制的特征字典构造方法,通过引入视觉显著图将图像区分为前景和背景区域,利用加权k均值聚类形成特征字典。在形成图像直方图描述时,将形状、颜色、纹理特征构成混合特征向... 为解决传统字典模型在两类问题中的局限性,提出一种基于视觉注意机制的特征字典构造方法,通过引入视觉显著图将图像区分为前景和背景区域,利用加权k均值聚类形成特征字典。在形成图像直方图描述时,将形状、颜色、纹理特征构成混合特征向量,通过L1规则化约束去掉冗余特征维数,得到最终的特征向量。在两类图像库上的分类实验结果表明了该方法的有效性,一定程度提高了字典模型用于图像分类的准确率。 展开更多
关键词 字典模型 显著图 降维 K均值 视觉注意机制
下载PDF
词包模型中视觉单词歧义性分析 被引量:11
7
作者 刘扬闻 霍宏 方涛 《计算机工程》 CAS CSCD 北大核心 2011年第19期204-206,209,共4页
传统词包(BOW)模型中的视觉单词是通过无监督聚类图像块的特征向量得到的,没有考虑视觉单词的语义信息和语义性质。为解决该问题,提出一种基于文本分类的视觉单词歧义性分析方法。利用传统BOW模型生成初始视觉单词词汇表,使用文档频率、... 传统词包(BOW)模型中的视觉单词是通过无监督聚类图像块的特征向量得到的,没有考虑视觉单词的语义信息和语义性质。为解决该问题,提出一种基于文本分类的视觉单词歧义性分析方法。利用传统BOW模型生成初始视觉单词词汇表,使用文档频率、χ2分布和信息增益这3种文本分类方法分析单词语义性质,剔除具有低类别信息的歧义性单词,并采用支持向量机分类器实现图像分类。实验结果表明,该方法具有较高的分类精度。 展开更多
关键词 图像分类 视觉单词 文本分类 支持向量机 词包模型
下载PDF
一种改进的k-means聚类视觉词典构造方法 被引量:8
8
作者 赵春晖 王莹 Masahide Kaneko 《仪器仪表学报》 EI CAS CSCD 北大核心 2012年第10期2380-2386,共7页
传统词袋(bag of words,BoW)模型在构造视觉词典时一般采用k-means聚类方法实现,但k-means聚类方法的性能在很大程度上依赖于初始点的选择,从而导致生成的视觉词典鲁棒性较差,此外,每次迭代都要计算数据点与中心点的距离,计算复杂度高... 传统词袋(bag of words,BoW)模型在构造视觉词典时一般采用k-means聚类方法实现,但k-means聚类方法的性能在很大程度上依赖于初始点的选择,从而导致生成的视觉词典鲁棒性较差,此外,每次迭代都要计算数据点与中心点的距离,计算复杂度高。针对上述问题,提出了一种改进的k-means聚类视觉词典构造方法,该方法首先对初始值的选取进行了优化,克服了随机选取初始值对聚类性能的影响,其次基于三角形不等式对计算进行了简化,使生成的视觉词典更加稳定,计算复杂度更低,最后引入权值分布对图像进行基于视觉词典的表示,并将基于改进的视觉词典的词袋模型应用于图像分类,提高了分类性能。通过在Caltech 101和Caltech 256两个数据库进行实验,验证了本文方法的有效性,并分析了词典库大小对分类性能的影响。从实验结果可以看出,采用本文方法所得到的分类正确率提高了5%~8%。 展开更多
关键词 词袋模型 视觉词典构造 K-MEANS聚类 图像分类
下载PDF
基于多媒体信息检索的有监督词袋模型 被引量:7
9
作者 袁桂霞 周先春 《计算机工程与设计》 北大核心 2018年第9期2873-2878,共6页
词袋模型的复杂度高,且区分能力较弱,为解决这一问题,在经典词袋模型的基础上,提出一种有监督的词袋模型。在训练过程中对训练样本类别进行标记,在此基础上构建直方图总体能量目标函数,依据能量最小准则学习码本。通过文本检索和图像检... 词袋模型的复杂度高,且区分能力较弱,为解决这一问题,在经典词袋模型的基础上,提出一种有监督的词袋模型。在训练过程中对训练样本类别进行标记,在此基础上构建直方图总体能量目标函数,依据能量最小准则学习码本。通过文本检索和图像检索两组多媒体信息检索实验进行对比,对比结果表明,有监督词袋模型比经典词袋模型的检索精确度高、检索耗时少。 展开更多
关键词 词袋模型 多媒体信息检索 文本检索 图像检索 能量最小准则
下载PDF
多源信息融合的双人交互行为识别算法研究 被引量:6
10
作者 金壮壮 曹江涛 姬晓飞 《计算机技术与发展》 2018年第10期32-36,43,共6页
人体及人体的运动均是三维信息,而传统的基于RGB视频的双人交互行为的特征描述方法由于缺少深度信息导致其特征描述的区分度较低。根据RGB视频和深度视频各自优点和具有的互补特性,提出一种多源信息融合的双人交互行为识别算法。该算法... 人体及人体的运动均是三维信息,而传统的基于RGB视频的双人交互行为的特征描述方法由于缺少深度信息导致其特征描述的区分度较低。根据RGB视频和深度视频各自优点和具有的互补特性,提出一种多源信息融合的双人交互行为识别算法。该算法首先采用时空兴趣点和词袋模型结合的方法对RGB视频进行特征表示。然后采用方向梯度直方图对深度视频帧进行特征表示,并引入关键帧统计特征对深度视频进行直方图特征表示。最后,使用最近邻分类器分别对两种视频特征进行分类识别,通过加权融合两类视频的识别概率实现交互行为的识别。实验结果表明,引入深度信息可以大大提高双人交互行为识别的准确率。 展开更多
关键词 动作识别 时空兴趣点 方向梯度直方图 加权融合 双人交互 词袋模型
下载PDF
基于改进时空兴趣点特征的双人交互行为识别 被引量:6
11
作者 王佩瑶 曹江涛 姬晓飞 《计算机应用》 CSCD 北大核心 2016年第10期2875-2879,2884,共6页
针对实际监控视频下双人交互行为的兴趣点特征选取不理想,且聚类词典中冗余单词导致识别率不高的问题,提出一种基于改进时空兴趣点(STIP)特征的交互行为识别方法。首先,引入基于信息熵的不可跟踪性检测方法,对序列图像进行跟踪得到交互... 针对实际监控视频下双人交互行为的兴趣点特征选取不理想,且聚类词典中冗余单词导致识别率不高的问题,提出一种基于改进时空兴趣点(STIP)特征的交互行为识别方法。首先,引入基于信息熵的不可跟踪性检测方法,对序列图像进行跟踪得到交互动作的前景运动区域,仅在此区域内提取时空兴趣点以提高兴趣点检测的准确性。其次采用3维尺度不变特性转换(3D-SIFT)描述子对检测得到的兴趣点进行表述,利用改进的模糊C均值聚类方法得到视觉词典,以提升词典的分布特性;在此基础上建立词袋模型,即将训练集样本向词典进行投影得到每帧图像的直方图统计特征表示。最后,采用帧帧最近邻分类方法进行双人交互动作识别。在UT-interaction数据库上进行测试,该算法得到了91.7%的正确识别率。实验结果表明,通过不可跟踪性检测得到的时空兴趣点的改进词袋算法可以较大程度提高交互行为识别的准确率,并且适用于动态背景下的双人交互行为识别。 展开更多
关键词 时空兴趣点 信息熵 双人交互行为识别 词袋模型 模糊C均值 3维尺度不变特性转换 最近邻分类器
下载PDF
基于词向量包的自动文摘方法 被引量:5
12
作者 白淑霞 鲍玉来 张晖 《现代情报》 CSSCI 北大核心 2017年第2期8-13,共6页
[目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动... [目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动文摘方法,用词向量包的表示距离衡量句子与整篇文献的语义相似度,将与文献语义相似的句子抽取出来最终形成文摘;[结果]在DUC01数据集上,实验结果表明,该方法能够生成高质量的文摘,结果明显优于其它方法;[结论]实验证明该方法明显提升了自动文摘的性能。 展开更多
关键词 词向量 词包向量 自动文摘
下载PDF
基于词袋特征算法的药品分层缺陷检测 被引量:4
13
作者 刘玉环 唐庭龙 陈胜勇 《计算机工程》 CAS CSCD 北大核心 2018年第6期249-252,258,共5页
在制药领域,人工检测药品速度慢、效率低,而图像处理的方法需要大量样本且适应性差。针对以上问题,提出特征提取与机器学习相结合的方法,介绍用于目标区域特征提取的词袋特征(BOF)算法,分析BOF算法的最佳参数取值,并采用支持向量机对药... 在制药领域,人工检测药品速度慢、效率低,而图像处理的方法需要大量样本且适应性差。针对以上问题,提出特征提取与机器学习相结合的方法,介绍用于目标区域特征提取的词袋特征(BOF)算法,分析BOF算法的最佳参数取值,并采用支持向量机对药品分层缺陷进行分类检测。实验结果表明,该方法能使药品达到较高的分类精度,并且满足工业生产实时检测的要求。 展开更多
关键词 药品分层 缺陷检测 特征提取 机器学习 词袋模型 支持向量机
下载PDF
一种基于空间金字塔特征的图像分类降维算法 被引量:3
14
作者 李青彦 彭进业 《微型电脑应用》 2020年第2期17-19,共3页
有效去除图像特征中的冗余是图像分类研究领域的一个重要内容。在SPM(Spatial Pyramid Matching)图像分类算法的基础上,结合主成分分析方法(Principal Component Analysis,PCA),提出了一种新的PcSPM算法。该方法能在多种尺度上提取图像... 有效去除图像特征中的冗余是图像分类研究领域的一个重要内容。在SPM(Spatial Pyramid Matching)图像分类算法的基础上,结合主成分分析方法(Principal Component Analysis,PCA),提出了一种新的PcSPM算法。该方法能在多种尺度上提取图像金字塔直方图主成分,可减少特征冗余,并将其应用于图像分类。实验表明,该方法能够有效去除图像特征中的冗余,提高了图像分类的精度。 展开更多
关键词 图像分类 SPM 特征降维 主成分分析 词袋算法
下载PDF
一种基于融合的词袋模型和大裕度最近邻分类算法的图像识别方法 被引量:2
15
作者 杨亦波 王斌 王剑锋 《上海师范大学学报(自然科学版)》 2017年第4期584-589,共6页
图像分类作为图像处理和计算机视觉的重要组成部分,能够快速准确地对数字图像进行分析和管理.对基于bag of word(BOW)模型的分类问题进行了研究,针对图像理解中的图像相似度之间的关系,提出了一种最大间隔最近邻居分类算法,通过对成对... 图像分类作为图像处理和计算机视觉的重要组成部分,能够快速准确地对数字图像进行分析和管理.对基于bag of word(BOW)模型的分类问题进行了研究,针对图像理解中的图像相似度之间的关系,提出了一种最大间隔最近邻居分类算法,通过对成对约束的度量学习算法,在优化目标中增加原空间数据分类的约束,学习到了一个可以反映当前样本数据的距离函数,并且在k-Nearest Neighbor(KNN)分类器上使用该学习到的距离函数来构建分类器,并在多个国际标准图像数据集上进行实验,结果表明:该算法相比传统的基于欧式距离的算法具备更高的正确率. 展开更多
关键词 图像分类 词袋模型 大裕度最近邻分类算法
下载PDF
完全在线的双目直接法视觉SLAM算法 被引量:1
16
作者 贾嫣晗 邹风山 +2 位作者 徐方 杜振军 刘明敏 《控制与决策》 EI CSCD 北大核心 2023年第11期3093-3102,共10页
视觉SLAM在机器人的室外作业如野外探索、定位侦察中扮演了重要角色.为了使得机器人可以更好地进行室外作业,提出一种不受词袋模型的固定词汇限制的完全在线实时双目直接法视觉SLAM算法.作为直接法视觉SLAM,所提到的系统可以利用任何具... 视觉SLAM在机器人的室外作业如野外探索、定位侦察中扮演了重要角色.为了使得机器人可以更好地进行室外作业,提出一种不受词袋模型的固定词汇限制的完全在线实时双目直接法视觉SLAM算法.作为直接法视觉SLAM,所提到的系统可以利用任何具有足够强度梯度的图像像素,使其在缺少特征点的区域仍具有很强的鲁棒性.在系统算法中引入双目静态残差约束并去除遮挡的滑窗优化来增强系统的跟踪精度,增加闭环检测和位姿图优化模块,并建立在线词袋模型,使得系统在大规模且陌生的环境中依然可以进行工作.将此算法在公开的EuRoC数据集和KITTI数据集上进行性能评估,结果表明,所提出的系统的定位精度优于最先进的直接法视觉SLAM系统,且室内场景和室外场景均具有鲁棒性. 展开更多
关键词 双目直接法 在线词袋模型 闭环检测 去除遮挡
原文传递
KAZE算法在图像检索中的应用 被引量:1
17
作者 卢建军 李杰 +1 位作者 卫晨 刘志鹏 《西安邮电大学学报》 2017年第3期109-114,共6页
给出一种KAZE算法与视觉词典库模型相结合的图像检索算法。利用KAZE算法提取特征点,构造特征描述子,进行预匹配;采用随机抽样一致性算法剔除误匹配点和错误点;通过K均值聚类算法对特征描述子进行聚类,建立视觉词典库模型。将图像特征描... 给出一种KAZE算法与视觉词典库模型相结合的图像检索算法。利用KAZE算法提取特征点,构造特征描述子,进行预匹配;采用随机抽样一致性算法剔除误匹配点和错误点;通过K均值聚类算法对特征描述子进行聚类,建立视觉词典库模型。将图像特征描述子映射到视觉词典库模型,得到检索结果。实验结果表明,该算法可以检索相同或相似图像,图像检索的平均查准率为55%。 展开更多
关键词 KAZE算法 随机抽样一致性算法 K均值聚类算法 词袋模型
下载PDF
图像的SIFT特征二阶检索算法
18
作者 易军凯 陈龙龙 姜大光 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第4期84-89,共6页
提出了用图像SIFT特征二阶检索算法实现相似图像检索。首先对图像进行SIFT特征提取,然后利用词袋算法通过K-Means聚类出特征词并建立特征词频表,最后基于词频表通过二阶检索算法实现相似图像匹配。二阶检索分两步:第一步实现特征分布结... 提出了用图像SIFT特征二阶检索算法实现相似图像检索。首先对图像进行SIFT特征提取,然后利用词袋算法通过K-Means聚类出特征词并建立特征词频表,最后基于词频表通过二阶检索算法实现相似图像匹配。二阶检索分两步:第一步实现特征分布结构的相似检索;第二步根据两张图像对应特征点落于同一特征类的数量与图像自身特征点数的比例来实现图像的精确检索,提高图像检索的准确率。实验结果表明,该方法具有较高的查全率,同时在查询效率上也具有很好的表现。 展开更多
关键词 SIFT特征 图像检索 词袋算法 词频表 二阶检索
原文传递
基于潜在主题的分布式视觉检索模型 被引量:1
19
作者 陈宜明 段凌宇 +3 位作者 黄艳 李冰 林杰 黄铁军 《计算机工程》 CAS CSCD 2012年第24期146-151,共6页
为将文档聚类划分的分布式检索方法直接应用于视觉检索领域,提出一种基于潜在主题的分布式视觉检索模型。给出模型框架,包括图像视觉单词的数据集划分方法和图像子集选择方法,以此优化图像分布式检索性能。实验结果表明,该模型在不降低... 为将文档聚类划分的分布式检索方法直接应用于视觉检索领域,提出一种基于潜在主题的分布式视觉检索模型。给出模型框架,包括图像视觉单词的数据集划分方法和图像子集选择方法,以此优化图像分布式检索性能。实验结果表明,该模型在不降低检索准确率的前提下,能优先选择少量的图像子集进行检索,并提高查询的吞吐量。 展开更多
关键词 分布式检索 视觉检索 词袋模型 图像数据集划分 图像数据集选择 潜在主题
下载PDF
结合码本优化和特征融合的人体行为识别方法
20
作者 石爱辉 程勇 曹雪虹 《计算机技术与发展》 2018年第2期107-111,共5页
为了提高视频序列中人体行为识别的正确率,提出了一种结合两层K-means聚类优化码本和视频表达级特征融合的行为识别方法。首先对训练集视频提取出的时空兴趣点利用梯度方向直方图(HOG)和光流直方图(HOF)进行描述,并对属于不同视频以及... 为了提高视频序列中人体行为识别的正确率,提出了一种结合两层K-means聚类优化码本和视频表达级特征融合的行为识别方法。首先对训练集视频提取出的时空兴趣点利用梯度方向直方图(HOG)和光流直方图(HOF)进行描述,并对属于不同视频以及不同种类动作视频的描述子使用两层K-means聚类形成各自更具有代表性的视觉词汇,从而提高码本的表达能力。然后将表示每个视频的HOG和HOF描述子分别作为码本优化后的词袋模型的输入,得到两种不同的视频全局表达并进行特征融合,由于HOG和HOF描述子在形成视频表达级特征时相关性较大,融合后的特征更具区分性和分类鲁棒性。最后采用支持向量机对融合后的特征进行分类识别。实验结果表明,该方法能够有效地提高识别率。 展开更多
关键词 词袋模型 两层K-means聚类 视频表达级特征融合 行为识别
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部