期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
视频摘要技术综述 被引量:33
1
作者 王娟 蒋兴浩 孙锬锋 《中国图象图形学报》 CSCD 北大核心 2014年第12期1685-1695,共11页
目的类似于文本摘要,视频摘要是对视频内容的总结。为了合理地评估视频摘要领域的研究进展,正确导向视频摘要的继续研究,本文归纳总结视频摘要技术的主要研究方法和显著性成果,对视频摘要技术进行综述。方法依据视频摘要的两个主要生成... 目的类似于文本摘要,视频摘要是对视频内容的总结。为了合理地评估视频摘要领域的研究进展,正确导向视频摘要的继续研究,本文归纳总结视频摘要技术的主要研究方法和显著性成果,对视频摘要技术进行综述。方法依据视频摘要的两个主要生成步骤:视频内容分析和摘要生成分别介绍视频摘要的主要研究方法。同时,分析了近5年视频摘要领域的研究状况,对视频摘要发展的新趋势:实时视频摘要和多视角视频摘要进行了阐述。最后,还对视频摘要的评价系统进行了分类总结。结果对视频摘要进行综述,对摘要中的语义获取难题提出了2种指导性建议。并依据分析结果,展望了视频摘要技术未来的发展方向。结论视频摘要技术作为视频内容理解的重要组成部分,有较大研究价值。而目前,视频摘要在视频语义表达和摘要评价系统方面并不精确完善,还需进一步的深入研究。 展开更多
关键词 视频内容分析 摘要生成 实时视频摘要 多视角视频摘要 视频语义获取
原文传递
NewsVideoCAR:一个基于内容的视频新闻节目浏览检索系统 被引量:3
2
作者 熊华 老松杨 +3 位作者 吴玲琦 李恒峰 吴玲达 李国辉 《计算机工程》 CAS CSCD 北大核心 2000年第11期73-75,共3页
介绍了NewsVideoCAR系统的构成,核心技术的基本思想和浏览界面的设计要点.
关键词 NewsvideoCAR 电视新闻节目 节目浏览检索系统
下载PDF
基于视频机器分析的目的地形象差异对比——以北京You Tube视频为例 被引量:14
3
作者 邓宁 蘧浪浪 《旅游学刊》 CSSCI 北大核心 2022年第8期70-85,共16页
大数据背景下,视频越来越成为用户获取目的地信息并建构旅游形象的主要渠道,鉴于用户生成视频(UGC)相较于目的地营销组织发布视频(OGC)更受欢迎,比较二者建构目的地形象的差异具有一定的理论意义及实践价值。然而到目前为止,旅游领域对... 大数据背景下,视频越来越成为用户获取目的地信息并建构旅游形象的主要渠道,鉴于用户生成视频(UGC)相较于目的地营销组织发布视频(OGC)更受欢迎,比较二者建构目的地形象的差异具有一定的理论意义及实践价值。然而到目前为止,旅游领域对视频内容的研究还较初级,且多采用人工分析方法,局限明显。近年来,计算机视觉领域在视频内容分析方面取得了巨大进展,基于此,文章采用计算机学科相关视频分析方法对YouTube网站上国外游客和北京市文化和旅游局发布的北京旅游视频展开研究。研究发现:第一,游客和目的地营销机构(DMO)借以建构目的地形象的属性主要是“人物”“文化艺术”和“基础设施”,在“交通”和“动植物”属性上表现较弱;第二,视频和文本素材在表征目的地“旅游景点”和“人物”属性上具有一致性,而“基础设施”属性在视频素材中比在文本中展现更充分;第三,UGC视频倾向表征北京“文化艺术”属性,尤其青睐表征北京建筑及文化场景,而DMO倾向表征更全面、宏观的北京形象,尤其突出展现北京的人物属性。 展开更多
关键词 目的地形象 视频内容分析 机器学习 YouTube视频
下载PDF
一种不需经验参数的视频镜头自校正聚类方法 被引量:3
4
作者 熊华 胡晓峰 《中国图象图形学报(A辑)》 CSCD 北大核心 2001年第3期243-249,共7页
镜头聚类是视频内容分析的重要途径 .为能够自动、准确地实现镜头聚类 ,设计和实现了一种新的镜头聚类方法 ,这种方法从一个初始分割开始 ,经多次聚类分裂与合并的迭代 ,即能自动地进行误差校正 ,而且这种方法既不需要通过人工交互来解... 镜头聚类是视频内容分析的重要途径 .为能够自动、准确地实现镜头聚类 ,设计和实现了一种新的镜头聚类方法 ,这种方法从一个初始分割开始 ,经多次聚类分裂与合并的迭代 ,即能自动地进行误差校正 ,而且这种方法既不需要通过人工交互来解决试探聚类方法的误差调节问题 ,也不需要在迭代聚类算法中进行难以确定的经验参数和经验阈值的设定 .实验证明 ,该方法能较好地解决镜头的自动、准确聚类问题 . 展开更多
关键词 镜头聚类 视频内容分析 视频镜头 自校正聚类方法
下载PDF
人工智能技术在录音录像档案管理中的可用性 被引量:9
5
作者 刘涛 《档案管理》 北大核心 2022年第3期71-72,共2页
数字时代带来了电子档案的海量增长,而录音录像档案成为电子档案中占比例最大的部分。传统的人工操作方式,已经不能实现对大量录音录像档案进行精确编录的工作,录音录像档案标准著录信息的有限性也不能满足档案管理与利用的需要。利用... 数字时代带来了电子档案的海量增长,而录音录像档案成为电子档案中占比例最大的部分。传统的人工操作方式,已经不能实现对大量录音录像档案进行精确编录的工作,录音录像档案标准著录信息的有限性也不能满足档案管理与利用的需要。利用人工智能平台下的语音识别和视频内容分析技术,可以高效、准确地完成这一任务,给档案管理利用工作带来技术创新。 展开更多
关键词 人工智能 录音录像档案 档案利用 视频内容分析
下载PDF
新闻视频挖掘技术研究 被引量:6
6
作者 栾悉道 谢毓湘 +1 位作者 韩智广 吴玲达 《计算机科学》 CSCD 北大核心 2007年第2期1-6,共6页
新闻视频挖掘是一个新兴的研究领域,也是多媒体数据挖掘的典型代表。本文对新闻视频挖掘技术进行了全面深入的讨论,首先从概念上对新闻视频挖掘进行了界定,提出了新闻视频挖掘的层次框架和技术框架,指出新闻视频挖掘包括低层视频挖掘和... 新闻视频挖掘是一个新兴的研究领域,也是多媒体数据挖掘的典型代表。本文对新闻视频挖掘技术进行了全面深入的讨论,首先从概念上对新闻视频挖掘进行了界定,提出了新闻视频挖掘的层次框架和技术框架,指出新闻视频挖掘包括低层视频挖掘和高层视频挖掘两个层次。其中,低层视频挖掘是利用数据挖掘的方法对视频内容进行分析的过程,而高层数据挖掘则是在低层挖掘的基础上进一步发现视频中的知识的过程。新闻视频挖掘的技术框架则对挖掘所涉及到的具体技术进行了分析。最后,对新闻视频挖掘中的结构挖掘、语义内容挖掘、视频摘要、趋势挖掘、关联挖掘等任务进行了详细的阐述,并对各种任务举出了具体的示例加以说明。 展开更多
关键词 新闻视频挖掘 视频内容分析 视频摘要 结构挖掘 语义内容挖掘
下载PDF
面向事件的影片摘要生成方法 被引量:5
7
作者 王辰 刘桂清 +1 位作者 老松杨 蒋杰 《中国图象图形学报(A辑)》 CSCD 北大核心 2005年第5期642-649,共8页
对视频摘要的研究已成为视频应用领域十分活跃的课题。为了获得更加实用的视频摘要,在介绍视频摘要概念和用途的基础上,依据目前的研究状况和影片类视频的特点,提出了一种适合于故事类影片的面向事件的影片摘要生成方法,并首先对该方法... 对视频摘要的研究已成为视频应用领域十分活跃的课题。为了获得更加实用的视频摘要,在介绍视频摘要概念和用途的基础上,依据目前的研究状况和影片类视频的特点,提出了一种适合于故事类影片的面向事件的影片摘要生成方法,并首先对该方法的细节进行了描述。该方法还使用了一种场景重要程度的评价算法,此算法的特点在于综合利用了影片中的多种媒体特征,其不仅考虑了运动特性,还考虑了感人内容对场景重要程度的影响。通过对摘要进行可用度测试和分析的结果,表明,此种方法生成的影片摘要具有较好的可用度。 展开更多
关键词 生成方法 影片 事件 面向 视频摘要 重要程度 应用领域 研究状况 综合利用 运动特性 可用度 特点 算法 场景
下载PDF
基于MPEG-7协议的视频检索系统设计 被引量:5
8
作者 薛玲 李超 熊璋 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2006年第7期865-868,共4页
设计了符合多媒体内容描述接口协议MPEG-7(Multimed ia Content Descrip-tion Interface)标准的电影视频检索系统SupEye,包括特征提取、数据存储以及特征检索3部分.特征提取负责提取视频特征与摘要,通过分析电影视频特点,给出了视频结... 设计了符合多媒体内容描述接口协议MPEG-7(Multimed ia Content Descrip-tion Interface)标准的电影视频检索系统SupEye,包括特征提取、数据存储以及特征检索3部分.特征提取负责提取视频特征与摘要,通过分析电影视频特点,给出了视频结构分析及摘要提取的假设、流程及算法.数据存储负责视频与特征数据的存储,考虑到用户检索历史对检索性能的影响,将MPEG-7多媒体特征描述文件分为视频特征描述文件与用户接口描述文件两类.特征检索构建了一个用于多视频特征检索的3层体系结构(表示层、逻辑层和事务层)并给出了检索结果融合流程.SupEye系统在分析MPEG-7标准的基础上解决了视频特征与用户检索特征的分离、样例查询中的特征分析以及多模态查询的结果融合问题. 展开更多
关键词 基于内容的检索 视频内容分析 MPEG-7 特征提取
下载PDF
基于镜头的视频场景构造方法研究 被引量:2
9
作者 熊华 胡晓峰 +1 位作者 曹莉华 柳伟 《小型微型计算机系统》 EI CSCD 北大核心 2000年第6期591-594,共4页
由于内容颗粒度过小 ,镜头层次的检索不能满足视频内容使用的需要 .场景是比镜头高一个层次的视频内容结构单位 ,能在一定程度上缓解镜头颗粒度过小的问题 .“场景”是一组镜头的集合 ,在内容上包含相似的对象或包含类似的背景 .本文提... 由于内容颗粒度过小 ,镜头层次的检索不能满足视频内容使用的需要 .场景是比镜头高一个层次的视频内容结构单位 ,能在一定程度上缓解镜头颗粒度过小的问题 .“场景”是一组镜头的集合 ,在内容上包含相似的对象或包含类似的背景 .本文提出了一种基于镜头构造视频场景的思路 ,包括三个环节 :镜头边界探测 ,镜头特征提取和镜头聚类 .在Video CAR原形系统的实践中 ,我们针对场景构造的特定任务 ,对这三个环节进行了详细设计 ,实现了双直方图镜头边界检测算法 ,HSV颜色直方图特征提取算法和自校正镜头聚类算法 .本文描述了这些算法的设计思路和实现要点 .文末给出了视频场景构造的典型实验结果 . 展开更多
关键词 视频场景 镜头探测 videoCAR 直方图
下载PDF
一种自动镜头聚类方法 被引量:3
10
作者 熊华 胡晓峰 老松杨 《国防科技大学学报》 EI CAS CSCD 2000年第5期103-108,共6页
镜头聚类是视频内容分析的重要途径。镜头聚类的基本任务是基于镜头的物理特征对镜头进行分类。本文设计和实现了一种新的镜头聚类方法 ,这种方法从一个初始分割开始 ,经多次聚类分裂与合并的迭代 ,自动地进行误差校正。这种方法既不需... 镜头聚类是视频内容分析的重要途径。镜头聚类的基本任务是基于镜头的物理特征对镜头进行分类。本文设计和实现了一种新的镜头聚类方法 ,这种方法从一个初始分割开始 ,经多次聚类分裂与合并的迭代 ,自动地进行误差校正。这种方法既不需要通过人工交互来解决试探聚类方法的误差调节问题 ,也不需要迭代聚类算法中难以确定的经验参数和经验阈值的设定 ,克服了普通聚类方法的缺点 ,在实际应用系统中取得了较好的效果。 展开更多
关键词 镜头聚类 合并 分裂 视频内容分析 内容检索 图像处理
下载PDF
视频概要的分类与综合评价方法 被引量:3
11
作者 赵丕锡 王秀坤 +1 位作者 李国辉 田宏 《计算机应用研究》 CSCD 北大核心 2004年第11期5-7,32,共4页
针对视频摘要产生过程,从结果、信息源、特征化级别和粒度四个方面,提出了一种分类方法,给出了若干实例进行综合评价,侧重反映不同视频概要所处的技术层次与水平。在此基础上,分析了研究现状,给出了进一步研究的方向。
关键词 视频概要 视频内容分析 类型 代表性
下载PDF
一种融合多模态特征的视频暴力检测方法 被引量:5
12
作者 马境远 刘鲲 傅慧源 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2021年第5期861-867,共7页
暴力事件检测是视频内容智能分析的一个常见任务,在互联网视频内容审查、影视作品分析、安防视频监控等领域有重要应用。面向视频中暴力检测任务,提出了一个包含关系网络和注意力机制的方法来融合视频中的多模态特征,该方法首先使用深... 暴力事件检测是视频内容智能分析的一个常见任务,在互联网视频内容审查、影视作品分析、安防视频监控等领域有重要应用。面向视频中暴力检测任务,提出了一个包含关系网络和注意力机制的方法来融合视频中的多模态特征,该方法首先使用深度学习提取视频中多个模态特征,如音频特征、光流特征、视频帧特征,接着组合不同的模态特征,利用关系网络来建模多模态之间的关系;然后基于深度神经网络设计了多头注意力模块,学习多个不同的注意力权重来聚焦视频的不同方面,以生成区分力强的视频特征。该方法可以融合视频中多个模态,提高了暴力检测准确率。在公开数据集上训练和验证的实验结果表明,提出的多模态特征融合方法,与仅使用单模态数据的方法和现有多模态融合的方法相比,具有明显的优势,检测准确率分别提升了4.89%和1.66%。 展开更多
关键词 注意力机制 关系网络 多模态融合 暴力检测 视频内容分析
下载PDF
基于递归卷积神经网络的行人检测方法 被引量:5
13
作者 肖立志 张争 《信阳师范学院学报(自然科学版)》 CAS 北大核心 2021年第4期655-660,共6页
为了提高视频中行人检测的准确度,提出了一种基于递归卷积神经网络的行人检测方法.该方法利用递归卷积神经网络融合视频中连续图像的上下文信息,以实现准确的行人检测.首先,利用卷积神经网络提取连续图像的多个特征图组;然后,根据先后次... 为了提高视频中行人检测的准确度,提出了一种基于递归卷积神经网络的行人检测方法.该方法利用递归卷积神经网络融合视频中连续图像的上下文信息,以实现准确的行人检测.首先,利用卷积神经网络提取连续图像的多个特征图组;然后,根据先后次序,将多个特征图输入到递归卷积神经网络中,形成一张关于行人位置的掩码图;最后,通过在掩码图上预测行人的检测框,获得视频中当前图像的行人检测结果.实验结果表明:相比于其他行人检测方法,该方法在ETH、CUHK和PETS 2007三个数据集上都取得较准确的行人检测结果. 展开更多
关键词 行人检测 递归神经网络 卷积神经网络 监控场景 视频内容分析
下载PDF
视频鸟类行为研究中基于尺度不变特征变换的形态分类算法 被引量:5
14
作者 谢慕哲 罗泽 阎保平 《科研信息化技术与应用》 2014年第3期87-94,共8页
本文介绍了我们在动物行为的智能分析研究中,针对青海湖野鸟监控获得的视频数据,基于数字图像处理及机器学习的方法对斑头雁形态样本进行分类的方法。我们首先采用尺度不变特征变换提取样本的特征点,选择不同的聚类中心对训练样本的特... 本文介绍了我们在动物行为的智能分析研究中,针对青海湖野鸟监控获得的视频数据,基于数字图像处理及机器学习的方法对斑头雁形态样本进行分类的方法。我们首先采用尺度不变特征变换提取样本的特征点,选择不同的聚类中心对训练样本的特征点进行聚类,为每个样本生成特征向量来对样本进行描述,然后采用K最近邻算法建立模型,对斑头雁形态进行分类。对提出的方法进行了实验验证。通过恰当的特征选取,测试数据的分类准确率达到了73.75%。实验表明,本文提出的方法可以有效地从视频数据中实现斑头雁形态的自动分类。 展开更多
关键词 视频分析 形态分类
原文传递
基于词组学习的视频文本检测方法 被引量:4
15
作者 朱成军 蒲菊华 +1 位作者 薛玲 熊璋 《计算机工程》 CAS CSCD 北大核心 2008年第13期185-187,共3页
提出一种以词组作为模式识别对象的中英文视频文本检测算法,其根据视频中文本的笔画结构特点和聚集特性构造一个18维的特征向量,利用支持向量机将视频帧分为文本和非文本区域,通过多分辨率模型检测不同尺寸的文本,采用扩张-收缩的后处... 提出一种以词组作为模式识别对象的中英文视频文本检测算法,其根据视频中文本的笔画结构特点和聚集特性构造一个18维的特征向量,利用支持向量机将视频帧分为文本和非文本区域,通过多分辨率模型检测不同尺寸的文本,采用扩张-收缩的后处理过程校准文本区域位置。实验结果表明,该算法的检测准确率达93.17%,误检率仅为0.73%。 展开更多
关键词 视频内容分析 视频文本检测 支持向量机
下载PDF
视频摘要系统的研究与实现 被引量:2
16
作者 王垚 叶光明 《电子设计工程》 2016年第10期184-186,193,共4页
基于安防领域需要快速检索监控视频中嫌疑人信息需求。本文设计了一种视频摘要系统,深入分析了该系统的设计目标和组成模型。在具体实现方面,该系统通过结合目标形状特征和运动特性来对目标进行分类,并依据目标的运动轨迹提取视频关键... 基于安防领域需要快速检索监控视频中嫌疑人信息需求。本文设计了一种视频摘要系统,深入分析了该系统的设计目标和组成模型。在具体实现方面,该系统通过结合目标形状特征和运动特性来对目标进行分类,并依据目标的运动轨迹提取视频关键帧的方法合成视频摘要。系统完成后通过导入监控视频文件生成摘要验证测试,该视频摘要系统能在69.44%压缩比的前提下达到零误报率。实验结果,该视频摘要系统压缩比高,识别误差小,能极大提高检索视频中信息的效率。 展开更多
关键词 视频检索 视频摘要 视频内容分析 摘要生成
下载PDF
基于上下文信息的新闻故事单元分割 被引量:2
17
作者 冀中 苏育挺 +2 位作者 宋星光 纪旭 华蕊 《天津大学学报》 EI CAS CSCD 北大核心 2009年第2期153-158,共6页
为了有效检索和管理新闻视频资源,提出了一种利用多模态特征、基于上下文信息的新闻故事单元分割方法.首先利用字幕变化、音频类型和视频镜头类型信息将新闻镜头序列转换成为相应的关键词序列,使新闻故事单元分割转换成为文体序列分割... 为了有效检索和管理新闻视频资源,提出了一种利用多模态特征、基于上下文信息的新闻故事单元分割方法.首先利用字幕变化、音频类型和视频镜头类型信息将新闻镜头序列转换成为相应的关键词序列,使新闻故事单元分割转换成为文体序列分割的问题;然后应用一种有效的序列分割模型——条件随机场,来分割新闻故事单元.对多段视频的测试结果证明了该方法的有效性,取得了查全率为72.9%、查准率为88.4%的较好结果. 展开更多
关键词 新闻故事单元分割 上下文信息 条件随机场 视频内容分析 新闻视频
下载PDF
基于人物关系分析的视频自动摘要算法 被引量:1
18
作者 谷列先 丁晓青 《高技术通讯》 EI CAS CSCD 北大核心 2010年第9期929-933,共5页
为了更好地反映视频中的语义内容,在系统总结已有的基于低层特征的视频自动摘要算法的基础上提出了两种基于人物关系分析的新摘要算法,即适应于快速预览需求的One-Shot摘要算法和适应于个性化定制需求的用户自适应摘要算法。与已发表的... 为了更好地反映视频中的语义内容,在系统总结已有的基于低层特征的视频自动摘要算法的基础上提出了两种基于人物关系分析的新摘要算法,即适应于快速预览需求的One-Shot摘要算法和适应于个性化定制需求的用户自适应摘要算法。与已发表的大部分基于低层特征的视频摘要算法相比,提出的这两种摘要算法能够更好地反映视频中的语义信息。在实际电影视频数据上的实验结果证明了所提算法的有效性。 展开更多
关键词 视频摘要 视频内容分析 语义信息
下载PDF
视频内容分析系统的结构设计与应用 被引量:1
19
作者 邹治伟 李宏权 《武汉船舶职业技术学院学报》 2005年第5期36-38,共3页
本文提出了一种视频内容分析的系统结构,重点分析了几种视频分析方法视频结构分析,代表帧提取和视频运动分析,并讨论了在视频内容分析基础上的应用,即基于内容的视频检索、视频和视频挖掘。
关键词 视频内容分析 镜头分割 场景分割 代表帧 视频挖掘 视频内容分析 系统结构 结构设计 应用 基于内容的视频检索 结构分析 视频分析 运动分析 代表帧
下载PDF
基于隐马尔可夫模型的新闻视频挖掘技术
20
作者 丁瑾 《淮阴工学院学报》 CAS 2009年第5期34-38,共5页
视频挖掘作为多媒体数据挖掘的典型代表,成为研究的热点。界定了视频挖掘的概念,以新闻视频挖掘为例,对视频挖掘的过程进行了具体分析。利用隐马尔可夫模型(HMM)对新闻数据库进行视频挖掘,根据模型建立系统,通过实验证明对新闻视频中特... 视频挖掘作为多媒体数据挖掘的典型代表,成为研究的热点。界定了视频挖掘的概念,以新闻视频挖掘为例,对视频挖掘的过程进行了具体分析。利用隐马尔可夫模型(HMM)对新闻数据库进行视频挖掘,根据模型建立系统,通过实验证明对新闻视频中特征值的平均检测率可达82.3%。 展开更多
关键词 HMM 视频挖掘 视频内容分析
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部