基于音视频模板匹配的新闻视频识别方法被引量：1

News Video Recognition Approach Based on Audio-video Template Matching

下载PDF

导出

摘要提出了一种基于音视模板匹配的新闻视频识别方法。在模板建立过程中,从新闻视频片头中的主题音乐提取音频模板,从主持人镜头中的扩展人脸区域提取视觉模板,这两者共同构成音视模板;在识别过程中,对电视视频流先进行音频模板匹配,然后由匹配通过的候选时间点定位到相应的视频镜头,接着通过视觉模板对镜头中的扩展人脸区域进行匹配,进而确定主持人镜头,最后完成新闻视频识别。实验结果表明,该方法计算效率高、简单易操作,具有较好的实用价值。 A news video recognition method is presented based on audio-video template matching in this paper. During the process of template build- ing, the audio template is extracted from the theme music of news video and the visual template is extracted from the extended face region of the anchor shot. During the process of recognition ,firstly, audio model matching is conducted upon news video stream to get candidate time points. Then video shots are located corresponding to these time points and match the extended face region detected in video shots with visual model. In the end, the anchorperson shots are fixed, thus the process of news video recognition is finished. Experimental resuhs show that this method is of low computing complexity, high detecting accuracy and fairly good practical value.

作者张大宝彭天强

机构地区河南人民广播电台河南工程学院计算机学院

出处《电视技术》北大核心 2013年第23期238-240,共3页 Video Engineering

关键词新闻视频音视频模板视频检索 news video audio-video template video retrieval

分类号 TN948 [电子电信—信号与信息处理] TP391.4 [电子电信—信息与通信工程]

引文网络
相关文献

参考文献10

1田破荒,李弼程,彭天强.一种有效的视频文字提取方法[J].电视技术,2007,31(10):87-89. 被引量：1
2RASHEED Z,SHEIKH Y,SHAH M. On the use of computable features for fihn classification[ J ]. IEEE Transactions on Circuits and Systems for Video Technology ,2005,15 ( 1 ) :52~34. 被引量：1
3LIU Zhu, HUANG Jincheng, WANG Yao. Classification of "IV programs based on audio information using hidden Markov model[ C]//Proc. IEEE Signal Processing Society Workshop on Multimedia Signal Processing. [ S. I. ] :IEEE Press,1998:27-32. 被引量：1
4梁刘红,富亮,薛向阳.电视节目自动分割算法[J].计算机研究与发展,2004,41(9):1514-1520. 被引量：1
5WANG Jinqiao, DUAN Lingyu, LIU Qingshan, et al. A muhimodal scheme for program segmentation and representation in broadcast video stream[ J ]. IEEE Trmlsactions on Multimedia,2008,10( 3 ) :393-408. 被引量：1
6张晶,范明,冯文全,董金明.基于MFCC参数的说话人特征提取算法的改进[J].电声技术,2009,33(9):61-64. 被引量：16
7陈红红,刘加.基于MLER和GMM的语音音乐分类[J].电声技术,2011,35(10):47-50. 被引量：2
8万书婷,曾向阳,王强.混响环境中的视-听语音识别[J].电声技术,2012,36(12):42-45. 被引量：3
9赵锞锞,彭天强,李弼程.新闻视频主持人镜头检测方法[J].计算机工程,2008,34(19):239-241. 被引量：3
10LIU Z,HUANG Q. Adaptive anchor detection using on-line trained audi- o/visual model[ C ]//Proc. SPIE. San Jose,CA : [ s. n. ] ,2000:156-167. 被引量：1

二级参考文献48

1胡艳芳,吴及,刘慧星.基于MLER的语音/音乐分类方法[J].清华大学学报（自然科学版）,2008,48(S1):720-724. 被引量：6
2于俊清,汤旸,周向东.基于主色特征识别的新闻视频口播帧[J].计算机工程与科学,2004,26(8):28-31. 被引量：3
3刘文萍,付晓玲,赵会群,李晓丽.一种新的彩色图象文字提取算法[J].计算机工程与应用,2005,41(21):79-82. 被引量：4
4吴佳栋,陈光冶.语音信号去混响原理与技术[J].电声技术,2006,30(5):63-67. 被引量：9
5M Ortega, Y Rui, K Chakrabarti, et al. Supporting similarity queries in MARS. The 5th ACM Int'l Multimedia Conference, Seattle, Washington, 1997 被引量：1
6D Ponceleon, A Amir, S Srinivasan, et al. CueVideo: Automated multimedia indexing and retrieval. The 7th ACM Int'l Conf on Multimedia (Part 2), Orlando, Florida, USA, 1999 被引量：1
7W Qi, L Gu, H Jiang, et al. Integrating visual, audio and text analysis for news video. The 7th IEEE Int'l Conf on Image Processing (ICIP2000), Vancouver, 2000 被引量：1
8S F Chang, W Chen, H J Meng, et al. VideoQ: An automated content based video search system using visual cues. The 5th Int'l Multimedia Conf, Seattle, Washington, 1997 被引量：1
9A Hauptmann, R Jin, N Papernick, et al. Video retrieval with the informedia digital video library system. The Text Retrieval Conference, Gaithersburg, MD, 2001 被引量：1
10Y Rui, T Huang, S Mehrotra. Exploring video structure beyond the shots. The IEEE Int'l Conf on Multimedia Computer and Systems, Austin, Texas, 1998 被引量：1

共引文献20

1黄成玉,张全柱,赖斌.声纹识别中MEL参数的提取研究[J].电源技术,2011,35(4):433-435. 被引量：6
2李粤峰,徐博.一种改进的新闻主持人镜头聚类算法[J].现代电子技术,2011,34(16):78-81. 被引量：1
3高文曦,于凤芹.对MFCC进行GMM聚类的汉语数字识别方法[J].计算机系统应用,2011,20(11):167-170. 被引量：1
4唐夫乾,汪亚明,郑俊褒.基于LabVIEW的语音身份认证系统[J].工业控制计算机,2011,24(12):22-23. 被引量：1
5王彪.基于EMD法的语音信号特征提取方法研究[J].科学技术与工程,2012,20(10):2462-2464. 被引量：1
6王彪.一种改进的MFCC参数提取方法[J].计算机与数字工程,2012,40(4):19-21. 被引量：5
7王钟斐,王彪.基于短时能量—LPCC的语音特征提取方法研究[J].计算机与数字工程,2012,40(11):79-80. 被引量：5
8李素平.基于相对谱滤波的MFCC参数提取[J].电子世界,2013(13):104-104.
9殷晓虎,周娟,张静.基于会议系统混音算法的研究与应用[J].电声技术,2014,38(3):53-55. 被引量：2
10韦国刚,周萍.基于Mel系数的特征参数在模仿语音中的应用研究[J].电子世界,2014(6):61-61.

同被引文献9

1赵丽红,刘纪红,徐心和.人脸检测方法综述[J].计算机应用研究,2004,21(9):1-4. 被引量：43
2蔡岳建,潘孝富,庄钟春晓.音乐的速度与调式对大学生情绪影响的实证研究[J].心理科学,2007,30(1):196-198. 被引量：27
3范会敏,王浩.模式识别方法概述[J].电子设计工程,2012,20(19):48-51. 被引量：45
4汪镭,郑晓妹,申林.进化作曲研究[J].上海师范大学学报（自然科学版）,2014,43(1):60-66. 被引量：1
5田梅,刘瑶,周冰颖,余亮,黄智兴.结合Kinect与MIDI的和声辅助训练系统[J].计算机应用与软件,2015,32(8):68-71. 被引量：1
6曹西征,牛靖雯,吴瑞琪,孙志勇.面向蒙古族歌曲旋律的自动伴奏算法[J].计算机工程,2016,42(7):304-309. 被引量：2
7郑晓妹,汪镭,申林,王玉善,李东洋,吴启迪.民歌旋律马尔可夫作曲模式[J].计算机应用,2017,37(A01):361-364. 被引量：2
8郑银环,王嘉珺,郭威,王备战.基于特征旋律挖掘的二阶马尔可夫链在算法作曲中的研究与应用[J].计算机应用研究,2018,35(3):849-853. 被引量：6
9邓阳,周莉,许多,岳诚成,游梦琪,周蕊格.基于动态规划的自适应和弦编配算法研究[J].复旦学报（自然科学版）,2019,58(3):393-400. 被引量：3

引证文献1

1游梦琪,陈柳姣,周莉,贺晶娴.基于模板匹配的中国民族音乐调式识别研究[J].复旦学报（自然科学版）,2020,59(3):262-269. 被引量：4

二级引证文献4

1王力,王鑫,谢凌云.音乐信号处理的特征分析综述[J].中国传媒大学学报（自然科学版）,2021,28(6):59-72. 被引量：2
2侯清睿,安冬.基于人工神经网络的音符识别研究[J].自动化与仪器仪表,2022(1):53-58. 被引量：1
3张辽艳.基于特征挖掘的相似音乐片段检测方法研究[J].自动化技术与应用,2022,41(10):152-154.
4任伟鑫,车明锦,汪照文,孟文武,李沁雨,胡佳弋,夏凡,李伟.CNPM Database:一个用于计算音乐学的中国民族五声调式数据库[J].复旦学报（自然科学版）,2022,61(5):555-563. 被引量：1

1花的神明.提取音频别忘了Movie Maker[J].电脑迷,2007,0(7):13-13.
2赵锞锞,彭天强,李弼程.新闻视频主持人镜头检测方法[J].计算机工程,2008,34(19):239-241. 被引量：3
3徐骏,张炯,周洞汝.基于COM技术的新闻视频主持人镜头实时检测方法[J].计算机应用,2002,22(5):27-30. 被引量：6
4刘琪.浅谈视频片头的创意与制作[J].硅谷,2008,1(22):107-107.
5李粤峰,徐博.一种改进的新闻主持人镜头聚类算法[J].现代电子技术,2011,34(16):78-81. 被引量：1
6邱睿.超酷视频片头跟我做[J].玩电脑,2004(7):126-128.
7Harman／Kardon哈曼 BDS 800／600／400蓝光家庭影院系统[J].视听前线,2011(6):87-87.
8郑继明,魏国华,吴渝.有效的基于内容的音频特征提取方法[J].计算机工程与应用,2009,45(12):131-133. 被引量：6
9阿立.视频音乐提取随时听[J].电脑爱好者,2017,0(4):32-33.
10布布.打造酷绚视频片头[J].网友世界,2004(18):51-52.

电视技术

2013年第23期

浏览历史

内容加载中请稍等...

基于音视频模板匹配的新闻视频识别方法被引量：1

参考文献10

二级参考文献48

共引文献20

同被引文献9

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于音视频模板匹配的新闻视频识别方法 被引量：1

参考文献10

二级参考文献48

共引文献20

同被引文献9

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于音视频模板匹配的新闻视频识别方法被引量：1