从存在伴奏的歌曲中提取歌声基音的时域算法被引量：1

A Time-domain Algorithm of Extraction Singing Voice’s Pitch with Musical Instrument Accompaniment

下载PDF

导出

摘要提取歌曲中的唱者基音拥有广泛的用途,如可用于基于内容的音频检索等。在歌曲中提取唱者基音存在许多与普通语音处理不同的问题,传统的时域算法在强音乐背景的干扰下很难正确提取唱者人声基音,近年来研究歌声特殊性的各系统则采用较为复杂的训练模型和频域算法。本系统为改进传统时域算法,提高歌声基音提取的准确度,同时为降低算法复杂度,利于用硬件实现基于内容的音频检索系统,提出一种以人声特征着眼、以开环-闭环基音提取为框架的时域算法。实验证明此算法在歌声基音提取上相对传统时域算法准确度有显著提高。 Extraction singing voice from music with music instrument accompaniment can be applied in many areas such as content-based music retrieval. Conventional time-domain algorithms perform poor in strong noise circumstance due to its remarkable diversity from ordinary speech processing. Newly-emerging systems dealing with singing voice and background music employ complex training models and realize it in frequency domain. With the consideration of hardware implementation and resource saving, our system proposes a new time-domain algorithm, which is based on human voice feature. The system adopted an open-loop and closeloop framework. Simulations on MATLAB show that accuracy of pitch extraction is superior to conventional time-domain algorithms and some other modified ones.

作者王佑民赵杰江城

机构地区上海交通大学电子工程系

出处《电子工程师》 2007年第11期33-36,61,共5页 Electronic Engineer

关键词浊音能量判决法开环-闭环基音提取人声/乐音分离 voiced sound energy decision open-loop and close-loop pitch extraction speech/music discrimination

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1RABINER L R, CHENG M J, ROSENBERG A E, et al. A comparative performance study of several pitch detection algorithms[ J ]. IEEE Trans on Acoustics, Speech, and Signal Processing, 1976, 24(5) : 399-418. 被引量：1
2ROSS M J, SHAFFER H L, COHEN A, et al. Average magnitude difference function pitch extractor[ J ]. IEEE Trans on Acoustics, Speech, and Signal Processing, 1974, 22 (5) : 353-362. 被引量：1
3MARKEL J D. The SIFT algorithm for fundamental frequency estimation[ J]. IEEE Trans on Audio Electroacoust, 1972,20 (5) : 367-377. 被引量：1
4赵力编著..语音信号处理[M].北京:机械工业出版社,2003:316.
5张文耀,许刚,王裕国.循环AMDF及其语音基音周期估计算法[J].电子学报,2003,31(6):886-890. 被引量：40
6MERON Y, HIROSE K. Separation of singing and piano sounds[ C ]//Proceedings of 5th International Conference on Spoken Language Processing ( ICSLP' 98 ) : Vol 3, Nov 30Dec 4, 1998, Sydney, Australia. 1998: 1059-1062. 被引量：1
7HU G, WANG D L. Monaural speech segregation based on pitch tracking and amplitude modulation [ J ]. IEEE Trans on Neural Networks 2004, 15(5): 1135-1150. 被引量：1
8LI Y, WANG D L. Detecting pitch of singing voice in polyphonic audio[ C ]//Proceedings of International Conference on Acoustics, Speech, and Signal Processing ( ICASSP' 05 ) : Vol 3, Mar 18-23, 2005, Philadelphia, PA, USA. Piscataway, NJ, USA: IEEE, 2005: 17-20. 被引量：1
93GPP TS 26. 190 V 6.0.0. AMR wideband speech codec: transcoding function[ S]. 2004. 被引量：1

二级参考文献6

1A．V奥本海姆黄建国等（译）.离散时间信号处理[M].北京:科学出版社,1998.. 被引量：3
2杨行逡迟惠生等.语音信号数字处理[M].北京：电子工业出版社,1995.. 被引量：1
3Wolfgang Hess. Pitch Determination of Speech Signals [ M ]. New York: Springer-Verlag, 1983. 被引量：1
4Ross M J, et al. Average magnitude difference function pitch extractor[J]. IEEE Trans on Acoustics, Speech, and Signal Processing, 1974,22(5) :353 - 362. 被引量：1
5Thomas W Parsons. Voice and Speech Processing [ M]. New York:Mc-Graw-Hill, 1986. 被引量：1
6顾良,刘润生.高性能汉语语音基音周期估计[J].电子学报,1999,27(1):8-11. 被引量：19

共引文献39

1张超琼,苗夺谦,岳晓冬.基于高斯混合模型的语音性别识别[J].计算机应用,2008,28(S2):360-362. 被引量：1
2李娟娟,俞一彪,薛广荣.说话人性别识别系统的DSP实现[J].现代电子技术,2005,28(24):37-39. 被引量：1
3赵彦平,赵晓晖.用于语音端点检测的鲁棒性特征提取新方法[J].吉林大学学报（工学版）,2006,36(1):77-81. 被引量：6
4刘建,郑方,吴文虎.基于幅度差平方和函数的基音周期提取算法[J].清华大学学报（自然科学版）,2006,46(1):74-77. 被引量：22
5李飞,覃爱娜,赖旭芝.过渡音的基音周期检测方法[J].中南大学学报（自然科学版）,2006,37(4):786-789. 被引量：1
6刘建,郑方,邓菁,吴文虎.基于混合幅度差函数的基音提取算法[J].电子学报,2006,34(10):1925-1928. 被引量：16
7罗亚飞,鲍长春.基于DCT分带谱熵与信号分解的高精度基音检测算法[J].电子学报,2007,35(1):13-22. 被引量：5
8余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
9徐明,陈知困,黄云森.基于FFT-ACF和候选值估计的基音周期提取方法[J].深圳大学学报（理工版）,2007,24(4):388-392. 被引量：2
10魏广英.一种改进的基于ATeager能量和循环平均幅度差的基音检测[J].福建电脑,2008,24(2):96-96.

同被引文献4

1高路斯,邹龙江,潘学民.设计性综合开放实验教学模式探索[J].实验技术与管理,2006,23(3):96-97. 被引量：56
2沈媛媛,刘益成.《数字信号处理》课程教学改革探讨[J].中国现代教育装备,2008(10):98-99. 被引量：9
3许爽,李敏.综合设计性数字信号处理实验的探讨[J].大连民族学院学报,2010,12(3):277-280. 被引量：16
4王忠良.Matlab在综合设计性数字信号处理实验中的应用[J].铜陵学院学报,2013,12(1):105-107. 被引量：5

引证文献1

1刘婷,王帆,杨婷.《数字信号处理》综合性课程设计的改革与探索[J].山西电子技术,2015,0(2):82-84. 被引量：5

二级引证文献5

1罗倩.数字信号处理课程设计中创新性实践探索[J].教育教学论坛,2016(11):145-146. 被引量：6
2陈海燕,何继爱,蔺莹.基于问题引导的“数字信号处理”课程教学方法研究与实践[J].教育教学论坛,2018(4):173-174. 被引量：7
3王颖,孔繁之,刘贵勤,王玉锋.BOPPPS模型在医学院校数字信号处理课程教学改革中的应用[J].医学信息学杂志,2019,40(8):86-89. 被引量：5
4李荔.电子信息科学专业“数字信号处理”课程的教学方法研究与实践[J].科教导刊（电子版）,2019,0(33):132-132.
5丁惠君,刁现芬,陈昕.协同合作与创新思维训练在专修课程中的探索——基于“医学数字信号处理”的教学方法与理念改革[J].教育教学论坛,2023(21):83-86. 被引量：1

1比拼平价胆机的功夫——TSE“胆圣”新推TS-6BQ5电子管放大器[J].视听技术,2007(4):22-22.
2德国雅堡JGY-8000PW电源线[J].高保真音响,2007(8):8-8.
3TSE胆圣推挽电子管机TS-6BQ5[J].高保真音响,2007(4):6-6.
4凌波微步,小路.于宁静的音乐背景中听惊雷 Moon neo 340i合并式功放[J].视听前线,2014(7):42-45.
5吴春辉,陈洪生.基于内容的音频检索关键技术研究与设计[J].咸宁学院学报,2007,27(6):66-68. 被引量：2
6王佑民,江城,吴丰博.用FPGA实现基于内容的音频检索系统[J].中国制造业信息化（学术版）,2007,36(9):66-68. 被引量：1
7四款微视频服务介绍:微视频时代即将到来?[J].硅谷,2011(10).
8李鹏展.它让音质得以全面提升隆宇LY-208-1电源净化器试听有感[J].视听技术,2008(11):72-75.
9朱爱红,李连.基于内容的音频检索综述[J].微机发展,2003,13(12):58-60. 被引量：11
10白云晖.基于内容的音频检索[J].广播与电视技术,2007,34(6):30-30. 被引量：3

电子工程师

2007年第11期

浏览历史

内容加载中请稍等...

从存在伴奏的歌曲中提取歌声基音的时域算法被引量：1

参考文献9

二级参考文献6

共引文献39

同被引文献4

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

从存在伴奏的歌曲中提取歌声基音的时域算法 被引量：1

参考文献9

二级参考文献6

共引文献39

同被引文献4

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

从存在伴奏的歌曲中提取歌声基音的时域算法被引量：1