针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系...针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系统,引入联合自适应算法来解决系统中测试和训练条件的失配问题.研究了三种自适应方法用于系统的不同阶段:1)基于受约束的最大似然线性回归(Constr ained maximum likelihood linear regression,CMLLR)的声学模型自适应;2)基于全局N元文法的音位特征向量自适应;3)VSM模型中的支持向量机(Support vector machines,SVM)自适应.在综合采用多种自适应技术后,PRVSM系统的性能有了较大的提高,在NIST LRE 2009测试库上对于30s、10s和3s的测试段,基于不同音素识别器的PRVSM系统的等错误率(Equal errorrate,EER)分别相对降低了18%~23%、12%~20%以及5%~9%.展开更多
超分辨率重建在视频监控、高清晰度电视、遥感图像、医学图像处理等领域具有广阔的应用前景.最大后验估计(maximum a posteriori,MAP)法是普遍采用的一种超分辨率重建方法.针对传统MAP法存在的局限性,本文提出了一种基于MAP框架的时空...超分辨率重建在视频监控、高清晰度电视、遥感图像、医学图像处理等领域具有广阔的应用前景.最大后验估计(maximum a posteriori,MAP)法是普遍采用的一种超分辨率重建方法.针对传统MAP法存在的局限性,本文提出了一种基于MAP框架的时空联合自适应视频序列超分辨率重建算法.时空联合自适应机制的引入使得算法在保持边缘的同时可减小错误运动估计矢量对重建图像质量的影响.实验结果表明,算法具有重建质量好、边缘保持能力强、收敛速度快等特点.展开更多
文摘针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系统,引入联合自适应算法来解决系统中测试和训练条件的失配问题.研究了三种自适应方法用于系统的不同阶段:1)基于受约束的最大似然线性回归(Constr ained maximum likelihood linear regression,CMLLR)的声学模型自适应;2)基于全局N元文法的音位特征向量自适应;3)VSM模型中的支持向量机(Support vector machines,SVM)自适应.在综合采用多种自适应技术后,PRVSM系统的性能有了较大的提高,在NIST LRE 2009测试库上对于30s、10s和3s的测试段,基于不同音素识别器的PRVSM系统的等错误率(Equal errorrate,EER)分别相对降低了18%~23%、12%~20%以及5%~9%.
文摘超分辨率重建在视频监控、高清晰度电视、遥感图像、医学图像处理等领域具有广阔的应用前景.最大后验估计(maximum a posteriori,MAP)法是普遍采用的一种超分辨率重建方法.针对传统MAP法存在的局限性,本文提出了一种基于MAP框架的时空联合自适应视频序列超分辨率重建算法.时空联合自适应机制的引入使得算法在保持边缘的同时可减小错误运动估计矢量对重建图像质量的影响.实验结果表明,算法具有重建质量好、边缘保持能力强、收敛速度快等特点.