期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
实时语音识别技术在广播电视安全播出AI辅助值守中的开发与应用 被引量:8
1
作者 郑小波 虞飞江 《广播与电视技术》 2021年第12期111-116,共6页
本文对实时语音识别技术在广播电视安全播出AI辅助值守中的开发与应用进行了阐述,针对语音识别技术应用的难点和主要问题进行了探讨,提出了关键性的技术解决方案,对颠覆性改变传统语言节目安播值守现状,引入基于实时语音识别技术的AI人... 本文对实时语音识别技术在广播电视安全播出AI辅助值守中的开发与应用进行了阐述,针对语音识别技术应用的难点和主要问题进行了探讨,提出了关键性的技术解决方案,对颠覆性改变传统语言节目安播值守现状,引入基于实时语音识别技术的AI人工智能辅助值守具有启示价值。 展开更多
关键词 实时语音识别 安全播出 AI 辅助值守 开发 应用
下载PDF
基于嵌入式图像处理及路径规划的智能导盲仪 被引量:6
2
作者 杨馥语 陈娟 《流体测量与控制》 2022年第3期65-68,共4页
当前导盲仪存在功能单一、不能动态规划路径等问题,因此研发了一款基于嵌入式的智能导盲仪。选用语音识别模块,将语音输入的目的地信息转换成文字,选用高德地图API进行开发,并结合语音合成(TTS)芯片,对实时规划的路径进行语音播报;基于... 当前导盲仪存在功能单一、不能动态规划路径等问题,因此研发了一款基于嵌入式的智能导盲仪。选用语音识别模块,将语音输入的目的地信息转换成文字,选用高德地图API进行开发,并结合语音合成(TTS)芯片,对实时规划的路径进行语音播报;基于车辆、行人等可移动式目标,展开基于YOLOv5的目标检测,训练适合所述场景的权重,用于监测复杂路况;选取改进的Deeplabv3+语义分割算法,通过对图像像素点阈值进行判断,检测斑马线、车道线等交通标识物,用于引导盲人定位并通过人行横道;采用HC-SR04超声波测距模块,该模块提供2~400 cm的非接触式距离感测功能,可以近距离地帮助盲人躲避危险;选取树莓派4B作为主控核心,通过将各模块搭载到linux系统中进行运算,实现导盲仪的总体功能。 展开更多
关键词 导盲仪 实时路径规划 斑马线识别 超声波避障 语音识别与合成
下载PDF
基于5G+RTK定位技术的智能巡检管理系统
3
作者 郭科跃 《智能物联技术》 2024年第6期77-80,共4页
介绍一种智能巡检系统,包含巡检计划、现场巡检、巡检监控、巡检报警、巡检监管、巡检问题、巡检分析及巡检绩效评价8个功能模块。巡检App与5G、语音识别、图像识别及实时动态(Real-Time Kinematic,RTK)定位等多种新技术有效融合,为专... 介绍一种智能巡检系统,包含巡检计划、现场巡检、巡检监控、巡检报警、巡检监管、巡检问题、巡检分析及巡检绩效评价8个功能模块。巡检App与5G、语音识别、图像识别及实时动态(Real-Time Kinematic,RTK)定位等多种新技术有效融合,为专业管理应用提供智能化手段,提高系统的智能化应用水平。该系统通过与企业双重预防平台无缝集成,实现了系统间巡检任务和巡检结果的数据共享,减轻了基层负担,为类似企业提供了融合经验。 展开更多
关键词 智能巡检 5G 实时动态(RTK) 语音识别 图像识别 双重预防平台
下载PDF
Transmission Considerations with QoS Support to Deliver Real-Time Distributed Speech Recognition Applications
4
作者 Zhu Xiao-gang Zhu Hong-wen Rong Meng-tian 《Wuhan University Journal of Natural Sciences》 EI CAS 2002年第1期65-70,共6页
Distributed speech recognition (DSR) applications have certain QoS (Quality of service) requirements in terms of latency, packet loss rate, etc. To deliver quality guaranteed DSR application over wirelined or wireless... Distributed speech recognition (DSR) applications have certain QoS (Quality of service) requirements in terms of latency, packet loss rate, etc. To deliver quality guaranteed DSR application over wirelined or wireless links, some QoS mechanisms should be provided. We put forward a RTP/RSVP transmission scheme with DSR-specific payload and QoS parameters by modifying the present WAP protocol stack. The simulation result shows that this scheme will provide adequate network bandwidth to keep the real-time transport of DSR data over either wirelined or wireless channels. 展开更多
关键词 distributed speech recognition quality of service real-time transmission protocol resource reservation protocol wireless application protocol
下载PDF
实时语音识别系统语言层的改进
5
作者 鄢翔 王作英 《计算机工程与应用》 CSCD 北大核心 2002年第19期65-66,200,共3页
该文介绍了在语音识别语言层搜索中为了实时化的需要所做的改进。文章应用词典树技术提高了从拼音到词的查找速度,并且使词典更易动态改动;同时采用多阶段搜索的框架,并在第一阶段搜索中采用一元剪枝和“2.5元”剪枝技术,极大提高了搜... 该文介绍了在语音识别语言层搜索中为了实时化的需要所做的改进。文章应用词典树技术提高了从拼音到词的查找速度,并且使词典更易动态改动;同时采用多阶段搜索的框架,并在第一阶段搜索中采用一元剪枝和“2.5元”剪枝技术,极大提高了搜索速度。实验表明,在识别率没有受到影响的情况下,识别速度提高了近一倍。 展开更多
关键词 实时语音识别系统 语言层 语言层解码器 词典树
下载PDF
MRCPv2应用于实时连续语音识别的研究 被引量:1
6
作者 陈茂国 《科技创业月刊》 2016年第3期122-124,共3页
通过分析MRCPv2协议在语音识别中的典型应用,发现其在实时连续语音识别应用场景中的不足,通过扩展MRCPv2协议解决识别模式区分以及识别内容实时连续上报问题,为电信客服领域辅助语音识别的应用打下基础。
关键词 MRCPv2 实时 连续语音识别
下载PDF
基于VC和Matlab的实时语音识别系统研究
7
作者 伊磊 刘任平 聂欢欢 《计算机时代》 2011年第9期32-33,共2页
介绍了一种基于VC和Matlab混合编程的实时语音识别系统。在VC环境下,通过借助Windows MultimediaAPI实现对信号的实时采集,并且通过Matlab强大的计算功能,实现对语音信号的端点检测、特征值提取和模板匹配,从而实现实时的语音识别。
关键词 VC MATLAB 实时语音识别 MFCC DTW 非特定人 MEX
下载PDF
基于DSP的高速实时语音识别系统的设计与实现 被引量:4
8
作者 李邵梅 陈鸿昶 王凯 《现代电子技术》 2007年第15期109-111,共3页
识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱... 识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱系数为特征参数,采用动态时间弯折算法的高速语音实时识别系统,识别速率达0.29倍实时,可实现多路语音的并行识别。 展开更多
关键词 多路实时语音识别 数字信号处理器 美尔频率倒谱系数 动态时间弯折
下载PDF
基于实时交互数字人技术的融合智能终端设计与实现
9
作者 王丁 刘阳桢 陈嘉 《广播与电视技术》 2024年第9期24-27,共4页
本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进... 本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进行深度融合,可以提升政务服务的智能化水平,为智慧城市建设提供新思路和实践路径。 展开更多
关键词 实时交互数字人 广电虚拟主持人 语音识别 自然语言处理 文本到语音转换 智能终端
下载PDF
机器人手术网络遥控系统中的语音识别 被引量:1
10
作者 周振辉 富钢 陈文楷 《沈阳航空工业学院学报》 2004年第3期28-30,共3页
在广泛参考了国内外关于语音识别技术研究及其应用的优秀论文和著作后 ,简单介绍了语音识别技术及其算法。在熟悉了微软的语音开发工具包的基础上 ,汲取其中和本项目相关的部分 ,具体描述了完成机器人手术网络遥控系统中的语音识别部分... 在广泛参考了国内外关于语音识别技术研究及其应用的优秀论文和著作后 ,简单介绍了语音识别技术及其算法。在熟悉了微软的语音开发工具包的基础上 ,汲取其中和本项目相关的部分 ,具体描述了完成机器人手术网络遥控系统中的语音识别部分的方法和实现的步骤。利用开发工具MicrosoftVC ++6 .0和MicrosoftSpeechAPI 5 .1 。 展开更多
关键词 语音识别 SAPI 机器人手术 网络遥控系统 远程手术
下载PDF
嵌入式实时英语语音识别系统的设计与研究 被引量:13
11
作者 周晓武 《电子设计工程》 2017年第8期187-190,共4页
针对本次英语语音识别系统的设计之中,应用嵌入式技术,可以应用嵌入式DSP语音芯片,以连续隐含马尔可夫模型为基本识别框架,优化设计英语语音识别系统。结果证实,设计出基于嵌入式的实时英语语音识别系统,可以在实际应用中实时识别出不... 针对本次英语语音识别系统的设计之中,应用嵌入式技术,可以应用嵌入式DSP语音芯片,以连续隐含马尔可夫模型为基本识别框架,优化设计英语语音识别系统。结果证实,设计出基于嵌入式的实时英语语音识别系统,可以在实际应用中实时识别出不同的英语语音,而且也能够提升系统在应用中对于英语语音的识别率,提升29.0%,对于英语语音的识别速度也快,发挥积极应用效益。研究结论表明,设计嵌入式的实时英语语音识别系统,具有可行性,不仅可以提升系统识别英语语音的速度,也发挥积极的应用效益,可以在实践中推广该系统设计方法。 展开更多
关键词 语音识别 实时英语语音识别系统 嵌入式设计 设计语音系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部