期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于能量模型的LS-TSVM在人体动作识别中的应用 被引量:10
1
作者 任晓芳 秦健勇 +1 位作者 杨杰 任永军 《计算机应用研究》 CSCD 北大核心 2016年第2期598-601,631,共5页
传统人体动作识别分类器对异常值比较敏感,容易受固有噪声影响,这会导致严重的类失衡问题,所以相似的人体行为可能存在很大类内差异。提出一种基于能量的最小二乘双分界面支持向量机(ELS-TSVM)的人体动作识别算法。ELS-TSVM是LS-TSVM的... 传统人体动作识别分类器对异常值比较敏感,容易受固有噪声影响,这会导致严重的类失衡问题,所以相似的人体行为可能存在很大类内差异。提出一种基于能量的最小二乘双分界面支持向量机(ELS-TSVM)的人体动作识别算法。ELS-TSVM是LS-TSVM的有效改进,采用两个超平面,每个超平面引进能量参数来减少噪声和异常值的影响。首先对于输入的视频使用梯度方向直方图特征和光流直方图特征识别人体动作;然后检测可能的兴趣点,生成时空特征后提取时空视觉词袋特征,通过构建一组视觉词袋来完成特征提取;最后,利用ELSTSVM完成分类。在Weizmann和Hollywood数据库上的实验验证了该算法的有效性及可靠性,相比其他几种较新方法,该算法更加高效精确,且大大减少了算法执行时间。 展开更多
关键词 多分识别 失衡 双分界面支持向量机 人体动作识别 最小二乘法
下载PDF
基于深度学习的对话重叠语音片段检测 被引量:1
2
作者 魏金太 高穹 《中北大学学报(自然科学版)》 CAS 2021年第1期34-39,共6页
为改进在真实对话中分割重叠语音的自然事件,训练一个深度卷积神经网络(DCNN),使用来自单声道音频的级别相对较低的对数标度梅尔频谱图进行端到端的学习.使用Fisher英语语料库的真实会话数据正确训练DCNN,同时保持并测试其对普通会话场... 为改进在真实对话中分割重叠语音的自然事件,训练一个深度卷积神经网络(DCNN),使用来自单声道音频的级别相对较低的对数标度梅尔频谱图进行端到端的学习.使用Fisher英语语料库的真实会话数据正确训练DCNN,同时保持并测试其对普通会话场景的普遍性.为了缓解严重的类失衡,在训练集中采取消除静音,并在训练过程中对占比重较多的类进行统一随机抽样.同时,使用维特比算法执行时间平滑以增强最终分割.在超过91 h的对话中,检测精度超过60%,召回率超过29%,证明了深度学习对于这项任务的适用性. 展开更多
关键词 重叠语音 深度卷积神经网络 对话分析 语音分割 失衡
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部