期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于能量模型的LS-TSVM在人体动作识别中的应用
被引量:
10
1
作者
任晓芳
秦健勇
+1 位作者
杨杰
任永军
《计算机应用研究》
CSCD
北大核心
2016年第2期598-601,631,共5页
传统人体动作识别分类器对异常值比较敏感,容易受固有噪声影响,这会导致严重的类失衡问题,所以相似的人体行为可能存在很大类内差异。提出一种基于能量的最小二乘双分界面支持向量机(ELS-TSVM)的人体动作识别算法。ELS-TSVM是LS-TSVM的...
传统人体动作识别分类器对异常值比较敏感,容易受固有噪声影响,这会导致严重的类失衡问题,所以相似的人体行为可能存在很大类内差异。提出一种基于能量的最小二乘双分界面支持向量机(ELS-TSVM)的人体动作识别算法。ELS-TSVM是LS-TSVM的有效改进,采用两个超平面,每个超平面引进能量参数来减少噪声和异常值的影响。首先对于输入的视频使用梯度方向直方图特征和光流直方图特征识别人体动作;然后检测可能的兴趣点,生成时空特征后提取时空视觉词袋特征,通过构建一组视觉词袋来完成特征提取;最后,利用ELSTSVM完成分类。在Weizmann和Hollywood数据库上的实验验证了该算法的有效性及可靠性,相比其他几种较新方法,该算法更加高效精确,且大大减少了算法执行时间。
展开更多
关键词
多分
类
识别
类
失衡
双分界面支持向量机
人体动作识别
最小二乘法
下载PDF
职称材料
基于深度学习的对话重叠语音片段检测
被引量:
1
2
作者
魏金太
高穹
《中北大学学报(自然科学版)》
CAS
2021年第1期34-39,共6页
为改进在真实对话中分割重叠语音的自然事件,训练一个深度卷积神经网络(DCNN),使用来自单声道音频的级别相对较低的对数标度梅尔频谱图进行端到端的学习.使用Fisher英语语料库的真实会话数据正确训练DCNN,同时保持并测试其对普通会话场...
为改进在真实对话中分割重叠语音的自然事件,训练一个深度卷积神经网络(DCNN),使用来自单声道音频的级别相对较低的对数标度梅尔频谱图进行端到端的学习.使用Fisher英语语料库的真实会话数据正确训练DCNN,同时保持并测试其对普通会话场景的普遍性.为了缓解严重的类失衡,在训练集中采取消除静音,并在训练过程中对占比重较多的类进行统一随机抽样.同时,使用维特比算法执行时间平滑以增强最终分割.在超过91 h的对话中,检测精度超过60%,召回率超过29%,证明了深度学习对于这项任务的适用性.
展开更多
关键词
重叠语音
深度卷积神经网络
对话分析
语音分割
类
失衡
下载PDF
职称材料
题名
基于能量模型的LS-TSVM在人体动作识别中的应用
被引量:
10
1
作者
任晓芳
秦健勇
杨杰
任永军
机构
新疆工程学院计算机工程系
哈尔滨工业大学计算机科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2016年第2期598-601,631,共5页
基金
国家自然科学基金资助项目(61103143)
中国博士后科学基金资助项目(2012M512008)
新疆维吾尔自治区自然科学基金项目(2010211A08)
文摘
传统人体动作识别分类器对异常值比较敏感,容易受固有噪声影响,这会导致严重的类失衡问题,所以相似的人体行为可能存在很大类内差异。提出一种基于能量的最小二乘双分界面支持向量机(ELS-TSVM)的人体动作识别算法。ELS-TSVM是LS-TSVM的有效改进,采用两个超平面,每个超平面引进能量参数来减少噪声和异常值的影响。首先对于输入的视频使用梯度方向直方图特征和光流直方图特征识别人体动作;然后检测可能的兴趣点,生成时空特征后提取时空视觉词袋特征,通过构建一组视觉词袋来完成特征提取;最后,利用ELSTSVM完成分类。在Weizmann和Hollywood数据库上的实验验证了该算法的有效性及可靠性,相比其他几种较新方法,该算法更加高效精确,且大大减少了算法执行时间。
关键词
多分
类
识别
类
失衡
双分界面支持向量机
人体动作识别
最小二乘法
Keywords
multi-class classification
class imbalance
twin support vector machine
human action recognition
least square method
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于深度学习的对话重叠语音片段检测
被引量:
1
2
作者
魏金太
高穹
机构
河南林业职业学院信息与艺术设计系
中国洛阳电子装备试验中心
出处
《中北大学学报(自然科学版)》
CAS
2021年第1期34-39,共6页
基金
国家自然科学基金资助项目(11404398)
河南科技厅重点攻关项目(142102210097)。
文摘
为改进在真实对话中分割重叠语音的自然事件,训练一个深度卷积神经网络(DCNN),使用来自单声道音频的级别相对较低的对数标度梅尔频谱图进行端到端的学习.使用Fisher英语语料库的真实会话数据正确训练DCNN,同时保持并测试其对普通会话场景的普遍性.为了缓解严重的类失衡,在训练集中采取消除静音,并在训练过程中对占比重较多的类进行统一随机抽样.同时,使用维特比算法执行时间平滑以增强最终分割.在超过91 h的对话中,检测精度超过60%,召回率超过29%,证明了深度学习对于这项任务的适用性.
关键词
重叠语音
深度卷积神经网络
对话分析
语音分割
类
失衡
Keywords
overlapping speech
deep convolutional neural network
conversation analysis
speech segmentation
class-imbalance
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于能量模型的LS-TSVM在人体动作识别中的应用
任晓芳
秦健勇
杨杰
任永军
《计算机应用研究》
CSCD
北大核心
2016
10
下载PDF
职称材料
2
基于深度学习的对话重叠语音片段检测
魏金太
高穹
《中北大学学报(自然科学版)》
CAS
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部