-
题名基于压缩域特征的多媒体数字音频检索方法
- 1
-
-
作者
刘彦
-
机构
青岛市技师学院
-
出处
《信息记录材料》
2022年第8期229-231,共3页
-
文摘
多媒体数字音频具有海量性和复杂性的特点,因此为了提高多媒体数字音频检索的准确性和效率,提出基于压缩域特征的检索方法。通过均方根计算方式提取多媒体数字音频静态和动态特征,具体化音频特征信息。建立模糊集合,根据隶属度数值分析并融合其压缩域特征,获取最佳样本分类。采用三角模糊集算法建立偏斜度矩阵,分类压缩域特征完成多媒体数字音频检索。通过实验结果得出,以压缩域特征为基础完成多媒体数字音频检索。通过实验结果得出,基于压缩域特征的检索方法,提高了识别音频数据的准确率,同时检索时间较短。
-
关键词
特征识别
压缩域
多媒体识别
音频检索
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双模态特征融合的多媒体场景识别
被引量:1
- 2
-
-
作者
潘红
吴飞
-
机构
杭州师范学院计算机系
浙江大学人工智能研究所
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2002年第4期424-428,共5页
-
基金
国家自然科学基金(60272031)
教育部博士点基金
+1 种基金
教育部优秀年轻教师基金
浙江省自然科学基金(2D0212)
-
文摘
多媒体场景本质是视频音频等多模态信息交互融合的结果,尽管每个模表达了一定的语义,但是多媒体场景完整表达要通过多模态信息去共同体现,本文提出使用视频音频双模态特征融合技术形成的超级隐马尔可夫链进行多媒体场景识别,实验数据表明,与只使用单模态信息识别多媒体场景的方法相比,超级隐马可夫链取得了更好的识别正确率.
-
关键词
双模态特征融合
多媒体场景识别
超级隐马尔可夫链
音频信号处理
背音识别
-
Keywords
Supper Hidden Markovia Model, Feature Fusion, Multi-Modal
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于改进隐马尔可夫的多媒体业务分类算法
被引量:3
- 3
-
-
作者
王再见
董育宁
张晖
冯友宏
-
机构
南京邮电大学通信与信息工程学院
安徽师范大学物理与电子信息学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2015年第2期499-503,共5页
-
基金
国家自然科学基金(61401004
61271233
+6 种基金
60972038
61101105)
教育部高等学校博士学科点专项科研基金(20103223110001
20113223120001)
工业与信息化部通信软科学课题(2011-R-70)
2011年度江苏省研究生培养创新工程(CXZZ11_0396)
安徽师范大学科研培育基金(2013xmpy10)资助课题
-
文摘
该文提出一种基于改进隐马尔可夫(Hidden Markov Model,HMM)的多媒体业务分类算法。改进后的算法保持典型HMM模型结构不变,通过区分包大小的位置信息,改变发射概率取值,提高了多媒体业务区分性能。理论分析表明,该文模型在计算量上低于高阶HMM;实验结果表明,改进的HMM多媒体业务分类算法的区分效果优于现有的HMM多媒体业务分类方法。
-
关键词
多媒体业务流识别
隐马尔可夫
发射概率
包大小
-
Keywords
Multimedia traffic classification
Hidden Markov Model(HMM)
Emitting probability
Packet size
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-