期刊文献+
共找到108篇文章
< 1 2 6 >
每页显示 20 50 100
基于内容的音频检索:概念和方法 被引量:52
1
作者 李国辉 李恒峰 《小型微型计算机系统》 CSCD 北大核心 2000年第11期1173-1177,共5页
F过去对视觉媒体的检索 ,如图象和视频 ,进行了大量的研究 .但是我们注意到音频也是多媒体中的一种典型媒体 ,是信息的一种常用载体 .常规的处理是把数字音频当成非结构化流媒体 .然而音频是语音的载体、包含丰富的听觉特征 ,并且具有... F过去对视觉媒体的检索 ,如图象和视频 ,进行了大量的研究 .但是我们注意到音频也是多媒体中的一种典型媒体 ,是信息的一种常用载体 .常规的处理是把数字音频当成非结构化流媒体 .然而音频是语音的载体、包含丰富的听觉特征 ,并且具有结构信息 .因此需要并且可以基于这些内容对音频进行存取 .本文根据当前相关研究的进展 ,综述基于内容的音频检索方法 ,包括面向语音、音乐和音频分析的检索、音频分割等 ;分析并总结出音频内容及其检索的概念 ,给出音频检索的系统结构 ; 展开更多
关键词 音频检索 多媒体 信息检索 内容 概念 方法
下载PDF
基于内容的音频检索与分类 被引量:15
2
作者 李恒峰 李国辉 《计算机工程与应用》 CSCD 北大核心 2000年第7期54-56,134,共4页
音频信息检索技术是多媒体检索技术中的一个重要组成部分。该文在分析国内外现行的音频信息检索方法的基础上,总结出了基于内容的音频检索的一般方法,提出了一种基于内容的音频信息检索与分类方法,并通过已研制的ARS音频检索系统进... 音频信息检索技术是多媒体检索技术中的一个重要组成部分。该文在分析国内外现行的音频信息检索方法的基础上,总结出了基于内容的音频检索的一般方法,提出了一种基于内容的音频信息检索与分类方法,并通过已研制的ARS音频检索系统进行了性能测试。此方法具有较高的准确性和灵活性,可适用于不同的系统和应用。 展开更多
关键词 多媒体 信息检索 音频检索 分类
下载PDF
基于模糊聚类表征的音频例子检索及相关反馈 被引量:15
3
作者 赵雪雁 吴飞 +1 位作者 庄越挺 刘骏伟 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2003年第3期264-268,共5页
避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,直接从原始音频流中提取压缩域特征,使用时空约束机制进行压缩域特征的模糊聚类,用聚类结果的质心来表征整个音频例子,基于聚类质心完成相似度匹配,实现基于非... 避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,直接从原始音频流中提取压缩域特征,使用时空约束机制进行压缩域特征的模糊聚类,用聚类结果的质心来表征整个音频例子,基于聚类质心完成相似度匹配,实现基于非监督机制的音频例子快速检索.并在检索过程中引入相关反馈,根据用户对检索结果的相关反馈调整检索结果,使其与用户的感官相似一致.实验结果表明,此种方法可以达到快速检索的效果,检索准确率可达85%以上. 展开更多
关键词 音频检索 音频模板 例子 模糊聚类 相关反馈机制 语音信号处理
下载PDF
音频信息检索 被引量:10
4
作者 李恒峰 李国辉 《计算机工程》 CAS CSCD 北大核心 1999年第8期78-80,共3页
回顾了国内外现行的音频信息检索方法,分析了常见的音频数据处理技术,包括语音识别技术和基于内容的音频检索技术,提出了基于内容的音频检索的一般方法,并指出了相应研究中的关键问题。
关键词 音频 信息检索 语音识别 内容检索 多媒体
下载PDF
网络音频数据检索技术 被引量:10
5
作者 张卫强 刘加 《通信学报》 EI CSCD 北大核心 2007年第12期152-155,共4页
针对网络海量数据的应用特点,对传统的直方图算法进行了改进,采用基于主轴树的快速矢量量化技术进行预处理,采用两阶段法进行搜索处理,实验结果表明这2种方法可以显著提高检索的速度和精度。
关键词 音频检索 矢量量化 两阶段法
下载PDF
基于隐马尔可夫链的音频语义检索 被引量:10
6
作者 吴飞 庄越挺 +1 位作者 张引 潘云鹤 《模式识别与人工智能》 EI CSCD 北大核心 2001年第1期104-108,共5页
作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略。为了弥补这一不足,本文介绍了一个音频语义检索原型系统,在这个系统中,音频信号被分层次处理:首先分析音频信息中的短... 作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略。为了弥补这一不足,本文介绍了一个音频语义检索原型系统,在这个系统中,音频信号被分层次处理:首先分析音频信息中的短时能量、过零率和基本频率能量比等特征,音频信息流被接层次粗分为静音、和谐音乐、对话和环境背景音四类;由于环境背景音蕴涵了大量语义,环境背景音被继续细分,井用训练好的隐马尔可夫链表示每类环境背景音以进行语义检索。实验数据表明,这样的音频查询处理方式取得了良好效果。 展开更多
关键词 隐马尔可夫链 音频语义检索 音频信号处理 多媒体
原文传递
音频信息检索技术的发展及应用 被引量:9
7
作者 季春 《现代情报》 北大核心 2007年第1期157-160,163,共5页
今天音频检索的重要性已经越来越被人们所重视。本文系统总结了音频信息检索技术的发展历程、技术特点及国内外应用现状,最后预测了未来的发展趋势。
关键词 音频检索 音频分类 基于内容检索 语音识别
下载PDF
音频检索综述 被引量:8
8
作者 续鸿飞 肖明 《晋图学刊》 2005年第6期15-19,共5页
本文根据音频检索的研究现状,综述音频检索方法,讨论了一些音频检索关键技术:音频特征提取、音频分割和分类、基于内容的音频检索和音乐检索方法等。最后指出音频检索的不足并展望了音频检索技术的发展前景。
关键词 音频检索 音频分割 基于内容的音频检索 音乐检索
下载PDF
基于内容的音乐检索综述 被引量:7
9
作者 张燕 唐振民 +1 位作者 李燕萍 钱博 《金陵科技学院学报》 2007年第2期25-29,40,共6页
根据基于内容的音频检索的研究现状,描述了当前相关研究的进展,分析并总结出音乐内容及其检索的概念,给出音乐检索的系统结构,综述了基于内容的音乐检索方法,讨论了基于内容的音乐检索的最新算法,并展望了该领域研究需要注意的问题和发... 根据基于内容的音频检索的研究现状,描述了当前相关研究的进展,分析并总结出音乐内容及其检索的概念,给出音乐检索的系统结构,综述了基于内容的音乐检索方法,讨论了基于内容的音乐检索的最新算法,并展望了该领域研究需要注意的问题和发展前景。 展开更多
关键词 基于内容的音乐检索综述
下载PDF
基于内容的音频自动分类方法 被引量:5
10
作者 齐俊英 孙劲光 高爱东 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2005年第z1期170-172,共3页
为了解决基于内容的音频检索、语音文档检索等很多领域中提取音频结构和内容语义的问题时,介绍几种比较典型的音频分类算法包括最小距离方法、支持向量机、神经网络、决策树方法等,指出在基于内容的音频检索技术方面的难点以及发展方向。
关键词 音频检索 音频 信息检索 音频分类
下载PDF
一种基于倒排索引的音频检索方法 被引量:8
11
作者 张雪源 贺前华 +1 位作者 李艳雄 叶婉玲 《电子与信息学报》 EI CSCD 北大核心 2012年第11期2561-2567,共7页
传统的基于实例的音频检索算法采用顺序索引,检索时需遍历数据库并导致难以忍受的等待时间。针对传统的顺序的索引方法,该文提出基于倒排索引的音频检索算法。该方法首先利用多种音频特征构成的超向量,通过多层音频分割方法将连续音频... 传统的基于实例的音频检索算法采用顺序索引,检索时需遍历数据库并导致难以忍受的等待时间。针对传统的顺序的索引方法,该文提出基于倒排索引的音频检索算法。该方法首先利用多种音频特征构成的超向量,通过多层音频分割方法将连续音频流分割为特征数值波动幅度小的短时音频段;然后利用事先训练好的音频字典,将短时音频段序列转换为可以表征音频内容的音频字序列,并建立倒排索引;检索时,将用户提交的查询转换为音频字后利用倒排索引无须遍历数据库即可直接定位候选段落,并根据候选段落与查询的内容相似度大小对候选段落进行排序,将排好序的列表作为检索结果。仿真实验以匹配项排名、同类检索结果比例、定位准确性和检索用时4个方面作为评价指标,实验结果显示,该算法能够在平均1.101 s时间内实现92.58%的检索准确率。 展开更多
关键词 音频信号处理 音频检索 内容相似度 倒排索引
下载PDF
基于加权MFCC的音频检索 被引量:8
12
作者 华斌 张丽超 赵富强 《计算机工程与应用》 CSCD 北大核心 2015年第8期200-204,共5页
通过研究音频特征值提取和特征匹配算法,给出了一个完整的音频数据检索系统框架。该系统框架主要分析了音频特征提取和特征匹配。在音频特征提取部分对经典的MFCC系数进行了分析,提出了基于熵值法加权的MFCC系数,提高了检索的识别率。... 通过研究音频特征值提取和特征匹配算法,给出了一个完整的音频数据检索系统框架。该系统框架主要分析了音频特征提取和特征匹配。在音频特征提取部分对经典的MFCC系数进行了分析,提出了基于熵值法加权的MFCC系数,提高了检索的识别率。音频匹配部分根据特征参数矩阵表征音频信息的性质,引入了矩阵相似度的匹配方法,提高了检索效率。实验结果表明系统识别效率提高1.2%,用时降低22%,系统的性能得到明显改善。 展开更多
关键词 特征提取 音频检索 熵值法 矩阵相似度
下载PDF
网络音频信息检索的用户行为研究 被引量:7
13
作者 谭金波 《情报资料工作》 CSSCI 北大核心 2013年第5期77-80,共4页
鉴于国内音频信息检索行为研究的缺乏,文章借助用户实验和行为观察技术,采集用户的网络音频信息检索过程,从检索行为的总体分布情况、音频检索入口、不同任务检索入口的比较、检索入口的跳转行为等不同角度描述用户音频检索的行为和心理... 鉴于国内音频信息检索行为研究的缺乏,文章借助用户实验和行为观察技术,采集用户的网络音频信息检索过程,从检索行为的总体分布情况、音频检索入口、不同任务检索入口的比较、检索入口的跳转行为等不同角度描述用户音频检索的行为和心理,讨论分析音频信息检索的途径、用户检索中的定势心理、检索入口变换的心理阈值、检索情境对检索过程的影响等问题。 展开更多
关键词 音频信息检索 信息行为 检索入口 跳转行为
原文传递
一种基于MFCC的音频数据检索方法 被引量:7
14
作者 江星华 李应 《计算机与数字工程》 2008年第9期19-21,共3页
以LPC倒谱系数(LPCC)为特征参数的音频数据检索是人们常用的一种方法,但这种方法没有充分考虑到人耳听觉的非线性特性。因此,提出了一种采用MFCC及其差分倒谱系数相结合作为特征参数来做音频数据检索的方法。通过实验对比分析结果表明,... 以LPC倒谱系数(LPCC)为特征参数的音频数据检索是人们常用的一种方法,但这种方法没有充分考虑到人耳听觉的非线性特性。因此,提出了一种采用MFCC及其差分倒谱系数相结合作为特征参数来做音频数据检索的方法。通过实验对比分析结果表明,这种音频数据检索方法比LPCC的检索具有更高的识别率。 展开更多
关键词 MEL频率倒谱系数 特征提取 音频检索
下载PDF
基于LPCMCC的音频数据检索方法 被引量:5
15
作者 江星华 李应 《计算机工程》 CAS CSCD 北大核心 2009年第11期246-247,253,共3页
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法... LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。 展开更多
关键词 LPC倒谱系数 LPC美尔倒谱系数 音频检索 美尔倒谱系数
下载PDF
特定类型音频流泛化识别方法 被引量:5
16
作者 罗森林 李金玉 潘丽敏 《北京理工大学学报》 EI CAS CSCD 北大核心 2011年第10期1231-1235,共5页
提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音... 提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.8%. 展开更多
关键词 音频检索 ADABOOST MEL频率倒谱系数 特定音频流
下载PDF
一种基于PCA-BP 神经网络的示例优选方法 被引量:5
17
作者 章宗标 《计算机工程与应用》 CSCD 2013年第19期108-111,172,共5页
在音频示例检索的研究中,针对示例数据量大而导致计算代价大、检索时间长和噪声鲁棒性差等问题,提出了一种基于主成分分析(PCA)和BP神经网络(BPNN)的示例优选方法。以信号鲁棒性评分为依据构建数据集合,使用主成分分析得到段级特征,消... 在音频示例检索的研究中,针对示例数据量大而导致计算代价大、检索时间长和噪声鲁棒性差等问题,提出了一种基于主成分分析(PCA)和BP神经网络(BPNN)的示例优选方法。以信号鲁棒性评分为依据构建数据集合,使用主成分分析得到段级特征,消除数据冗余,减少输入变量,最后利用BPNN对保留成分进行建模预测。用PCA-BPNN模型对实验数据进行了验证性测试和分析,结果表明,该方法可以准确而高效地从一段音频中选取鲁棒性好的示例。 展开更多
关键词 主成分分析 BP神经网络 示例优选 多媒体 音频检索
下载PDF
基于指纹权重的音频模板检索方法 被引量:3
18
作者 张学帅 邹学强 +1 位作者 胡琪 张鹏远 《中国科技论文》 CAS 北大核心 2018年第20期2295-2300,共6页
针对音频模板检索方法在噪音和频谱缺失等环境下鲁棒性不够强的问题,在原有Philips检索方法的基础上,提出了一种以帧能量差作为权重的检索方法,即充分利用原方法忽略的能量信息,通过对不同音频帧的DNA设置不同的匹配权重,有效提升了音... 针对音频模板检索方法在噪音和频谱缺失等环境下鲁棒性不够强的问题,在原有Philips检索方法的基础上,提出了一种以帧能量差作为权重的检索方法,即充分利用原方法忽略的能量信息,通过对不同音频帧的DNA设置不同的匹配权重,有效提升了音频模板匹配方法的鲁棒性。实验结果表明,在受噪音影响和频谱缺失的数据集上,对于不同长度的音频模板,音频检索的查准率和查全率均有不同程度的提升,其中在2s的短模板上,查准率可比基线提高16%。 展开更多
关键词 音频检索 音频指纹 索引 样例检索 近邻检索
下载PDF
基于人工智能的音视频内容检索系统设计 被引量:1
19
作者 赵德芳 《电声技术》 2023年第5期98-101,共4页
现实工作中,高效且精准地在海量音视频内容中定位所需的信息,是一个重要课题。从现实需求出发,分析人工智能技术在检索系统优化中的应用,不断完善音视频检索系统,以此提高音视频内容查找的质量和效率,为后续的音视频内容创作提供有益的... 现实工作中,高效且精准地在海量音视频内容中定位所需的信息,是一个重要课题。从现实需求出发,分析人工智能技术在检索系统优化中的应用,不断完善音视频检索系统,以此提高音视频内容查找的质量和效率,为后续的音视频内容创作提供有益的参考。 展开更多
关键词 音视频 人工智能 检索系统
下载PDF
一种改进的Philips音频指纹检索算法 被引量:4
20
作者 孙宁 赵维平 +1 位作者 陈美 李超 《计算机工程》 CAS CSCD 北大核心 2018年第1期280-284,共5页
在Philips音频指纹检索算法中,构造一个查询表作为索引,由于内存消耗过大限制其广泛应用。为此,基于Philips音频指纹检索原型,提出一种改进算法。结合斐波那契数列和右移运算,构造新的哈希函数,通过斐波那契优化哈希值分布,并执行右移... 在Philips音频指纹检索算法中,构造一个查询表作为索引,由于内存消耗过大限制其广泛应用。为此,基于Philips音频指纹检索原型,提出一种改进算法。结合斐波那契数列和右移运算,构造新的哈希函数,通过斐波那契优化哈希值分布,并执行右移运算调整哈希表的长度。实验结果表明,改进算法能减少内存消耗,提高系统的实用性。 展开更多
关键词 指纹检索 音频检索 空间利用率 哈希表 哈希函数
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部