分析基于内容的音乐信息检索(music information retrieval,MIR),其关键在于特征提取.传统的单特征向量表示方法存在局限性:难以选定用于提取特征的片段或时间窗;只选取音乐片段会丢失一些重要的信息.为了消除局限性,引入多特征向量的...分析基于内容的音乐信息检索(music information retrieval,MIR),其关键在于特征提取.传统的单特征向量表示方法存在局限性:难以选定用于提取特征的片段或时间窗;只选取音乐片段会丢失一些重要的信息.为了消除局限性,引入多特征向量的特征表示方法,在获取音乐的多个声学特征向量的同时,也可以完整地表示该音乐曲目.为了更加准确地计算由多特征向量表示的2个音乐曲目之间的相似度,引入金字塔匹配核技术(pyramid match kernel,PMK)计算不同长度的多特征向量之间的相似度.实验结果表明,PMK技术的引入可以提高MIR的性能.展开更多
提出一种基于局部特征的双空间金字塔匹配核(bi-space pyramid match kernel,BSPM)用于图像目标分类.利用局部特征在特征空间和图像空间建立统一的多分辨率框架,以便较好地表达图像的语义内容.该方法同时在特征空间和图像空间建立金字...提出一种基于局部特征的双空间金字塔匹配核(bi-space pyramid match kernel,BSPM)用于图像目标分类.利用局部特征在特征空间和图像空间建立统一的多分辨率框架,以便较好地表达图像的语义内容.该方法同时在特征空间和图像空间建立金字塔型结构,通过适当匹配可以得到正定核函数,该函数具有线性计算复杂度,可以运用于基于核的学习算法.将BSPM嵌入支持向量机对公共数据库中图像目标进行分类,实验结果表明该方法对图像具有良好的分类能力,优于词汇导向的金字塔匹配核和空间金字塔匹配核.展开更多
针对传统的视觉词袋(bag of visual words,BoVW)模型忽略了视觉单词的空间位置信息的问题,文章提出一种基于视觉单词共生矩阵的图像分类方法。首先对整幅图像进行空间金字塔分解,得到一系列图像块;然后针对每一图像块中的SIFT点,在其空...针对传统的视觉词袋(bag of visual words,BoVW)模型忽略了视觉单词的空间位置信息的问题,文章提出一种基于视觉单词共生矩阵的图像分类方法。首先对整幅图像进行空间金字塔分解,得到一系列图像块;然后针对每一图像块中的SIFT点,在其空间邻域范围内构建视觉单词共生矩阵(visual words co-occurrence matrix,VWCM)单元,并得到该图像块对应的视觉单词共生矩阵;最后设计出一种新的空间金字塔共生矩阵核(spatial pyramid co-occurrence matrix kernel,SPCMK),并将其用于图像分类。该方法能够有效地刻画视觉单词的绝对和相对位置信息,极大地增强了图像表达的完整度与准确度。实验结果表明,文章方法确实能够大幅度提高图像分类的准确率。展开更多
文摘分析基于内容的音乐信息检索(music information retrieval,MIR),其关键在于特征提取.传统的单特征向量表示方法存在局限性:难以选定用于提取特征的片段或时间窗;只选取音乐片段会丢失一些重要的信息.为了消除局限性,引入多特征向量的特征表示方法,在获取音乐的多个声学特征向量的同时,也可以完整地表示该音乐曲目.为了更加准确地计算由多特征向量表示的2个音乐曲目之间的相似度,引入金字塔匹配核技术(pyramid match kernel,PMK)计算不同长度的多特征向量之间的相似度.实验结果表明,PMK技术的引入可以提高MIR的性能.
文摘提出一种基于局部特征的双空间金字塔匹配核(bi-space pyramid match kernel,BSPM)用于图像目标分类.利用局部特征在特征空间和图像空间建立统一的多分辨率框架,以便较好地表达图像的语义内容.该方法同时在特征空间和图像空间建立金字塔型结构,通过适当匹配可以得到正定核函数,该函数具有线性计算复杂度,可以运用于基于核的学习算法.将BSPM嵌入支持向量机对公共数据库中图像目标进行分类,实验结果表明该方法对图像具有良好的分类能力,优于词汇导向的金字塔匹配核和空间金字塔匹配核.