期刊文献+
共找到75篇文章
< 1 2 4 >
每页显示 20 50 100
国际压缩标准MPEG特点综述 被引量:2
1
作者 赵国英 黄心渊 《北方工业大学学报》 2001年第3期23-27,36,共6页
介绍了国际上多媒体信息压缩 MPEG的一系列标准的特点 ,并对这些标准进行比较 ,较为详细地介绍了
关键词 视频 音频 图像压缩 MPEG 多媒体通信 国际压缩标准 信息压缩 特点综述 计算机技术
下载PDF
基于距离相关图的音频相似性度量方法 被引量:6
2
作者 李超 熊璋 朱成军 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2006年第2期224-227,共4页
相似性度量是基于内容的音频分析中的关键环节之一,目前往往沿用传统的统计分析思想实现,缺乏有效的呈现手段和对语义层信息的准确表达.提出了一种基于图像分割技术的相似性度量方法,通过特征提取构造特征空间,进而绘制特征向量间的距... 相似性度量是基于内容的音频分析中的关键环节之一,目前往往沿用传统的统计分析思想实现,缺乏有效的呈现手段和对语义层信息的准确表达.提出了一种基于图像分割技术的相似性度量方法,通过特征提取构造特征空间,进而绘制特征向量间的距离相关图,通过对该图的可视化分析判断最大相似方向,并分别计算出局部相似性和全局相似性.给出了实验验证过程,该方法适用于数字广播等音频流中的片段查找等应用. 展开更多
关键词 音频 相似性 图像分割 特征提取
下载PDF
基于整型小波的数字音频二维水印嵌入算法研究 被引量:2
3
作者 王向阳 崔永瑞 赵红 《辽宁师范大学学报(自然科学版)》 CAS 北大核心 2005年第3期297-301,共5页
提出了1种将灰度图像(即二维水印)嵌入到原始音频中的新数字水印算法.该算法具有以下特点:⑴引入快捷而无损的整型小波变换理论,降低了舍入误差,提高了数字水印的嵌入与检测速度;⑵采纳分段变换及整体修改策略,增强了数字水印嵌入的稳定... 提出了1种将灰度图像(即二维水印)嵌入到原始音频中的新数字水印算法.该算法具有以下特点:⑴引入快捷而无损的整型小波变换理论,降低了舍入误差,提高了数字水印的嵌入与检测速度;⑵采纳分段变换及整体修改策略,增强了数字水印嵌入的稳定性;⑶首次以灰度图像作为数字水印,不仅数据容量大,而且更具层次感和多样性;⑷以保证透明性和鲁棒性的良好平衡为前提,实现了数字水印的盲检测.仿真实验表明:所提出的算法不仅具有较好的透明性,而且对诸如重新采样、重新量化、低通滤波、MP3压缩、叠加噪声等攻击均具有较好的鲁棒性. 展开更多
关键词 音频水印 整型小波 灰度图像
下载PDF
Automatic recognition of depression based on audio and video:A review
4
作者 Meng-Meng Han Xing-Yun Li +4 位作者 Xin-Yu Yi Yun-Shao Zheng Wei-Li Xia Ya-Fei Liu Qing-Xiang Wang 《World Journal of Psychiatry》 SCIE 2024年第2期225-233,共9页
Depression is a common mental health disorder.With current depression detection methods,specialized physicians often engage in conversations and physiological examinations based on standardized scales as auxiliary mea... Depression is a common mental health disorder.With current depression detection methods,specialized physicians often engage in conversations and physiological examinations based on standardized scales as auxiliary measures for depression assessment.Non-biological markers-typically classified as verbal or non-verbal and deemed crucial evaluation criteria for depression-have not been effectively utilized.Specialized physicians usually require extensive training and experience to capture changes in these features.Advancements in deep learning technology have provided technical support for capturing non-biological markers.Several researchers have proposed automatic depression estimation(ADE)systems based on sounds and videos to assist physicians in capturing these features and conducting depression screening.This article summarizes commonly used public datasets and recent research on audio-and video-based ADE based on three perspectives:Datasets,deficiencies in existing research,and future development directions. 展开更多
关键词 Depression recognition Deep learning Automatic depression estimation System audio processing image processing Feature fusion Future development
下载PDF
嵌入式船载航行数据记录仪设计 被引量:3
5
作者 金华标 马吉林 +1 位作者 李立 陈智君 《武汉理工大学学报》 CAS CSCD 北大核心 2009年第19期113-116,共4页
设计了技术先进、性能稳定、价格低廉并具有自主知识产权的船载航行数据记录仪(VDR)。详细描述了设计步骤,各功能模块的实现方法。经过实验验证,该VDR功能和性能均满足CCS及国际相关规范的要求。提出了应进一步设计体积更小,功耗更低,... 设计了技术先进、性能稳定、价格低廉并具有自主知识产权的船载航行数据记录仪(VDR)。详细描述了设计步骤,各功能模块的实现方法。经过实验验证,该VDR功能和性能均满足CCS及国际相关规范的要求。提出了应进一步设计体积更小,功耗更低,成本更低的单板甚至单片VDR的建议。 展开更多
关键词 嵌入式系统 VDR FPGA 音频 图像
原文传递
6.1通路通用平面环绕声系统的研究 被引量:2
6
作者 谢菠荪 《声学学报》 EI CSCD 北大核心 2001年第6期481-488,共8页
提出了一种新的6.1通路环绕声系统及系统的两种不同的信号馈给法。通过理论和实验证明了系统可重发水平面内360°的声像,特别是侧向和后方的声像效果较现有的5.1通路系统有明显的改善,因而适合作为通用的环绕声系统。文... 提出了一种新的6.1通路环绕声系统及系统的两种不同的信号馈给法。通过理论和实验证明了系统可重发水平面内360°的声像,特别是侧向和后方的声像效果较现有的5.1通路系统有明显的改善,因而适合作为通用的环绕声系统。文中同时证明了新系统与5.1通路系统完全兼容,利用现有的方法即可实现信号的兼容记录与重发。 展开更多
关键词 6.1通路通用平面环绕声系统 环绕声 重发声像能力 信号馈给法
下载PDF
基于ISP1161的USB接口音、视频嵌入式系统设计 被引量:3
7
作者 唐颖 阮越 《现代电子技术》 2005年第20期111-113,共3页
介绍了基于U SB接口的嵌入式L inux音频设备及图像采集的硬件系统结构,给出了驱动程序的设计方案及相关驱动程序的下载、配置、编译等过程,提出了一个用Ph ilips公司的U SB接口控制芯片ISP 1161实现的低成本音频输出和视频采集嵌入式系... 介绍了基于U SB接口的嵌入式L inux音频设备及图像采集的硬件系统结构,给出了驱动程序的设计方案及相关驱动程序的下载、配置、编译等过程,提出了一个用Ph ilips公司的U SB接口控制芯片ISP 1161实现的低成本音频输出和视频采集嵌入式系统。由于ISP 1161是一个既带主机控制器(HC)又带设备控制器(DC)的单片U SB接口芯片,使系统用HC的向下端口能够与任何U SB设备和有向上端口的U SB集线器连接,用DC的向上端口能够与任何U SB主机和有向下端口的U SB集线器连接,这使得一个微处理器同时控制U SB HC和U SB DC成为可能,给他所在的系统带来了高度的灵活性。 展开更多
关键词 USB接口 ISP1161 驱动程序 音频设备 图像采集
下载PDF
论苏轼词的“词汇—语义”的视听类具象和感知 被引量:2
8
作者 韩陈其 立红 《徐州师范大学学报(哲学社会科学版)》 2007年第4期38-44,共7页
汉语诗词语言的语学释读的目的,就是使汉语诗词语言的文学释读摆脱以至解脱那种几乎已成定律的"只能意会,难以言传",或"只能意会,不能言传"的历史与现实的困境和窘境。苏词风格多样,既豪放,又婉约;既恢宏,又拘谨;... 汉语诗词语言的语学释读的目的,就是使汉语诗词语言的文学释读摆脱以至解脱那种几乎已成定律的"只能意会,难以言传",或"只能意会,不能言传"的历史与现实的困境和窘境。苏词风格多样,既豪放,又婉约;既恢宏,又拘谨;既纯净,又香艳。苏词的有限具象而演化为无限的意象,都一个一个地落实在字词上,落实在组合有序而独特的句法上,落实在繁富而多变的语义关系上。因此,汉语诗词语言的语学释读,必须先从词汇—语义的认知范域着眼;而要理解苏词的词汇—语义的认知范域,则又必须认识并理清汉语词义单位和词义单位的关系。从汉语诗词语言的语学释读角度来看,豪放的"意象",其实主要应是由视觉类具象(或视觉类具象兼具听觉类具象)组合配置而形成的。 展开更多
关键词 苏轼词 语学释读 视觉类具象 听觉类具象 语义关系
下载PDF
采用2D-Haar声学特征超向量的快速特定音频识别方法 被引量:2
9
作者 吕英 罗森林 +2 位作者 高晓芳 谢尔曼 潘丽敏 《声学学报》 EI CSCD 北大核心 2015年第5期739-750,共12页
针对特定音频事件识别技术在大数据音频处理任务中的准确性和快速性问题,提出一种基于2D-Haar声学特征超向量和AdaBoost算法的快速特定音频事件泛化识别方法。首先将多个连续音频帧的常用声学特征构成“声学特征图”,进而提取维数高... 针对特定音频事件识别技术在大数据音频处理任务中的准确性和快速性问题,提出一种基于2D-Haar声学特征超向量和AdaBoost算法的快速特定音频事件泛化识别方法。首先将多个连续音频帧的常用声学特征构成“声学特征图”,进而提取维数高达数十万的Haar-like声学特征,然后使用AdaBoost.MH或速度较快的Random AdaBoost特征筛选算法,筛选出较高代表性的Haar-like声学特征模式组合,从而构成2D-Haar声学特征超向量;最后分析特定音频事件子类间的共性和差异性,提取子类别的共性,弱化子类间的差异,训练后得到一个泛化的音频事件模板,可支持多子类的泛化识别,能够准确检测并定位音频流中的特定音频事件。实验结果表明,使用2D-Haar声学特征超向量可以获得比MFCC,PLP,LPCC等常用声学特征约5%的识别精度提升、7-20倍的训练速度提升和5-10倍的识别速度提升,在网格法寻得最优参数配置下,可获得93.38%的准确率,95.03%的查全率,这为大数据量的特定音频事件识别提供了一种准确快速的处理方法。 展开更多
关键词 声学特征 音频处理 识别方法 ADABOOST算法 向量 事件识别 RANDOM 筛选算法
下载PDF
基于帐篷映射迭路的置乱方法 被引量:2
10
作者 叶瑞松 庄乐仪 《计算机应用》 CSCD 北大核心 2009年第10期2713-2715,共3页
提出了一种基于帐篷映射迭路的音频和图像的置乱方法。帐篷映射迭路产生的编码可用于音频信号置乱。另外,将映射推广至二维便可用于图像置乱;讨论了图像置乱的置乱度、置乱周期和鲁棒性。和传统的Arnold变换的置乱比较,该方法总体上具... 提出了一种基于帐篷映射迭路的音频和图像的置乱方法。帐篷映射迭路产生的编码可用于音频信号置乱。另外,将映射推广至二维便可用于图像置乱;讨论了图像置乱的置乱度、置乱周期和鲁棒性。和传统的Arnold变换的置乱比较,该方法总体上具有更大的置乱周期和更好的置乱度。 展开更多
关键词 迭路 帐篷映射 置乱 音频 图像
下载PDF
Securing Technique Using Pattern-Based LSB Audio Steganography and Intensity-Based Visual Cryptography 被引量:2
11
作者 Pranati Rakshit Sreeparna Ganguly +2 位作者 Souvik Pal Ayman AAly Dac-Nhuong Le 《Computers, Materials & Continua》 SCIE EI 2021年第4期1207-1224,共18页
With the increasing need of sensitive or secret data transmission through public network,security demands using cryptography and steganography are becoming a thirsty research area of last few years.These two technique... With the increasing need of sensitive or secret data transmission through public network,security demands using cryptography and steganography are becoming a thirsty research area of last few years.These two techniques can be merged and provide better security which is nowadays extremely required.The proposed system provides a novel method of information security using the techniques of audio steganography combined with visual cryptography.In this system,we take a secret image and divide it into several subparts to make more than one incomprehensible sub-images using the method of visual cryptography.Each of the sub-images is then hidden within individual cover audio files using audio steganographic techniques.The cover audios are then sent to the required destinations where reverse steganography schemes are applied to them to get the incomprehensible component images back.At last,all the sub-images are superimposed to get the actual secret image.This method is very secure as it uses a two-step security mechanism to maintain secrecy.The possibility of interception is less in this technique because one must have each piece of correct sub-image to regenerate the actual secret image.Without superimposing every one of the sub-images meaningful secret images cannot be formed.Audio files are composed of densely packed bits.The high density of data in audio makes it hard for a listener to detect the manipulation due to the proposed time-domain audio steganographic method. 展开更多
关键词 Information security visual cryptography audio steganography secret image reverse steganography
下载PDF
李颀音乐诗论析
12
作者 罗琴 《涪陵师范学院学报》 2007年第3期57-62,共6页
李颀的音乐诗是空前启后的优秀之作。他运用比喻、映衬、用典、对偶、转韵等多种表现手法,着力描绘音乐的声音和意境,把听觉形象转化为视觉形象,在中国诗歌史上第一个创作出有很高艺术成就的音乐诗,并且启发和影响了韩愈、白居易、李贺... 李颀的音乐诗是空前启后的优秀之作。他运用比喻、映衬、用典、对偶、转韵等多种表现手法,着力描绘音乐的声音和意境,把听觉形象转化为视觉形象,在中国诗歌史上第一个创作出有很高艺术成就的音乐诗,并且启发和影响了韩愈、白居易、李贺等人的音乐诗创作。 展开更多
关键词 李颀 音乐诗 意境 表现手法 听觉形象 视觉形象
下载PDF
基于音频分析的非遗旅游目的地投射—感知形象研究 被引量:1
13
作者 雷锦锦 谢锦 《文化创新比较研究》 2022年第32期135-139,共5页
随着大数据时代的发展,游客发布旅游视频和官方发布旅游宣传视频成为非遗旅游目的地形象传播的重要形式。该文以非遗文化丰富的四川省为案例地,选取游客在携程网上发布的非遗旅游视频及官方发布的非遗旅游宣传视频,通过对视频中的音频... 随着大数据时代的发展,游客发布旅游视频和官方发布旅游宣传视频成为非遗旅游目的地形象传播的重要形式。该文以非遗文化丰富的四川省为案例地,选取游客在携程网上发布的非遗旅游视频及官方发布的非遗旅游宣传视频,通过对视频中的音频进行文本转换,探索非遗旅游目的地投射形象与感知形象差异。结论如下:(1)非遗旅游目的地形象划分为非遗资源、旅游基础设施、非遗文化、非遗体验;(2)官方投射形象和游客感知形象在非遗文化上感知度较高,二者在旅游基础设施、非遗体验上感知度不同;(3)官方投射出来的都是正面的反馈,游客感知到的情绪以积极反馈为主,消极反馈为辅。 展开更多
关键词 非遗旅游目的地 音频分析 投射形象 感知形象 四川省
下载PDF
一种嵌入式多业务农情信息无线获取节点开发 被引量:1
14
作者 肖克辉 冯健昭 肖德琴 《传感技术学报》 CAS CSCD 北大核心 2017年第12期1912-1917,共6页
精细农业应用领域中的农情信息获取设备种类繁多,输入输出接口多样,但是功能相对单一,可扩展性有待提高。为此,设计一种基于Android操作系统的多业务农情信息获取节点,以展讯SC7731G为主控芯片,结合ADC接口、麦克风、图像传感器以及Wi F... 精细农业应用领域中的农情信息获取设备种类繁多,输入输出接口多样,但是功能相对单一,可扩展性有待提高。为此,设计一种基于Android操作系统的多业务农情信息获取节点,以展讯SC7731G为主控芯片,结合ADC接口、麦克风、图像传感器以及Wi Fi和3G无线通信模块等,实现基于文本、音频、图像/视频等多业务农情信息的一体化快速采集和无线传输。为了验证节点的农情信息采集功能和无线传输性能,在室内外环境中进行了基于土壤湿度、音频、图像及视频的数据采集试验,通过3G移动网络传输音频数据,平均速率达到21 kbyte/s;通过Wi Fi局域网传输图像和视频数据,平均速率可达到2.63 Mbyte/s。试验结果表明,节点能够通过ADC接口外接文本数据传感器,具备良好的音频、图像及视频采集功能,能够满足精细农业对多业务农情信息的快速获取和无线传输需要。 展开更多
关键词 农情信息获取 无线传感器 模数转换器 音频信号 图像传感器
下载PDF
基于音频的视频拷贝检测 被引量:1
15
作者 赵花婷 王明敏 《微型电脑应用》 2014年第7期1-4,共4页
提出了一个兼具实时性和鲁棒性的短视频拷贝检测框架,并以长视频中的广告检测为应用进行研究。框架主要分为两个部分:1.基于音频匹配的短视频拷贝检测;2.基于图像的边界精确定位。第一阶段从原始视频中获得声谱图,并进一步地提取出音频... 提出了一个兼具实时性和鲁棒性的短视频拷贝检测框架,并以长视频中的广告检测为应用进行研究。框架主要分为两个部分:1.基于音频匹配的短视频拷贝检测;2.基于图像的边界精确定位。第一阶段从原始视频中获得声谱图,并进一步地提取出音频特征并在音频库中寻找匹配;在第二阶段,对检测到的视频片段进行合并,然后利用视频片段在边界处附近的图像特征,对边界片段进行精确定位。实验结果显示,准确率高达99%,取得了很好的效果。 展开更多
关键词 视频拷贝检测 短视频 音频匹配 平滑 静音段 图像特征 实时
下载PDF
基于LabVIEW的HDTV主控板自动测试系统设计 被引量:1
16
作者 胡国民 周志景 《电子设计工程》 2013年第23期144-146,150,共4页
针对人工测试效率低、易受主观影响等不足,设计了基于LabVIEW的高清电视(HDTV)主控板自动测试系统。利用LabVIEW丰富的信号处理、虚拟仪器等图形化编程特点,开发音频及视频图像评价软件。采用基于梯度的结构相似性图像评价算法(GSSIM),... 针对人工测试效率低、易受主观影响等不足,设计了基于LabVIEW的高清电视(HDTV)主控板自动测试系统。利用LabVIEW丰富的信号处理、虚拟仪器等图形化编程特点,开发音频及视频图像评价软件。采用基于梯度的结构相似性图像评价算法(GSSIM),提高了测试分析中对模糊失真图像的判别精度。该自动测试系统可大大提高测试效率,并保证产品测试指标的客观性和一致性。 展开更多
关键词 LABVIEW 自动测试 音频评价 图像评价 结构相似性
下载PDF
计算机多媒体《装配图》的设计与开发
17
作者 左宗义 冯开平 陈永汉 《广东工业大学学报》 CAS 1997年第2期89-94,共6页
介绍一部多媒体计算机《机械制图》教材装配图部分的研制工作.这部电子教材是在Windows和ChineseStar平台上,运用写作工具和各种图形处理软件及多媒体制作软件设计制作而成.它以图形,图象,二维动画,三维动画... 介绍一部多媒体计算机《机械制图》教材装配图部分的研制工作.这部电子教材是在Windows和ChineseStar平台上,运用写作工具和各种图形处理软件及多媒体制作软件设计制作而成.它以图形,图象,二维动画,三维动画,文字,声音,音乐和各种交互手段生动地表达了装配图的教学内容,供工程图学教师课堂教学和学生自学使用.它是我国工程图学第一部成功的计算机多媒体电子教材,对图学教学手段现代化必将起到重要的作用. 展开更多
关键词 多媒体 电子书 图形 图象 二维动画 三维动画 图象处理 声音处理 图形压缩 多媒体写作工具
下载PDF
基于工程管理的多媒体技术应用研究
18
作者 郑凯东 《西安石油学院学报(自然科学版)》 2001年第5期62-65,共4页
论述基于工程管理的思想进行软件系统的设计和开发 ,即按照管理工程项目的方法实现专业软件的计算处理流程 ,并对其参数和数据统一组织和管理 ;在此基础上 ,将传统软件的下拉式菜单改造成为交互式多媒体用户界面和相应的学习系统 ,并就... 论述基于工程管理的思想进行软件系统的设计和开发 ,即按照管理工程项目的方法实现专业软件的计算处理流程 ,并对其参数和数据统一组织和管理 ;在此基础上 ,将传统软件的下拉式菜单改造成为交互式多媒体用户界面和相应的学习系统 ,并就如何利用超文本、图形控件和多媒体控件实现链接、动画、声音等多媒体效果作了详细的阐述 ;通过实例给出了具体的实施方案 .该方法可用于大型工程计算、建模。 展开更多
关键词 多媒体技术 动画 间频 视频 图像 工程管理 学习系统
下载PDF
多媒体VB软件的制作
19
作者 王宇 马跃先 《太原科技》 2001年第2期22-23,共2页
讨论了多媒体各方面 ,如多媒体音频数据、图象处理以及视频处理等所包含的内容和制作的技术处理 ,最后通过一实例来说明对多媒体软件进行制行的全过程 。
关键词 图像处理 多媒体软件 音频数据 视频处理 软件制作 VB
下载PDF
心脑编配技能在即兴伴奏中的作用
20
作者 余璐 《佳木斯教育学院学报》 2011年第1期36-36,38,共2页
本文试图从音乐心理学角度出发,采用理论描述、经验分析、实验研究相结合的方法对心脑编配技能在即兴伴奏中的作用作了初步研究,从而使我们能够更好地利用心脑编配技能在进行钢琴即兴伴奏时尽量趋于完美之境界。
关键词 即兴伴奏 心脑编配技能 信息 音响意象
原文传递
上一页 1 2 4 下一页 到第
使用帮助 返回顶部