期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
“鸡尾酒会”环境中的知觉线索的去掩蔽作用 被引量:12
1
作者 徐李娟 黄莹 +2 位作者 吴玺宏 吴艳红 李量 《心理科学进展》 CSSCI CSCD 北大核心 2009年第2期261-267,共7页
在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,... 在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,信息掩蔽发生在心理层次并受到认知过程的调节。因此,主观空间分离、与目标语句节奏相关的视觉信号以及对目标语句某些特征的熟悉程度等知觉线索都具有去掩蔽作用。考察可减少信息掩蔽的知觉线索的交互作用及其高级认知调节是今后重要的研究内容。 展开更多
关键词 “鸡尾酒会”问题 知觉线索 选择性注意 能量掩蔽 信息掩蔽
下载PDF
Interaction between auditory and motor systems in speech perception 被引量:2
2
作者 Zhe-Meng Wu Ming-Li Chen +1 位作者 Xi-Hong Wu Liang Li 《Neuroscience Bulletin》 SCIE CAS CSCD 2014年第3期490-496,共7页
Based on the Motor Theory of speech perception, the interaction between the auditory and motor systems plays an essential role in speech perception. Since the Motor Theory was proposed, it has received remarkable atte... Based on the Motor Theory of speech perception, the interaction between the auditory and motor systems plays an essential role in speech perception. Since the Motor Theory was proposed, it has received remarkable attention in the field. However, each of the three hypotheses of the theory still needs further verification. In this review, we focus on how the auditory-motor anatomical and functional associations play a role in speech perception and discuss why previous studies could not reach an agreement and particularly whether the motor system involvement in speech perception is task-load dependent. Finally, we suggest that the function of the auditory-motor link is particularly useful for speech perception under adverse listening conditions and the further revised Motor Theory is a potential solution to the "cocktail-party" problem. 展开更多
关键词 auditory-motor interaction Motor Theory of speech perception motor cortex cocktail-party problem.
原文传递
鸡尾酒会问题与相关听觉模型的研究现状与展望 被引量:24
3
作者 黄雅婷 石晶 +1 位作者 许家铭 徐波 《自动化学报》 EI CSCD 北大核心 2019年第2期234-251,共18页
近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统... 近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务.因此,鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别、语音识别、关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值.本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望.在简要介绍了听觉机理的相关研究,并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后,本文还讨论了受听觉认知机理启发的听觉注意建模方法,认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性.之后,本文简单回顾了近期的多说话人语音识别模型.最后,本文讨论了目前各类计算模型用于处理鸡尾酒会问题时遇到的困难和挑战,并对未来的研究方向进行了展望. 展开更多
关键词 鸡尾酒会问题 听觉模型 语音分离 听觉注意 语音识别
下载PDF
一种基于卷积神经网络的端到端语音分离方法 被引量:13
4
作者 范存航 刘斌 +2 位作者 陶建华 温正棋 易江燕 《信号处理》 CSCD 北大核心 2019年第4期542-548,共7页
大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方... 大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06%。 展开更多
关键词 说话人独立语音分离 鸡尾酒会问题 端到端 卷积编解码器
下载PDF
自适应多目独立成分分析 被引量:4
5
作者 佘堃 蒲红梅 +1 位作者 郑方伟 周明天 《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第1期11-13,共3页
通过分析LCNN的学习方程,发现Lagrange约束项的物理本质是有监督学习的下降速率,提出了自适应LCNN(ALCNN)算法,避开了病态矩阵的问题,并将学习矩阵和独立成分求解复杂性都降到了O(n)。
关键词 独立成分分析 盲源分离系统 鸡尾酒会问题
下载PDF
在鸡尾酒会场景下利用去掩蔽知觉线索提高言语识别的脑网络机制 被引量:4
6
作者 李量 郑英君 +3 位作者 吴超 黎绢花 张畅芯 陆灵犀 《心理科学进展》 CSSCI CSCD 北大核心 2017年第12期2099-2110,共12页
在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目... 在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目标言语信号的短潜伏期反应,而且强化了线索特异性及非特异性的注意、言语表达、抑制功能和言语运动这四类脑区的活动及其功能连接,从而构成了信息掩蔽环境下知觉线索促进目标言语客体完好化的脑网络基础。 展开更多
关键词 鸡尾酒会问题 信息掩蔽 去掩蔽 言语识别 主观空间分离 听觉言语启动 视觉言语启动 脑网络 神经成像
下载PDF
多说话人分离与目标说话人提取的研究现状与展望
7
作者 鲍长春 杨雪 《数据采集与处理》 CSCD 北大核心 2024年第5期1044-1061,共18页
语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起... 语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起源于著名的鸡尾酒会问题,旨在从混合信号中分离出说话人的语音信号。近年来,研究人员提出了大量的语音分离方法,显著提升了分离性能。本文对这些语音分离方法进行了系统的归纳和总结。首先,根据目标说话人的辅助信息利用与否,将语音分离方法分为两大类,即多说话人分离与目标说话人提取;其次,从传统到基于深度学习的角度,分别对多说话人分离和目标说话人提取两类方法进行详细介绍;最后,讨论了当前语音分离领域面临的一些挑战,并对未来的研究方向进行展望。 展开更多
关键词 语音分离 鸡尾酒会问题 多说话人分离 目标说话人提取 深度学习
下载PDF
基于注意力机制的单通道双人语音分离研究 被引量:3
8
作者 周晓东 陈人楷 +1 位作者 孙华星 莫钞然 《通信技术》 2020年第4期880-884,共5页
在传统电力调度通信系统中,通话双方的语音内容被存储在单个录音文件中。如何将通话双方的人声区分开来,对于语音识别和声纹识别在电力调度领域应用具有重要的作用。当有多人同时说话时,如何将这些人声区分开来的问题,被称为鸡尾酒会问... 在传统电力调度通信系统中,通话双方的语音内容被存储在单个录音文件中。如何将通话双方的人声区分开来,对于语音识别和声纹识别在电力调度领域应用具有重要的作用。当有多人同时说话时,如何将这些人声区分开来的问题,被称为鸡尾酒会问题。为解决鸡尾酒会问题,特别是单通道双人语音分离问题,提出了基于注意力机制的深度聚类网络。首先提取语音信号的MFCC特征,其次将其输入到神经网络提取更高维度的特征,再次采用注意力机制为每一特征分配权重,最后采用k-means聚类将同一说话人的语音聚类输出。在wsj0数据集上,所提算法模型相比于原始的聚类网络取得了更好的效果。测试结果表明:在封闭的数据集上,新算法的SDR增长在男性和男性混合语音、女性和女性混合语音、男性和女性混合语音及总体情况分别为20.58%、17.25%、1.88%、22.78%,而在开放数据集上的对应结果分别为3.56%、20.87%、1.04%、17.67%。 展开更多
关键词 鸡尾酒会问题 注意力机制 深度聚类 K-MEANS
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部