期刊文献+
共找到121篇文章
< 1 2 7 >
每页显示 20 50 100
试论教育思想表述的话语困境 被引量:19
1
作者 张荣伟 朱永新 《教育研究》 CSSCI 北大核心 2004年第4期22-27,共6页
从教育“是什么”到教育“该如何”的追问过程,也就是人类求真、求善、求美的过程。从这个意义上来说,在教育思想的表达过程中,一直就存在着呐喊与回应,交织着诉说与倾听。但是,在教育成为“公共话题”的今天,关于教育思想的话语却陷入... 从教育“是什么”到教育“该如何”的追问过程,也就是人类求真、求善、求美的过程。从这个意义上来说,在教育思想的表达过程中,一直就存在着呐喊与回应,交织着诉说与倾听。但是,在教育成为“公共话题”的今天,关于教育思想的话语却陷入了困境。明确话语主体(谁在言说)、言语的对象(向谁言说)和话语方式的选择(如何言说),是教育思想走向表达自觉的有效途径。 展开更多
关键词 教育思想 话语方式 话语主体 言语对象
原文传递
说话人识别的几种方法 被引量:11
2
作者 宁飞 陈频 《电声技术》 北大核心 2001年第12期9-14,共6页
以说话人识别的几个关键问题为纲,说明了国内外现有的识别方法和结果,以及存在的问题和难点,并提出了一些新想法。
关键词 说话人 语音识别 特征提取
下载PDF
说话人识别的参量研究和语音库建设 被引量:4
3
作者 吴淑珍 吴阿华 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 1995年第3期316-322,共7页
本文对说话人识别中的几个基本问题进行了研究。语音参量是说话人识别的基础,用矢量量化方法,使用自建的语音库中的材料,研究了说话人识别中的各种参量的效果。实验表明,所采用的参量中,一种混合参量MC最好,倒谱系数CE次之。
关键词 说话人识别 语音参量 语音识别 语音库
下载PDF
两级决策的开集说话人辨认方法 被引量:12
4
作者 何致远 胡起秀 徐光祐 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第4期516-520,共5页
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ... 为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。 展开更多
关键词 说话人识别 说话人辨认 语音切分 隐MARKOV模型 两级决策 语音识别
原文传递
模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别 被引量:7
5
作者 吴晓娟 韩先花 聂开宝 《电子与信息学报》 EI CSCD 北大核心 2002年第6期845-849,共5页
该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算... 该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算法的聚类中心,最后将待识别的特征矢量以得到的码书为聚类中心,进行聚类识别。该算法所使用的特征参数较少,计算比较简单,但识别率较矢量量化法高。 展开更多
关键词 模糊C-均值(FCM)聚类法 模糊聚类 矢量量化 说话人识别 语音特征 语音识别
下载PDF
室内服务机器人人机交互对象语音识别实验 被引量:5
6
作者 梁伊雯 韩子奇 +1 位作者 张志明 孙艺珈 《实验室研究与探索》 CAS 北大核心 2023年第1期30-35,共6页
以人机交互系统中特定对象语音识别功能实验为典型案例,采用引入过减因子与谱下限的谱减法进行含噪语音信号的增强降噪,以混合高斯-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)为基础,基于梅尔频率倒谱系... 以人机交互系统中特定对象语音识别功能实验为典型案例,采用引入过减因子与谱下限的谱减法进行含噪语音信号的增强降噪,以混合高斯-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)为基础,基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)特征进行语音对象识别,并部署端到端的深度神经网络普通话语音识别模块,完成综合创新性实验教学任务和创新拓展实践训练。实验表明,部署上述模块的服务机器人能在平均0.896 s时间内准确完成整个流程,证明了设计方案的可行性与有效性。 展开更多
关键词 服务机器人 人机交互 语音识别 说话人识别 语音增强
下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
7
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 MEL倒谱系数 个性信息 反Mel倒谱系数 频谱分布 语音信号
下载PDF
汉语道歉言语行为之分析 被引量:5
8
作者 钱乐奕 郑玲 《安徽广播电视大学学报》 2003年第4期69-72,共4页
道歉言语行为通常发生在当说话者(Speaker)有意或无意中冒犯了听话者(Hearer)时而采取的一种旨在恢复两者之间以往特定关系的行为。我们通常会因为不同的原因,以不同的方式向别人道歉或是接受别人道歉。本文以问卷的方式对人们在不同条... 道歉言语行为通常发生在当说话者(Speaker)有意或无意中冒犯了听话者(Hearer)时而采取的一种旨在恢复两者之间以往特定关系的行为。我们通常会因为不同的原因,以不同的方式向别人道歉或是接受别人道歉。本文以问卷的方式对人们在不同条件下如何实现道歉这一言语行为作简要的分析。 展开更多
关键词 汉语 道歉言语行为 自我羞辱 女性 男性
下载PDF
噪声环境下文本相关说话人识别方法改进 被引量:7
9
作者 谭萍 邢玉娟 《西安工程大学学报》 CAS 2016年第5期639-644,656,共7页
采用传统的自相关检测算法识别说话人语音,在受到较大的背景噪声干扰时,检测输出的信噪比不高.为此,提出一种基于小波语音增强和文本相关特征提取算法,在噪声环境下进行文本说话人语音识别系统的总体设计,通过语音噪点的特征匹配,完成... 采用传统的自相关检测算法识别说话人语音,在受到较大的背景噪声干扰时,检测输出的信噪比不高.为此,提出一种基于小波语音增强和文本相关特征提取算法,在噪声环境下进行文本说话人语音识别系统的总体设计,通过语音噪点的特征匹配,完成语音信号降噪滤波处理;采用小波自适应特征分解,进行语音增强处理,完成文本相关特征提取;将提取结果输入到BP神经网络分类器中,实现说话人识别.仿真结果表明,采用该说话人语音识别算法进行语音检测和分析,具有较高的识别精度,误检概率较低,对语音的降噪性能较好. 展开更多
关键词 噪声环境 说话人识别 语音 信号处理 检测滤波
下载PDF
面向抑郁症群体的情感化智能音箱设计与实现
10
作者 张楠 蔡莉 +1 位作者 杨文洁 余治国 《计算机仿真》 2024年第3期334-341,371,共9页
长期抑郁对患者的身心健康危害极大,严重时可能发生自残、自杀等行为。近年来,智能音箱已经成为人们喜爱的一种商品,而面向抑郁症群体的智能音箱设计不多,主要存在普及度低、情感化缺失与智能家居兼容性差等问题。为此,以树莓派作为硬... 长期抑郁对患者的身心健康危害极大,严重时可能发生自残、自杀等行为。近年来,智能音箱已经成为人们喜爱的一种商品,而面向抑郁症群体的智能音箱设计不多,主要存在普及度低、情感化缺失与智能家居兼容性差等问题。为此,以树莓派作为硬件支撑,在心理学的指导下,基于自然语言处理、语音识别和物联网等技术,设计了一款面向抑郁症群体的物联网情感化智能音箱原型——“云齐”。实验结果表明,上述音箱不仅能有效地识别用户情绪及抑郁状态,控制家居系统创建适合抑郁症患者的居家环境,并且还能通过抑郁症语料库在一定程度上对用户进行心理疏导,从而缓解其紧张和焦虑的情绪,减少身体的不适感,改善其抑郁症状。 展开更多
关键词 智能音箱 抑郁症 语音处理 树莓派 智能家居
下载PDF
基于DSP的声控系统的设计与实现 被引量:3
11
作者 马洪连 朱杰 +1 位作者 杨凤岐 孟新雨 《测控技术》 CSCD 2005年第12期30-32,共3页
介绍了一个包括说话人识别和说话内容识别的声控系统的设计与实现。该系统以TMS320VC5509 DSP 为平台,以倒谱系数为特征参数,以欧氏距离法和矢量量化法为识别算法,实时实现了系统的识别功能。
关键词 数字信号处理器 倒谱系数 说话人识别 语音识别 矢量量化
下载PDF
基于语音增强的远场说话人识别技术 被引量:6
12
作者 覃晓逸 蔡丹蔚 +2 位作者 胡伟湘 苗磊 李明 《网络新媒体技术》 2019年第4期1-10,共10页
随着声纹技术的发展并逐渐应用于智能家居领域,尤其是智能音箱已经开始影响着人们的生活,远场环境下的说话人识别技术提升迫在眉睫。本文针对说话人识别技术的发展现状以及远场环境下语音信号的处理,包括麦克风阵列技术的应用,抗噪、抗... 随着声纹技术的发展并逐渐应用于智能家居领域,尤其是智能音箱已经开始影响着人们的生活,远场环境下的说话人识别技术提升迫在眉睫。本文针对说话人识别技术的发展现状以及远场环境下语音信号的处理,包括麦克风阵列技术的应用,抗噪、抗混响技术的发展与应用等两个主要方面进行阐述。 展开更多
关键词 说话人识别 语音增强 麦克风阵列 远场环境
下载PDF
基于噪声破坏和波形重建的声纹对抗样本防御方法
13
作者 魏春雨 孙蒙 +2 位作者 张雄伟 邹霞 印杰 《信息安全学报》 CSCD 2024年第1期71-83,共13页
语音是人类最重要的交流方式之一。语音信号中除了文本内容外,还包含了说话人的身份、种族、年龄、性别和情感等丰富的信息,其中说话人身份的识别也被称为声纹识别,是一种生物特征识别技术。声纹具有获取方便、容易保存、使用简单等特点... 语音是人类最重要的交流方式之一。语音信号中除了文本内容外,还包含了说话人的身份、种族、年龄、性别和情感等丰富的信息,其中说话人身份的识别也被称为声纹识别,是一种生物特征识别技术。声纹具有获取方便、容易保存、使用简单等特点,而深度学习技术的进步也极大地促进了识别准确率的提升,因此,声纹识别已被应用于智慧金融、智能家居、语音助手和司法调查等领域。另一方面,针对深度学习模型的对抗样本攻击受到了广泛关注,在输入信号中添加不可感知的微小扰动即可导致模型预测结果错误。对抗样本的出现对基于深度学习的声纹识别也将造成巨大的安全威胁。现有声纹对抗样本防御方法会不同程度地影响正常样本的识别,并且局限于特定的攻击方法或识别模型,鲁棒性较差。为了使对抗防御能够兼顾纠正错误输出和准确识别正常样本两个方面,本文提出一种“破坏+重建”的两阶段对抗样本防御方法。第一阶段,在对抗样本中添加具有一定信噪比幅度限制的高斯白噪声,破坏对抗扰动的结构进而消除样本的对抗性。第二阶段,利用提出的名为SCAT-Wave-U-Net的语音增强模型重建原始语音样本,通过在Wave-U-Net模型结构中引入Transformer全局多头自注意力和层间交叉注意力机制,使改进后的模型更有助于防御声纹对抗样本攻击。实验表明,提出的防御方法不依赖于特定声纹识别系统和对抗样本攻击方式,在两种典型的声纹识别系统下对多种类型对抗样本攻击的防御效果均优于其他预处理防御方法。 展开更多
关键词 声纹识别 噪声破坏 语音增强 对抗样本防御
下载PDF
语音识别中的一种说话人聚类算法 被引量:4
14
作者 肖述才 欧智坚 王作英 《中文信息学报》 CSCD 北大核心 2005年第4期84-88,共5页
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适... 本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR距离作为距离测度的时候,该算法对句子的聚类正确率达85·69%;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。 展开更多
关键词 计算机应用 中文信息处理 说话人聚类 说话人自适应 语音识别
下载PDF
Adaptive bands filter bank optimized by genetic algorithm for robust speech recognition system 被引量:5
15
作者 黄丽霞 G.Evangelista 张雪英 《Journal of Central South University》 SCIE EI CAS 2011年第5期1595-1601,共7页
Perceptual auditory filter banks such as Bark-scale filter bank are widely used as front-end processing in speech recognition systems.However,the problem of the design of optimized filter banks that provide higher acc... Perceptual auditory filter banks such as Bark-scale filter bank are widely used as front-end processing in speech recognition systems.However,the problem of the design of optimized filter banks that provide higher accuracy in recognition tasks is still open.Owing to spectral analysis in feature extraction,an adaptive bands filter bank (ABFB) is presented.The design adopts flexible bandwidths and center frequencies for the frequency responses of the filters and utilizes genetic algorithm (GA) to optimize the design parameters.The optimization process is realized by combining the front-end filter bank with the back-end recognition network in the performance evaluation loop.The deployment of ABFB together with zero-crossing peak amplitude (ZCPA) feature as a front process for radial basis function (RBF) system shows significant improvement in robustness compared with the Bark-scale filter bank.In ABFB,several sub-bands are still more concentrated toward lower frequency but their exact locations are determined by the performance rather than the perceptual criteria.For the ease of optimization,only symmetrical bands are considered here,which still provide satisfactory results. 展开更多
关键词 perceptual filter banks bark scale speaker independent speech recognition systems zero-crossing peak amplitude genetic algorithm
下载PDF
自然之眼观物 自然之舌言情——论纳兰词 被引量:5
16
作者 刘勇刚 《怀化师专学报》 2001年第3期57-61,共5页
论述纳兰词的成就及其独抒灵性、柔婉自然又间杂豪宕的艺术特质 ,并探索纳兰词风格转变的原因 。
关键词 清代 纳兰容若 纳兰词 创作风格 艺术本体 艺术气质
下载PDF
基于CDCPM的维吾尔语非特定人语音识别 被引量:4
17
作者 王昆仑 《计算机研究与发展》 EI CSCD 北大核心 2001年第10期1242-1245,共4页
现代维吾尔语语音识别研究尚处于起始阶段 ,在此介绍了基于中心距离连续概率模型 ( CDCPM)的维吾尔语非特定人语音识别 .CDCPM用中心距离正态 ( CDN)分布描述模型特征空间 ,去掉了 HMM的状态转移概率矩阵 A,对 HMM进行了简化和改进 .在... 现代维吾尔语语音识别研究尚处于起始阶段 ,在此介绍了基于中心距离连续概率模型 ( CDCPM)的维吾尔语非特定人语音识别 .CDCPM用中心距离正态 ( CDN)分布描述模型特征空间 ,去掉了 HMM的状态转移概率矩阵 A,对 HMM进行了简化和改进 .在维吾尔语综合语音库上进行的实验表明 :恰当地估计模型状态数和模型混合密度数 ,当模型数为 5 2 5个 ,模型状态数为 16,混合密度数为 2 4 ,维吾尔语非特定人语音识别首选正识率达到97.90 % (集内 )和 94 .76% (集外 ) ,取得了较好的识别效果 .同时 ,指出了进一步开展维吾尔语语音识别研究的几个问题 . 展开更多
关键词 维吾尔语 语音识别 中心距离连续概率模型 CDCPM
下载PDF
Fractal Dimension of Voice-Signal Waveforms 被引量:3
18
作者 Xie Yu qiong, Wen Zhi xiong Non linear Science Center , Wuhan University,Wuhan 430072,Hubei,China 《Wuhan University Journal of Natural Sciences》 CAS 2002年第4期399-402,共4页
The fractal dimension is one important parameter that characterizes waveforms. In this paper, we derive a new method to calculate fractal dimension of digital voice-signal waveforms. We show that fractal dimension is ... The fractal dimension is one important parameter that characterizes waveforms. In this paper, we derive a new method to calculate fractal dimension of digital voice-signal waveforms. We show that fractal dimension is an efficient tool for speaker recognition or speech recognition. It can be used to identify different speakers or distinguish speech. We apply our results to Chinese speaker recognition and numerical experiment shows that fractal dimension is an efficient parameter to characterize individual Chinese speakers. We have developed a semiautomatic voiceprint analysis system based on the theory of this paper and former researches. 展开更多
关键词 Key words fractal dimension voiceprint analysis speaker recognition speech recognition biometric authentication
下载PDF
言语信息处理的进展 被引量:3
19
作者 蔡莲红 贾珈 郑方 《中文信息学报》 CSCD 北大核心 2011年第6期137-141,共5页
该文介绍了言语信息处理的进展,特别提到汉语言语处理的现状。言语信息处理涉及到言语识别、说话人识别、言语合成、言语知觉计算等。带口音和随意发音的言语识别有力的支持了语言学习与口语水平测评等应用;跨信道、环境噪音、多说话人... 该文介绍了言语信息处理的进展,特别提到汉语言语处理的现状。言语信息处理涉及到言语识别、说话人识别、言语合成、言语知觉计算等。带口音和随意发音的言语识别有力的支持了语言学习与口语水平测评等应用;跨信道、环境噪音、多说话人、短语音、时变语音等因素存在的情况下提高识别正确率,是说话人识别的研究热点;言语合成主要关注多语言合成、情感言语合成、可视言语合成等;言语知觉计算开展了言语测听、噪声抑制算法、助听器频响补偿方法、语音信号增强算法等研究。将言语处理技术与语言、网络有效结合,促进了更加和谐的人机言语交互。 展开更多
关键词 言语识别 说话人识别 言语合成 言语知觉计算
下载PDF
I-vector聚类字典及注意力机制框架的说话人自适应 被引量:4
20
作者 黄俊 蒋兵 +2 位作者 李先刚 郭武生 戴礼荣 《小型微型计算机系统》 CSCD 北大核心 2019年第2期460-464,共5页
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注... 近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注意力机制的自适应框架,测试时能够在不提取i-vector和不进行二遍解码的前提下快速实现线上自适应,并且该框架具有灵活性优和可扩展性好的优点,能够方便的用于其他类型的自适应,如地域自适应和性别自适应.在Switchboard任务上,实验结果表明我们提出的框架在不同的声学模型上相对于基线均有性能提升,并且通过说话人识别任务进一步证明了该方法的合理性. 展开更多
关键词 i-vector字典 注意力机制 说话人自适应 语音识别
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部