期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于最小编辑距离的维语词语检错与纠错研究 被引量:11
1
作者 玛依热.依布拉音 米吉提.里米提 艾斯卡尔.艾木都拉 《中文信息学报》 CSCD 北大核心 2008年第3期110-114,共5页
拼写错误的发现和候选词选取是文本分析中的一个重要的技术问题。本文结合维吾尔语的语音和词语结构特点,列出了文本中常见的拼写错误类型,详细分析了解决方法,利用最小编辑距离(minimume ditdistance)算法实现了维吾尔语文本拼写错误... 拼写错误的发现和候选词选取是文本分析中的一个重要的技术问题。本文结合维吾尔语的语音和词语结构特点,列出了文本中常见的拼写错误类型,详细分析了解决方法,利用最小编辑距离(minimume ditdistance)算法实现了维吾尔语文本拼写错误分析中的查错和纠错功能,并以此为基础,结合维吾尔语构词规则,进一步提高了建议候选词的准确率和速度。该算法已被成功地应用到了维吾尔语文字自动校对和多文种文本检索等领域中。在以新疆高校学报为语料的测试中,词语查纠率达到85%以上。 展开更多
关键词 计算机应用 中文信息处理 维语尔语 词法分析 纠错 最小编辑距离
下载PDF
不同水平的普通话学习者单字调声调感知研究 被引量:5
2
作者 帕丽扎·克依木 古力努尔·艾尔肯 +1 位作者 米吉提·里米提 艾斯卡尔·艾木都拉 《声学技术》 CSCD 北大核心 2020年第1期61-68,共8页
首先采用实验语音学的理论和方法进行比较分析,进一步了解普通话学习者声调学习的情况,通过定量研究的方法,对两种不同水平(高级水平和初级水平)学习者的声调感知进行声学分析并对学习普通话过程中的语调掌握状况展开探讨。考察了20名... 首先采用实验语音学的理论和方法进行比较分析,进一步了解普通话学习者声调学习的情况,通过定量研究的方法,对两种不同水平(高级水平和初级水平)学习者的声调感知进行声学分析并对学习普通话过程中的语调掌握状况展开探讨。考察了20名不同水平学习者对普通话声调学习的感知情况。按学习者对汉语9个单元音的4个声调感知和12个复合元音的4个声调的单字调辨认,以及阳平-上声的区分实验数据,统计学习者的辨认准确率、各调类的偏误率和反应时间,最后利用SPSS数据分析软件从统计的角度进行了辨认准确率和反应时间的相关性分析,分别对声调感知的准确率和反应时间的显著性差异进行检验。 展开更多
关键词 普通话习得者 声调感知 单字调 偏误分析
下载PDF
基于深度神经网络的资源匮乏语言语音关键词检索 被引量:5
3
作者 张伟涛 米吉提·里米提 +1 位作者 郑方 艾斯卡尔·艾木都拉 《现代电子技术》 2022年第11期68-72,共5页
资源匮乏语言语音信息检索研究比汉语、英语等大语言进展缓慢,需要大量预处理工作。神经网络模型在低资源环境下的高效建模能力给低资源语言信息处理工作带来便利。文中以维⁃哈等低资源语言为基础,通过一系列预处理过程获得了这些语言... 资源匮乏语言语音信息检索研究比汉语、英语等大语言进展缓慢,需要大量预处理工作。神经网络模型在低资源环境下的高效建模能力给低资源语言信息处理工作带来便利。文中以维⁃哈等低资源语言为基础,通过一系列预处理过程获得了这些语言的语音及文本资源,再利用高斯混合隐马尔可夫模型GMM⁃HMM、深度神经网络隐马尔可夫模型DNN⁃HMM等完成了关键词检索实验。实验结果表明,三音素下的DNN⁃HMM模型比GMM⁃HMM模型检索性能要好。维吾尔语的ATWV达到了0.368,MTWV达到了0.491,检索结果准确率达到了89.36%;哈萨克语的ATWV达到了0.382,MTWV达到了0.421,检索结果准确率达到了82.15%。 展开更多
关键词 语音关键词检索 维吾尔语 哈萨克语 深度神经网络 检索流程 声学模型
下载PDF
基于不同单元的端到端语音识别 被引量:1
4
作者 张岩 艾斯卡尔·艾木都拉 米吉提·里米提 《中文信息学报》 CSCD 北大核心 2024年第1期166-172,共7页
端到端语音识别技术不需要文本和语音序列的强制对齐过程,且比传统语音识别系统有着更为简单直观的结构和更好的适应能力,它不需要精准的发音词典,在资源匮乏语言的语音识别研究中有更好的发展前景。该文在循环神经网络(RNN)和链接时序... 端到端语音识别技术不需要文本和语音序列的强制对齐过程,且比传统语音识别系统有着更为简单直观的结构和更好的适应能力,它不需要精准的发音词典,在资源匮乏语言的语音识别研究中有更好的发展前景。该文在循环神经网络(RNN)和链接时序分类(CTC)的基础上,实现维吾尔语不同粒度的端到端的语音识别系统,且在较少的语料库(THUYG公开语料库)上将该方法和传统的HMM语音识别框架进行比较。单音素基础上端到端方法的表现超过传统HMM-GMM框架,CER下降10.6%,而且经过稍微减少冗余后的以单字符作为建模单元的端到端语音识别系统对比基于三音素的HMM-GMM系统CER下降2.23%。对于资源匮乏语言,粒度单元的优化方法将是提高性能的下一个研究目标。 展开更多
关键词 端到端技术 语音识别 维吾尔语 链接时序分类
下载PDF
基于DNN-HMM和RNN的维吾尔语语音识别 被引量:4
5
作者 地力江·布都尼亚孜 米吉提·里米提 艾斯卡尔·艾木都拉 《现代电子技术》 2021年第17期90-94,共5页
基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超... 基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超越。文中采用Kaldi开源语音识别平台,结合RNN语言模型和DNN模型的三种损失函数,即最大互信息量(MMI)、最小贝叶斯风险(sMBR)和最小因素错误率(MPE),在维吾尔语语料库(THUYG-20公开语料库)测试数据上分别取得了16.73%,16.55%和15.95%的词错误率。相比高斯混合模型的词错误率分别降低了2.88%,3.06%和3.66%。深层神经网络在资源匮乏的少数民族语言以及多语言信息处理上有更强的能力。 展开更多
关键词 维吾尔语语音识别 RNN语言模型 DNN-HMM 声学模型 判别式训练 损失函数 Kaldi
下载PDF
基于词干单元的维-哈语文本关键词提取研究 被引量:4
6
作者 沙尔旦尔·帕尔哈 米吉提·里米提 艾斯卡尔·艾木都拉 《计算机工程与科学》 CSCD 北大核心 2020年第1期131-137,共7页
提出了基于词干单元的维吾尔语和哈萨克语(以下称维-哈语)文本关键词提取方法。维-哈语属于资源缺乏的派生类语言,词素结构分析和词干提取方法能有效地减少派生类语言的粒度容量,并且可以提高其覆盖率。从网上下载维-哈语文本,并切分成... 提出了基于词干单元的维吾尔语和哈萨克语(以下称维-哈语)文本关键词提取方法。维-哈语属于资源缺乏的派生类语言,词素结构分析和词干提取方法能有效地减少派生类语言的粒度容量,并且可以提高其覆盖率。从网上下载维-哈语文本,并切分成词素序列,用word2vec训练词干向量以分布式表示文本内容,再用TF-IDF算法对其词干向量进行加权处理。根据训练集关键词干向量和测试集词干向量相似度来提取关键词。实验结果表明,基于词素切分及词干向量表示的方法是在维-哈语等派生类语言关键词提取任务中的重要步骤,通过这个步骤,能够提高关键词提取的准确率。 展开更多
关键词 提取 形态学
下载PDF
基于稳健词素序列和LSTM的维吾尔语短文本分类 被引量:3
7
作者 沙尔旦尔·帕尔哈 米吉提·里米提 艾斯卡尔·艾木都拉 《中文信息学报》 CSCD 北大核心 2020年第1期63-70,共8页
维吾尔语是一种派生类语言,其词是由词干和词缀连接而成的。其中,词干是有实际意义的词汇单元,词缀提供语法功能。该文提出了基于词干单元和长短期记忆(LSTM)网络的维吾尔语短文本分类技术。用基于词-词素平行训练语料的稳健词素切分和... 维吾尔语是一种派生类语言,其词是由词干和词缀连接而成的。其中,词干是有实际意义的词汇单元,词缀提供语法功能。该文提出了基于词干单元和长短期记忆(LSTM)网络的维吾尔语短文本分类技术。用基于词-词素平行训练语料的稳健词素切分和词干提取方法,从互联网下载的文本中提取其词干,以此构建词干序列文本语料库,并通过Word2Vec算法映射到实数向量空间。然后用LSTM网络作为特征选择和文本分类算法进行维吾尔语短文本分类实验,并得到95.48%的分类准确率。从实验结果看,对于维吾尔语等派生类语言而言,特别是对于带噪声的文本,基于词干的分类方法有更多优异的性能。 展开更多
关键词 维吾尔语 文本分类 LSTM 形态学
下载PDF
基于深度神经网络的维语语音关键词检索 被引量:3
8
作者 张伟涛 米吉提·里米提 +1 位作者 郑方 艾斯卡尔·艾木都拉 《计算机时代》 2021年第11期21-24,29,共5页
语音识别中的一个重要的分支就是关键词检索。虽然在英语上的关键词检索已经成熟,但是低资源的语音,比如维语的语音关键词检索研究缓慢,仍需要更深入的研究。文章在维吾尔语语数据集thuyg20上,先在GMM-HMM(Gaussian Mixture Model Hidde... 语音识别中的一个重要的分支就是关键词检索。虽然在英语上的关键词检索已经成熟,但是低资源的语音,比如维语的语音关键词检索研究缓慢,仍需要更深入的研究。文章在维吾尔语语数据集thuyg20上,先在GMM-HMM(Gaussian Mixture Model Hidden Markov Model)声学模型,DNN-HMM(Hidden Markov Model Deep Neural Network)声学模型,LSTM-HMM(Long Short-term Memory Hidden Markov Model)声学模型解码产生的网格lattice上捕捉关键词,将DNN-HMM和LSTM-HMM解码产生的网格进行融合,再在融合的网格lattice上进行关键词检索。实验结果表明,融合后的结果在准确率和召回率方面要优于DNN-HMM和LSTM-HMM模型的检索性能。 展开更多
关键词 维吾尔语 低资源 语音关键词检索 深度神经网络
下载PDF
基于CNN-HMM和RNN的维吾尔语语音识别 被引量:3
9
作者 穆凯代姆罕·伊敏江 艾斯卡尔·艾木都拉 米吉提·里米提 《现代电子技术》 2021年第11期172-176,共5页
神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语... 神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语语料库(THUYG公开语料库)进行了深入研究,采用Kaldi开源语音识别平台将深度的CNN-HMM作为声学模型,通过理论分析和对比实验,分别在N-gram和RNN两种语言模型上进行对比实验。实验结果表明,基于神经网络RNN语言模型的系统有更好的识别效果,提升了维吾尔语语音识别准确率,并将词错误率降到15.06%。 展开更多
关键词 语音识别 维吾尔语 声学模型 语言模型 CNN-HMM N-GRAM语言模型 循环神经网络 Kaldi
下载PDF
非汉语母语者的普通话元音和辅音感知研究 被引量:2
10
作者 古扎丽努尔·德力木拉 古力努尔·艾尔肯 +1 位作者 米吉提·里米提 艾斯卡尔·艾木都拉 《声学技术》 CSCD 北大核心 2020年第2期214-219,共6页
语音感知研究是语音学主要研究内容之一。为了解学习者对普通话元音和辅音的感知情况,并为汉语教学提供借鉴,拓宽言语学习模型的应用领域,减少教学的盲目性,根据第二语言习得理论模式,采用实验语音学和统计学的方法,设计辨认实验和区分... 语音感知研究是语音学主要研究内容之一。为了解学习者对普通话元音和辅音的感知情况,并为汉语教学提供借鉴,拓宽言语学习模型的应用领域,减少教学的盲目性,根据第二语言习得理论模式,采用实验语音学和统计学的方法,设计辨认实验和区分实验,分别对普通话水平处于高级和初级水平的20名维吾尔族大学生元音、塞音、擦音和塞擦音的感知情况进行研究。辨认实验考察学习者对元音和辅音的感知反应时间和感知准确率。在区分实验中,计算元音对的频谱距离,辅音对的频谱距离,以及它们的时长差异,对学习者的区分能力进行分析。实验结果显示高级水平学习者的感知元音和辅音的能力明显高于初级水平学习者。学习者对发音部位靠后的元音反应时间快且感知准确率高,对于发音部位靠前的元音反应时间较慢且感知准确率低,对塞擦音的辨认准确率高,对擦音的辨认准确度最低。元音对的频谱距离和辅音对的时长差异会影响到学习者的区分能力,但辅音对的频谱距离和区分情况不存在密切联系。 展开更多
关键词 辨认实验 区分实验 语音感知 频谱距离 时长差异
下载PDF
基于扇区化光波束切换的站址受限可见光通信覆盖方法 被引量:1
11
作者 丁举鹏 易芝玲 米吉提·里米提 《光通信技术》 2023年第1期63-67,共5页
传统的静态朗伯和非朗伯光波束配置难以较好地解决发射器站址受限问题。针对单一发射器的应用场景,提出了一种基于扇区化光波束切换的信道站址受限可见光通信覆盖方法。该方法采用商业可用的倾斜非朗伯光波束,根据接收器在不同位置反馈... 传统的静态朗伯和非朗伯光波束配置难以较好地解决发射器站址受限问题。针对单一发射器的应用场景,提出了一种基于扇区化光波束切换的信道站址受限可见光通信覆盖方法。该方法采用商业可用的倾斜非朗伯光波束,根据接收器在不同位置反馈的状态信息,动态地确定能提供最佳覆盖信噪比的候选光波束,构建定向传输链路。仿真结果表明:在典型室内环境下,与传统静态朗伯光波束配置相比,该方法通过增加2个或3个候选扇区波束切换选项,接收器可分别获得4.48 dB、5.94 dB的平均信噪比增益。 展开更多
关键词 扇区化光波束 波束切换 站址资源受限 无线光通信
下载PDF
基于双向改进门控循环单元维吾尔语语音识别 被引量:2
12
作者 李连振 米吉提·里米提 +1 位作者 郑方 艾斯卡尔·艾木都拉 《计算机仿真》 北大核心 2022年第11期275-279,共5页
为了能够提升语音识别的准确率,并有效降低训练模型的复杂度,提出了一种双向改进门控循环单元的声学模型语音识别方法。模型上移除重置门,在状态更新过程中采用ReLU激活函数并与前馈连接采用的BN算法有效结合,改进的模型可以降低模型的... 为了能够提升语音识别的准确率,并有效降低训练模型的复杂度,提出了一种双向改进门控循环单元的声学模型语音识别方法。模型上移除重置门,在状态更新过程中采用ReLU激活函数并与前馈连接采用的BN算法有效结合,改进的模型可以降低模型的计算复杂度,加快模型收敛;采用双向的结构不仅可以有效帮助模型捕捉到过去和未来的语义时序信息,而且可以有效提升识别准确率。在THUYG-20维吾尔语数据集上实验结果表明,与基线传统深度神经网络进行对比,基于双向改进门控循环单元网络词错误率下降2.34%;与标准双向长短期记忆网络(LSTM)比较每个迭代周期平均训练时间减少13.4%。 展开更多
关键词 维吾尔语 语音识别 声学模型 门控循环单元
下载PDF
词干单元和卷积神经网络的哈萨克短文本分类 被引量:1
13
作者 沙尔旦尔·帕尔哈 米吉提·里米提 艾斯卡尔·艾木都拉 《小型微型计算机系统》 CSCD 北大核心 2020年第8期1627-1633,共7页
针对哈萨克文本分类中词干提取效率低以及传统框架下特征表示维度高、数据稀疏、分类准确率不高等问题,提出基于哈萨克语形态分析的词干提取方法以及wor2vec_TFIDF融合特征表示和卷积神经网络(CNN)的哈萨克短文本分类方法.首先,根据哈... 针对哈萨克文本分类中词干提取效率低以及传统框架下特征表示维度高、数据稀疏、分类准确率不高等问题,提出基于哈萨克语形态分析的词干提取方法以及wor2vec_TFIDF融合特征表示和卷积神经网络(CNN)的哈萨克短文本分类方法.首先,根据哈萨克语的词素和语音规则,用词-词素平行训练语料训练高效词干提取模型,并用该模型从网上下载的哈萨克短文本中提取词干.其次,用word2vec算法训练词干向量来分布式地表示文本内容,再用TFIDF算法对其进行加权.最后,用CNN进行文本分类实验,得到95.39%的分类准确率.实验结果表明,稳健词素切分及加权词干向量表示和深度学习方法相比传统机器学习方法更能提高哈萨克短文本分类任务的效率. 展开更多
关键词 哈萨克语 词干提取 词干向量 文本分类 形态学
下载PDF
光波导化学传感器的数据采集和分析软件的开发
14
作者 麦麦依明·马合木 米吉提·里米提 布力孜·伊米 《计算机与应用化学》 CAS CSCD 北大核心 2008年第2期177-180,共4页
在光波导化学传感器研究中,辐照计检测的光强度由记录器(打印机)显示。对观察、记录、分析和保存检测的数据极不方便。因此提高和改进光波导检测系统的性能,用VB6.0编程语言开发数据采集和分析软件。通过数据采集卡将辐照计连接计算机... 在光波导化学传感器研究中,辐照计检测的光强度由记录器(打印机)显示。对观察、记录、分析和保存检测的数据极不方便。因此提高和改进光波导检测系统的性能,用VB6.0编程语言开发数据采集和分析软件。通过数据采集卡将辐照计连接计算机并用该软件记录、处理、分析和保存检测数据,一整套实时图形化显示过程。本论文详细介绍检测系统的硬件、软件结构和性能,它不需要任何应用软件支持,可以在Windows中直接运行,界面友好、操作方便、运行稳定性好。计算机采集和处理检测数据使新系统在灵敏度、可靠性、响应速度和检测数据的精密度等方面超过了原来系统的性能,并为检测、研究该类传感器在智能化方面提供指导作用。 展开更多
关键词 光波导化学传感器 检测软件 辐照计 数据采集卡
原文传递
面向音素序列的黏着语词干提取研究
15
作者 古再力努尔·依明 米吉提·里米提 +1 位作者 哈妮克孜·伊拉洪 艾斯卡尔·艾木都拉 《小型微型计算机系统》 CSCD 北大核心 2023年第10期2362-2368,共7页
针对当前的黏着语词干提取任务难以处理具有上下文信息的句子级语料的问题,本文将维吾尔语作为研究对象,提出了一种句子上下文和字符特征相融合的,由BiLSTM、注意力机制(Attention)和CRF构成的词干提取模型.首先以句子级别的字符特征向... 针对当前的黏着语词干提取任务难以处理具有上下文信息的句子级语料的问题,本文将维吾尔语作为研究对象,提出了一种句子上下文和字符特征相融合的,由BiLSTM、注意力机制(Attention)和CRF构成的词干提取模型.首先以句子级别的字符特征向量为输入,使用BiLSTM模型获取正向和反向的上下文序列特征,并在此模型上加入注意力机制进行权重学习,通过提取全局特征信息来捕获词干和词缀边界;最后添加CRF使其从序列特征中学习更多信息,从而更有效地描述上下文信息.为验证上述模型的有效性,将本文模型在两种不同的数据集上进行了实验,并且将本文模型跟传统模型进行了对比.实验结果表明,本文模型对于句子级语料的效果更好,可以更有效地提取词干.此外,本文提出的模型优于其他传统模型,能全面考虑数据特征,具有一定的优越性. 展开更多
关键词 黏着语 维吾尔语 词干提取 上下文 注意力机制 BiLSTM-Attention-CRF
下载PDF
维-哈-柯多语言词素切分集成环境研究 被引量:1
16
作者 穆凯代姆罕·伊敏江 沙尔旦尔·帕尔哈 +1 位作者 艾斯卡尔·艾木都拉 米吉提·里米提 《电视技术》 2020年第6期46-51,63,共7页
开发一个多语言统一用户界面的集成信息处理软件环境,对少数民族自然语言处理研究工作特别是派生类语言的文本及语音等信息处理带来了巨大便利。系统基于词-词素平行语料库,从语音、词素、词以及句子等多个层面出发,对3种派生类黏着性... 开发一个多语言统一用户界面的集成信息处理软件环境,对少数民族自然语言处理研究工作特别是派生类语言的文本及语音等信息处理带来了巨大便利。系统基于词-词素平行语料库,从语音、词素、词以及句子等多个层面出发,对3种派生类黏着性语言进行声学和形态分析层面的分析,将繁杂的归一化、单元切分等工作集成到一个工程内。系统在语言和功能上可扩展,可嵌入独立的统计模型,对维-哈-柯语的词素切分准确率分别达到96%、92%和88%。 展开更多
关键词 多语言 形态学 词素切分 词干提取
下载PDF
跨信道环境下语种识别方法的研究
17
作者 迪力扎·伊力哈木 米吉提·里米提 +1 位作者 郑方 艾斯卡尔·艾木都拉 《现代电子技术》 2022年第24期37-43,共7页
针对现有语种识别方法对跨信道环境下关注较少的问题进行研究,在实际应用场景中语音采集设备与传输信道差异使得语种识别性能急剧下降。为降低跨信道对识别性能的影响,文中提出一种基于注意力机制的BiLSTM语种识别方法,在特征提取阶段对... 针对现有语种识别方法对跨信道环境下关注较少的问题进行研究,在实际应用场景中语音采集设备与传输信道差异使得语种识别性能急剧下降。为降低跨信道对识别性能的影响,文中提出一种基于注意力机制的BiLSTM语种识别方法,在特征提取阶段对比MFCC、FBANK、LPCC等不同语音特征的识别效果。实验证明FBANK特征在跨信道环境下的识别效果更好,引入注意力机制能够关注跨信道语音片段中与语种相关的信息,忽略非语种信息。所提方法在东方语种识别竞赛两个跨信道数据集(AP19⁃OLR和AP20⁃OLR)上进行实验,通过与基线系统X⁃VECTOR等语种识别方法进行对比,得出所提方法在两个数据集上的等错误率(EER)降低3.48%和5.66%。实验结果表明,基于注意力机制的BiLSTM语种识别方法能够有效提高语种识别任务中的特征提取能力,并改善跨信道环境下的语种识别性能。 展开更多
关键词 语种识别 跨信道 特征提取 注意力机制 识别方法对比 BiLSTM模型
下载PDF
基于ResNeSt网络的音频欺骗检测
18
作者 何信 胡金瑶 +1 位作者 艾斯卡尔·艾木都拉 米吉提·里米提 《现代电子技术》 2022年第23期88-92,共5页
目前最先进的语音合成和语音转换模型能够生成人耳无法区分的虚假语音,这对自动说话人验证(ASV)系统的安全构成巨大威胁。近年来,越来越多抗欺骗对策用于提高ASV系统的可靠性。然而,在实际使用中,在检测未知攻击时遇到困难,特别是,合成... 目前最先进的语音合成和语音转换模型能够生成人耳无法区分的虚假语音,这对自动说话人验证(ASV)系统的安全构成巨大威胁。近年来,越来越多抗欺骗对策用于提高ASV系统的可靠性。然而,在实际使用中,在检测未知攻击时遇到困难,特别是,合成语音欺骗算法的快速发展正在产生越来越强大的未知攻击。在这项工作中,由于ResNeSt网络模型在图像分类和检测任务中取得较好的成绩,因此构建了残差卷积神经网络的变体ResNeSt,使用时域二维特征转换、频域特征等各种特征提取方法(MFCC、LFCC、CQCC)来检测未知的合成语音欺骗攻击。实验结果表明,ResNeSt系统在ASV的逻辑评估集上达到了6.04%的等错误率(EER),相比ASVspoof2019的基线模型提高了25%的性能。 展开更多
关键词 自动说话人验证 ResNeSt模型 语音合成 语音转换 倒谱系数 EER 神经网络
下载PDF
信号频域变换的教学方法思考
19
作者 米吉提·里米提 吾米·尤努斯 艾斯卡尔·艾木都拉 《现代计算机》 2019年第22期75-79,共5页
从多年的教学工作当中发现很多学生在信号的变换域等抽象概念的理解方面有较大困难,对抽象概念理解非常模糊。由于概念抽象、学习进度快、相关理论知识覆盖面广,大部分学生很难从大量资料中系统地理解相关概念。而且大部分教材和参考文... 从多年的教学工作当中发现很多学生在信号的变换域等抽象概念的理解方面有较大困难,对抽象概念理解非常模糊。由于概念抽象、学习进度快、相关理论知识覆盖面广,大部分学生很难从大量资料中系统地理解相关概念。而且大部分教材和参考文献过分注重概念及数学公式的普遍性和通用性以及解题技巧上,在理论联系实际及应用过程的详解甚少,导致学生越学越吃力,通用公式联系不到各种不同的实际应用场合等情况。因此,有必要针对基本抽象概念的实例讲解来解释信息处理中核心概念,即信号的变换域。 展开更多
关键词 信号处理 傅立叶变换 变换域 离散信号 正交变换
下载PDF
基于小样本学习的语音端点检测
20
作者 单蒙 米吉提·里米提 艾斯卡尔·艾木都拉 《现代电子技术》 2022年第24期145-150,共6页
语音端点检测作为语音信号处理前端处理部分的一个重要环节,是各种语音任务的基础。基于深度神经网络的语音端点检测在数据支撑上需要对语音进行大量帧级别的标注,针对此问题,文中提出一种基于原型网络(ProtoNet)的小样本学习(Few⁃shot ... 语音端点检测作为语音信号处理前端处理部分的一个重要环节,是各种语音任务的基础。基于深度神经网络的语音端点检测在数据支撑上需要对语音进行大量帧级别的标注,针对此问题,文中提出一种基于原型网络(ProtoNet)的小样本学习(Few⁃shot Learning)的语音端点检测算法,进一步减少在语音端点检测算法过程中因帧级别数据标注带来的繁琐工作。该算法利用所给出的标签计算出一个分类中心,通过计算查询点到分类中心的距离将未给出标签的查询点归类到分类中心,得到一个原型中心;在测试集上,计算测试集中的查询点与原型中心的距离并进行测试。实验语料基于MUSAN语音库,使用该语音库自带的噪声库进行加噪。实验结果表明,在各种环境噪声下,基于小样本学习的语音端点检测算法的性能优于基于深度神经网络的语音端点检测算法,而且该算法能够显著减少语音端点检测算法的数据准备工作量与系统数据量。 展开更多
关键词 语音端点检测 原型网络 小样本学习 数据标注 语音信号处理 深度学习 结果分析
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部