期刊文献+
共找到337篇文章
< 1 2 17 >
每页显示 20 50 100
面向短文本的命名实体识别 被引量:18
1
作者 王丹 樊兴华 《计算机应用》 CSCD 北大核心 2009年第1期143-145,171,共4页
针对短文本命名实体识别这项紧缺任务,提出了一种面向短文本的快速有效的命名实体识别方法。该方法主要分成三步:第一步,针对短文本表达不规范特性对命名实体识别的干扰,采取去干扰字符,化繁为简等规范化操作。第二步,针对短文本语意不... 针对短文本命名实体识别这项紧缺任务,提出了一种面向短文本的快速有效的命名实体识别方法。该方法主要分成三步:第一步,针对短文本表达不规范特性对命名实体识别的干扰,采取去干扰字符,化繁为简等规范化操作。第二步,针对短文本语意不完整特性,提出用HMM(隐马尔可夫模型)以词性做观察值进行初步命名实体识别。第三步,据初步识别结果,构建拼音同指关系库来识别潜在实体。在由8464篇短文本构成的测试集上运行的实验表明,该方法能较好地进行短文本命名实体识别。 展开更多
关键词 短文本 隐马尔可夫模型 命名实体识别 拼音同指关系库 词性
下载PDF
汉语文语转换系统(TTS) 被引量:8
2
作者 谌卫军 李建民 +1 位作者 林福宗 张钹 《计算机工程与应用》 CSCD 北大核心 2000年第9期1-3,共3页
文章讨论了一个典型的汉语文语转换系统的实现。首先介绍了系统的整体框架及其各个功能模块,然后分析了系统的特点及其存在的问题,最后从两方面讨论了改进系统的具体思路:提出了一种简单而有效的基音周期提取算法,验证了上下文环境... 文章讨论了一个典型的汉语文语转换系统的实现。首先介绍了系统的整体框架及其各个功能模块,然后分析了系统的特点及其存在的问题,最后从两方面讨论了改进系统的具体思路:提出了一种简单而有效的基音周期提取算法,验证了上下文环境在提高合成语音自然度中的作用。 展开更多
关键词 汉语文语转换系统 语音自然度 标音处理 单音字
下载PDF
汉语语音合成的研究进展 被引量:7
3
作者 冯哲 孙吉贵 +1 位作者 张长胜 王岩 《吉林大学学报(信息科学版)》 CAS 2007年第2期198-206,共9页
为解决如何让机器像人那样说话的问题,综述了近年来汉语语音合成技术的进步和发展;描述了汉语语音合成系统的设计方法;对基于汉语语音特点的语音合成过程中的一些关键技术和原理进行了详细的分析和比较;阐述了语音合成在多媒体等方面上... 为解决如何让机器像人那样说话的问题,综述了近年来汉语语音合成技术的进步和发展;描述了汉语语音合成系统的设计方法;对基于汉语语音特点的语音合成过程中的一些关键技术和原理进行了详细的分析和比较;阐述了语音合成在多媒体等方面上的应用以及目前评价语音合成系统性能的一些新方法,并对当前语音合成技术的研究热点和语音合成技术存在的问题进行了分析,为语音合成技术的进一步研究提供了借鉴作用。 展开更多
关键词 文语转换 自动分词 PSOLA算法 PSFC算法 韵律特征
下载PDF
汉语语音视位的研究 被引量:10
4
作者 王志明 蔡莲红 《应用声学》 CSCD 北大核心 2002年第3期29-34,共6页
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从... MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从AVI文件中自动抽取出这些基本视位图像,从MPEG-4所规定的68个面部动画参数(FAP)中提取出28个来描述这些口形,并实现了部分FAP参数的自动测量。最后,我们给出一个视位研究应用的实例。 展开更多
关键词 汉语 语音视位 文本-语音转换系统 文本-可视语音转换系统 静态视位 MPEG-4 语音识别
下载PDF
EMS人机界面及其交互技术研究 被引量:13
5
作者 朱全胜 刘娆 李卫东 《电力自动化设备》 EI CSCD 北大核心 2007年第8期77-81,共5页
人机界面是能量管理系统(EMS)中的重要一环,利用若干先进的人机交互技术,对EMS输入端、输出端2方面进行了改进。输入端在原有的交互工具上加入语音识别,从而和鼠标、键盘形成一个多模式的输入界面。该输入界面能够减少命令输入时间以及... 人机界面是能量管理系统(EMS)中的重要一环,利用若干先进的人机交互技术,对EMS输入端、输出端2方面进行了改进。输入端在原有的交互工具上加入语音识别,从而和鼠标、键盘形成一个多模式的输入界面。该输入界面能够减少命令输入时间以及实现多命令并行输入等。输出端引入关联多屏显示技术,并将2-D可视化和3-D可视化结合使用,在听觉输出上使用语音合成技术。这些综合输出方式的结合使用能够将系统信息以更加合理、自然的方式呈现出来,便于调度员更加快速地把握系统的运行情况。 展开更多
关键词 人机界面 EMS 交互技术 语音识别 语音合成 可视化
下载PDF
中文语音合成中的文本正则化研究 被引量:12
6
作者 贾玉祥 黄德智 +1 位作者 刘武 俞士汶 《中文信息学报》 CSCD 北大核心 2008年第5期45-50,55,共7页
中文文本正则化是把非汉字字符串转化为汉字串以确定其读音的过程。该工作的难点:一是正则化对象——非汉字串形式复杂多样,难于归纳;二是非汉字串有歧义,需要消歧处理。文章引入非标准词的概念对非汉字串进行有效归类,提出非标准词的... 中文文本正则化是把非汉字字符串转化为汉字串以确定其读音的过程。该工作的难点:一是正则化对象——非汉字串形式复杂多样,难于归纳;二是非汉字串有歧义,需要消歧处理。文章引入非标准词的概念对非汉字串进行有效归类,提出非标准词的识别、消歧及标准词生成的三层正则化模型。在非标准词的消歧中引入机器学习的方法,避免了复杂规则的书写。实验表明,此方法取得了很好的效果,并具有良好的推广性,开放测试的正确率达到98.64%。 展开更多
关键词 计算机应用 中文信息处理 文本正则化 语音合成 最大熵模型
下载PDF
基于Speech SDK的语音应用程序实现 被引量:11
7
作者 高敬惠 姜子敬 胡金铭 《广西科学院学报》 2005年第3期169-172,共4页
利用MicrosoftSpeechSDK的APIforText-to-Speech和APIforSpeechRecognition,采用VisualBa-sic6.0语言,建立文本语音转换应用程序和实现语音识别程序,简单地实现了语音识别的功能,识别出来的内容即可保存为文件,也可作为命令使用,让计算... 利用MicrosoftSpeechSDK的APIforText-to-Speech和APIforSpeechRecognition,采用VisualBa-sic6.0语言,建立文本语音转换应用程序和实现语音识别程序,简单地实现了语音识别的功能,识别出来的内容即可保存为文件,也可作为命令使用,让计算机执行某项操作。 展开更多
关键词 应用程序 文本语音转换 语音识别 MICROSOFT speech SDK
下载PDF
论我国宪法上的言论自由及其义务边界 被引量:13
8
作者 范进学 《西北大学学报(哲学社会科学版)》 CSSCI 北大核心 2020年第4期155-167,共13页
我国宪法关于言论自由确立模式是“权利+义务”模式。言论自由作为宪法的基本权利,不能将其权利属性仅仅归结为政治权利和自由,而把非政治性言论排除在宪法言论自由条款保护之外,否则就会背离了我国宪法关于言论自由条款的意旨与目的。... 我国宪法关于言论自由确立模式是“权利+义务”模式。言论自由作为宪法的基本权利,不能将其权利属性仅仅归结为政治权利和自由,而把非政治性言论排除在宪法言论自由条款保护之外,否则就会背离了我国宪法关于言论自由条款的意旨与目的。应当把宪法言论自由条款看作是一个统一的、严谨的、不可分割的条款,是所有正当言论都得以保护的条款。《宪法》为第三十五条公民行使言论自由权利设定了义务性限制条款,它们构成了宪法上的言论自由的义务边界。依照宪法,我国公民行使言论自由时,必须履行不得破坏社会主义制度等九类宪法义务,它构成了一切法律规范性文件的法源,因此,所有法律规范性文件对于言论自由的限制性义务均可归到宪法上的某类义务边界之中。 展开更多
关键词 宪法文本 言论自由 基本权利 宪法义务
下载PDF
一种基于Tacotron 2的端到端中文语音合成方案 被引量:13
9
作者 王国梁 陈梦楠 陈蕾 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期111-119,共9页
颠覆性设计的端到端语音合成系统Tacotron 2,目前仅能处理英文.致力于对Tacotron 2进行多方位改进,设计了一种中文语音合成方案,主要包括:针对汉字不表音、变调和多音字等问题,添加预处理模块,将中文转化为注音字符;针对现有中文训练语... 颠覆性设计的端到端语音合成系统Tacotron 2,目前仅能处理英文.致力于对Tacotron 2进行多方位改进,设计了一种中文语音合成方案,主要包括:针对汉字不表音、变调和多音字等问题,添加预处理模块,将中文转化为注音字符;针对现有中文训练语料不足的情况,使用预训练解码器,在较少语料上获得了较好音质;针对中文语音合成急促停顿问题,采用对交叉熵损失进行加权,并用多层感知机代替变线性变换对停止符进行预测的策略,获得了有效改善;另外通过添加多头注意力机制进一步提高了中文语音合成音质.梅尔频谱、梅尔倒谱距离等的实验对比结果表明了方案的有效性:可以令Tacotron 2较好地适应中文语音合成的要求. 展开更多
关键词 语音合成 多头注意力 Tacotron 2
下载PDF
大规模语音语料库及其在TTS中应用的几个问题 被引量:12
10
作者 章森 刘磊 刁麓弘 《计算机学报》 EI CSCD 北大核心 2010年第4期687-696,共10页
首先介绍了大规模语音语料库以及基于大规模语音语料库的文语转换技术的研究现状,接着介绍了一个大规模连续汉语语音语料库的实例Slib的结构和内容;在此基础上,讨论了面向大规模语音语料库的索引技术,提出了语料库检索中的集合运算和最... 首先介绍了大规模语音语料库以及基于大规模语音语料库的文语转换技术的研究现状,接着介绍了一个大规模连续汉语语音语料库的实例Slib的结构和内容;在此基础上,讨论了面向大规模语音语料库的索引技术,提出了语料库检索中的集合运算和最小包容问题,证明了最小包容问题是NP完全的,给出了求解该问题的贪婪算法以及算法的近似比;最后,讨论了基于集合运算的大规模语音语料库的检索技术在文语转换系统中的应用,特别是在基本语言单位实例的选取问题上实现了一种基于最小包容的优化方法,对提高文语转换系统的自然度有实用价值. 展开更多
关键词 语音语料库 集合运算 文语转换 最小包容 信息检索
下载PDF
电力系统中的语音应用技术研究 被引量:9
11
作者 杨朴 游大海 《计算机仿真》 CSCD 2004年第3期91-93,共3页
随着电力市场的发展 ,电力系统对信息的处理能力进一步提高。从传统的语音报警到实时语音信息访问和语音控制 ,语音应用技术在电力系统中都得到应用。一种基于现有Internet基础构架的语音服务标准VoiceXML是网络与电话技术完美的结合 ,... 随着电力市场的发展 ,电力系统对信息的处理能力进一步提高。从传统的语音报警到实时语音信息访问和语音控制 ,语音应用技术在电力系统中都得到应用。一种基于现有Internet基础构架的语音服务标准VoiceXML是网络与电话技术完美的结合 ,制定了通过语音对话访问Web服务和交互语音问答的传递标准。VoiceXML使得开发人员从底层开发脱离出来 ,而直接面向应用提供解决方案 ;用户可以通过计算机或者电话 ,用语音访问Internet服务。该文描述了电力系统中语音技术的应用 。 展开更多
关键词 电力系统 综合自动化系统 语音服务 语音数据库 语音应用技术 语音报警 Internet
下载PDF
关于小学语文阅读教学中学生想象力的培养 被引量:11
12
作者 盛爱兰 《学周刊(下旬)》 2016年第4期190-191,共2页
想象力是学好语文必备的要素,假设一个学生没有想象力,那学习语文就没有空间可言,就没有思考的余地而言。可以说一个没有想象力的学生是学不好文化课的。小学语文教学中,对学生的想象力的培养是教学的关键所在,所以教师一定要重视,而且... 想象力是学好语文必备的要素,假设一个学生没有想象力,那学习语文就没有空间可言,就没有思考的余地而言。可以说一个没有想象力的学生是学不好文化课的。小学语文教学中,对学生的想象力的培养是教学的关键所在,所以教师一定要重视,而且要不断地训练、培养学生的想象能力,提高学生的作文能力,种下他们的文学梦的种子。 展开更多
关键词 关键词句 作文写法 课文结构 修辞手法 想象力
下载PDF
语音欺骗检测方法的研究现状及展望 被引量:10
13
作者 张雄伟 李嘉康 +1 位作者 孙蒙 郑琳琳 《数据采集与处理》 CSCD 北大核心 2020年第5期807-823,共17页
语音欺骗是指通过录音、语音合成(Text⁃to⁃speech,TTS)、语音转换(Voice conversion,VC)等手段,将一段非法的、未经过自动说话人验证(Automatic speaker verification,ASV)系统认证的声音进行“修改仿冒”,以达到通过ASV系统检测的目的... 语音欺骗是指通过录音、语音合成(Text⁃to⁃speech,TTS)、语音转换(Voice conversion,VC)等手段,将一段非法的、未经过自动说话人验证(Automatic speaker verification,ASV)系统认证的声音进行“修改仿冒”,以达到通过ASV系统检测的目的。随着人工智能和语音欺骗技术的发展,ASV系统在安全性方面遇到了严峻的挑战。检测输入ASV系统的语音的真实性,防止欺骗语音通过ASV的验证以提高ASV系统的安全性,是近年来语音领域研究的一个热点问题。国内外学者的最新研究从声学特征选取、识别模型选择等角度出发,探索了不同的语音欺骗方法对ASV系统的影响,并深入研究了相应的语音欺骗检测技术,在一定程度上提高了ASV系统的防欺骗性能。本文介绍了语音欺骗的基本方法,给出了语音欺骗检测的框架和典型声学特征,分两大类别总结了语音欺骗检测的主要方法和最新进展,梳理了目前语音欺骗检测中仍然存在的若干技术问题,并对语音欺骗检测技术的发展方向进行了展望。 展开更多
关键词 语音欺骗检测 语音合成(TTS) 语音转换(VC) 说话人验证 ASVspoof
下载PDF
空管模拟机的IBM ViaVoice技术实现研究 被引量:5
14
作者 由扬 徐肖豪 《中国民航学院学报》 2002年第3期6-9,15,共5页
阐述了空管模拟机自动机长席位的实现方法。通过对语音识别技术的研究,在引进IBMViaVoice语音识别系统的基础上,根据空管模拟机的功能需求,通过对其主控软件的改进,使语音识别技术与管制训练控制系统有机结合,实现了自动机长席位对非特... 阐述了空管模拟机自动机长席位的实现方法。通过对语音识别技术的研究,在引进IBMViaVoice语音识别系统的基础上,根据空管模拟机的功能需求,通过对其主控软件的改进,使语音识别技术与管制训练控制系统有机结合,实现了自动机长席位对非特定管制学员、连续管制指令语言的识别和仿真模拟雷达显示控制。 展开更多
关键词 模拟机 IBMViaVoice技术 语音识别 语音合成 空中交通管制
下载PDF
基于TTS和SR技术的英语自学系统设计 被引量:8
15
作者 李广丽 张红斌 《华东交通大学学报》 2009年第2期86-90,共5页
文-语转换技术和语音识别技术是实现英语自学系统的关键技术。介绍了英语自学系统的工作原理和软件结构,并在.Net环境下导入了语音应用程序编程接口-The Microsoft Speech API,利用该接口编程实现了朗读训练、听写训练和阅读训练等功能... 文-语转换技术和语音识别技术是实现英语自学系统的关键技术。介绍了英语自学系统的工作原理和软件结构,并在.Net环境下导入了语音应用程序编程接口-The Microsoft Speech API,利用该接口编程实现了朗读训练、听写训练和阅读训练等功能。系统综合运用了声音和动画的多媒体手段,获得了良好的人机交互效果。 展开更多
关键词 英语自学系统 文-语转换 语音识别 the MICROSOFT speech API .NET
下载PDF
小数据下的音素级别说话人嵌入的语音合成自适应方法 被引量:10
16
作者 徐志航 陈博 +1 位作者 张辉 俞凯 《计算机学报》 EI CAS CSCD 北大核心 2022年第5期1003-1017,共15页
在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成声音的相似度.现有的句子级别、帧级别说话人嵌入等自适应方法在合成训练集外说话人声音时会出现低相似度... 在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成声音的相似度.现有的句子级别、帧级别说话人嵌入等自适应方法在合成训练集外说话人声音时会出现低相似度的问题.使用少量的用户录制数据微调预训练的语音合成模型的自适应方法尽管能提升合成音频的相似度,但是也常伴随着自然度的下降.为了解决这个问题,本文提出了一种基于音素级别的说话人嵌入的语音合成自适应方法.在训练阶段,从真实的特征片段中提取音素级别的说话人嵌入,控制语音合成模型的训练.在自适应阶段,通过对说话人嵌入预测网络进行快速自适应,在推理阶段代替真实音频得到音素级别说话人嵌入帮助模型合成音频.实验使用了少量真实的用户录制数据,对现在主流的不同粒度的说话人嵌入方法进行了性能比较.实验表明,相比较各种不同的说话人嵌入方法,本文提出的方法在不更新语音合成模型的情况下保持自然度不明显下降,并取得了最好相似度;在更新语音合成模型的情况下,该方法同时达到了最好的自然度和相似度.分析发现音素级别的说话人嵌入方法在几乎不增加自适应训练时间的情况下,提供了更好的模型自适应初始点,有效地提高了自适应模型合成声音的质量. 展开更多
关键词 语音合成 说话人嵌入 时长模型 小数据 说话人自适应
下载PDF
基于人工智能的中文语音文本智能编辑系统设计 被引量:9
17
作者 牛嵩峰 唐炜 《广播与电视技术》 2018年第4期56-61,共6页
广播电台和电视台对新闻采访所获得的音频内容有着巨大的编辑工作量,利用人工智能维特比优化算法、时间戳、MFCC声纹识别、语义识别、语音合成和同音替换技术,设计开发出一种基于AI的中文语音文本同步剪辑系统,能够大幅度提升编辑语言... 广播电台和电视台对新闻采访所获得的音频内容有着巨大的编辑工作量,利用人工智能维特比优化算法、时间戳、MFCC声纹识别、语义识别、语音合成和同音替换技术,设计开发出一种基于AI的中文语音文本同步剪辑系统,能够大幅度提升编辑语言类音频内容效率,提高音频新闻发布的时效性。 展开更多
关键词 时间戳 同步 人工智能 维特比算法 MFCC声纹识别 语义识别 语音合成 同音替换
下载PDF
基于概率统计的韵律短语分析 被引量:6
18
作者 谌卫军 林福宗 +1 位作者 李建民 张钹 《计算机工程与应用》 CSCD 北大核心 2001年第3期10-11,34,共3页
韵律短语分析是文语转换(Text-to-Speech)系统的重要组成部分。文章实现了一个基于概率统计的韵律短语分析方法。它首先构造了一个带有韵律短语间隔标记和词语POS信息的样本库,然后用它来训练和测试一个二元组模型... 韵律短语分析是文语转换(Text-to-Speech)系统的重要组成部分。文章实现了一个基于概率统计的韵律短语分析方法。它首先构造了一个带有韵律短语间隔标记和词语POS信息的样本库,然后用它来训练和测试一个二元组模型,并针对出现的各种问题,提出了四种改进的思路。 展开更多
关键词 文语转换 韵律短语 概率模型 概率统计 语音识别
下载PDF
文本分类中受词性影响的特征权重计算方法 被引量:9
19
作者 路永和 王鸿滨 《现代图书情报技术》 CSSCI 2015年第4期18-25,共8页
【目的】为提高分类准确率,引入词性改进特征权重计算方法,进而影响文本特征权重的取值。【方法】采用对比实验的方法,将本文提出的引入词性的特征权重计算方法与传统的TF-IDF方法分组进行实验。在引入词性的特征权重计算方法中,采用粒... 【目的】为提高分类准确率,引入词性改进特征权重计算方法,进而影响文本特征权重的取值。【方法】采用对比实验的方法,将本文提出的引入词性的特征权重计算方法与传统的TF-IDF方法分组进行实验。在引入词性的特征权重计算方法中,采用粒子群算法迭代计算最优词性权重。两组实验均采用SVM分类器进行分类。【结果】实验结果表明:改进的权重计算方法比传统的TF-IDF方法的分类效果更好,分类准确率在不同特征维度下都得到明显的提高,提高幅度在2-6个百分点。【局限】由于实验条件的不足,在使用粒子群算法寻找最优权重配比时得出的结果仅是接近最优解的配比,需要扩大数据规模与增加迭代次数才能得出更佳的权重配比。【结论】在文本分类当中引入词性能有效提高分类准确率,各词性权重大小的排序从高到低为名词、字符串、动词;结合词性的权重计算方法并不只适用于某个特定的语料集,还可以适用于一般的语料集。 展开更多
关键词 文本分类 词性 权重计算 粒子群算法
原文传递
基于词性选择的文本预处理方法研究 被引量:7
20
作者 李英 《情报科学》 CSSCI 北大核心 2009年第5期717-719,738,共4页
预处理是文本分类中的一个重要环节,预处理结果的好坏不仅关系到分类的准确度,而且关系到训练时间的长短和影响到分类的速度。采用一种基于词性选择的文本预处理方法进行文本预处理,该方法与传统方法进行了实验对比,结果显示,该方法降... 预处理是文本分类中的一个重要环节,预处理结果的好坏不仅关系到分类的准确度,而且关系到训练时间的长短和影响到分类的速度。采用一种基于词性选择的文本预处理方法进行文本预处理,该方法与传统方法进行了实验对比,结果显示,该方法降低了特征维数,同时保证了分类性能。实验表明该方法能够获得较好的分类效果。 展开更多
关键词 文本分类 停用词 词性 文本预处理
原文传递
上一页 1 2 17 下一页 到第
使用帮助 返回顶部