期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
语音技术在少数民族语言的应用研究 被引量:3
1
作者 达瓦.伊德木草 木合亚提.尼亚孜别克 吾守尔.斯拉木 《新疆大学学报(自然科学版)》 CAS 2014年第1期88-96,共9页
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声... 本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM–UBM–SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM–UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%. 展开更多
关键词 语音技术 民语 说话人识别 连续语音识别 语音翻译
下载PDF
基于舆情新闻的中文关键词抽取综述 被引量:5
2
作者 杨文忠 丁甜甜 +1 位作者 康鹏 卜文秀 《计算机工程》 CAS CSCD 北大核心 2023年第3期1-17,共17页
基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度... 基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代。梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助,重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法,并归纳现有方法的优缺点与发展趋势。此外,深度学习虽然在关键词抽取领域发挥了重要的作用,但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷,需要在未来发展中进行解决。为确保分析过程的真实性,利用6个舆情新闻数据集和2个小型数据集进行实验复现,实验结果与文中理论分析一致。在此基础上,对关键词抽取技术及其所面临的困难和挑战进行梳理和分析,并针对现存问题对该领域的发展前景加以展望。 展开更多
关键词 舆情监测 关键词抽取 核心词汇 深度学习 自然语言处理
下载PDF
TLS协议恶意加密流量识别研究综述 被引量:7
3
作者 康鹏 杨文忠 马红桥 《计算机工程与应用》 CSCD 北大核心 2022年第12期1-11,共11页
随着5G时代的来临,以及公众对互联网的认识日益加深,公众对个人隐私的保护也越来越重视。由于数据加密过程中存在着恶意通信,为确保数据安全,维护社会国家利益,加密流量识别的研究工作尤为重要。针对TLS流量详细的阐述,分析了早期识别... 随着5G时代的来临,以及公众对互联网的认识日益加深,公众对个人隐私的保护也越来越重视。由于数据加密过程中存在着恶意通信,为确保数据安全,维护社会国家利益,加密流量识别的研究工作尤为重要。针对TLS流量详细的阐述,分析了早期识别方法的改进技术,包括常见的流量检测技术、DPI检测技术、代理技术以及证书检测技术。介绍了选取不同TLS加密流量特征的机器学习模型,以及无需特征选择的深度学习模型等诸多最新研究成果。对相关研究工作的不足进行总结,并对未来技术的研究工作和发展趋势进行了展望。 展开更多
关键词 5G时代 个人隐私 恶意流量 数据安全 TLS加密流量识别
下载PDF
基于多事件语义增强的情感分析 被引量:2
4
作者 张雪 赵晖 《计算机科学》 CSCD 北大核心 2023年第5期238-247,共10页
隐式情感分析是检测不包含明显情感词的句子的情感。文中集中于以事件为中心的情感分析,该任务是通过句子中描述的事件推断其情感极性。在以事件为中心的情感分析中,现有方法要么将文本中名词短语看作事件,要么采用复杂的模型建模事件,... 隐式情感分析是检测不包含明显情感词的句子的情感。文中集中于以事件为中心的情感分析,该任务是通过句子中描述的事件推断其情感极性。在以事件为中心的情感分析中,现有方法要么将文本中名词短语看作事件,要么采用复杂的模型建模事件,未能充分建模事件信息,并且没有考虑到包含多个事件的情况。为解决以上问题,提出将事件表示为事件三元组〈主语,谓语,宾语〉的形式,基于这种事件表示,进一步提出基于事件增强语义的情感分析模型MEA来检测文本的情感。文中利用句法信息捕获事件三元组的关系,根据每个事件对句子贡献程度的不同,采用注意力机制建模事件之间的关系。与此同时,采用双向长短时记忆网络建模句子的上下文信息,并采用多级性正交注意力机制捕获不同极性下注意力权重的差异,这可以作为显著的判别特征。最后,依据事件特征和句子特征的重要程度为其分配不同的权重比例,并将它们融合得到最终的句子表示。此外,文中还提出一个用于事件增强情感分析的数据集MEDS,其中每条句子都标有事件三元组表示和情感极性标签。研究表明,在自建的数据集中,所提模型优于现有的基线模型。 展开更多
关键词 事件型情感分析 表示学习 情感分析 图卷积神经网络 注意力机制
下载PDF
托忒文(TODO)办公套件的开发研究
5
作者 艾尼宛尔.托乎提 达瓦.伊德木草 +2 位作者 吾守尔.斯拉木 哈尔肯别克.木哈西 买买提.哈斯木 《新疆大学学报(自然科学版)》 CAS 北大核心 2015年第2期202-208,共7页
针对国家标准蒙文托忒文字(TODO)处理办公软件的紧迫需求,以及蒙文现行多版本软件相互不兼容以及不能跨平台利用等问题,本文研究了基于开源办公软件Libre Officez8.1和Open Type字库技术的TODO文智能化办公套件和不同码文本自动转换为... 针对国家标准蒙文托忒文字(TODO)处理办公软件的紧迫需求,以及蒙文现行多版本软件相互不兼容以及不能跨平台利用等问题,本文研究了基于开源办公软件Libre Officez8.1和Open Type字库技术的TODO文智能化办公套件和不同码文本自动转换为标准编码文本的应用软件.本办公软件的研发基本解决了现行TODO文处理软件所存在字符插入难、换行不能够对齐以及键盘设置与拼音法或26个英文字母使用习惯不一致等问题.试用测试表明,本软件有较高的易用性、稳定性、兼容性和安全性. 展开更多
关键词 托忒文办公套件 OPEN TYPE字体 输入法 国家标准 不同码文本转换
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部