期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
字符级卷积神经网络短文本分类算法 被引量:22
1
作者 刘敬学 孟凡荣 +1 位作者 周勇 刘兵 《计算机工程与应用》 CSCD 北大核心 2019年第5期135-142,共8页
由于短文本具有长度短、特征稀疏以及上下文依赖性强等特点,传统方法对其直接进行分类精度有限。针对该问题,提出了一种基于字符级嵌入的卷积神经网络(CNN)和长短时记忆网络(LSTM)相结合的神经网络模型进行短文本的分类。该模型同时包... 由于短文本具有长度短、特征稀疏以及上下文依赖性强等特点,传统方法对其直接进行分类精度有限。针对该问题,提出了一种基于字符级嵌入的卷积神经网络(CNN)和长短时记忆网络(LSTM)相结合的神经网络模型进行短文本的分类。该模型同时包括了高速公路网络(Highway networks)框架,用于缓解深度神经网络训练时的困难,提高分类的准确性。通过对几种数据集的测试,结果表明提出的模型在短文本分类任务中优于传统模型和其他基于CNN的分类模型。 展开更多
关键词 字符 神经网络 文本分类 高速公路网络
下载PDF
全卷积神经网络的字符级文本分类方法 被引量:10
2
作者 张曼 夏战国 +1 位作者 刘兵 周勇 《计算机工程与应用》 CSCD 北大核心 2020年第5期166-172,共7页
传统卷积神经网络文本分类模型全连接层参数过多易引发过拟合问题,为此,将图像分割中的全卷积思想首次引入字符级文本分类任务中,不仅避免了过拟合问题,而且通过卷积层替换全连接层减少了参数数量,从而加快了模型收敛速度。文本分类问... 传统卷积神经网络文本分类模型全连接层参数过多易引发过拟合问题,为此,将图像分割中的全卷积思想首次引入字符级文本分类任务中,不仅避免了过拟合问题,而且通过卷积层替换全连接层减少了参数数量,从而加快了模型收敛速度。文本分类问题中单词、短语等层面的处理方式存在获取文本信息不充分的问题。使用字符级全卷积神经网络进行文本分类,充分获取文本信息,并在卷积池化层后添加局部响应归一化层(LRN),提高了模型的总体性能。通过使用多指标在测试数据集中进行模型评估,充分验证了该模型的有效性,与其他模型相比,提出的模型在二分类与多分类任务中具有更好的分类性能。 展开更多
关键词 文本分类 全卷积神经网络 字符 局部响应归一化层(LRN) 特征提取
下载PDF
一种结合压缩激发块和CNN的文本分类模型 被引量:4
3
作者 陶永才 刘亚培 +3 位作者 马建红 李琳娜 石磊 卫琳 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1925-1929,共5页
针对单一卷积神经网络进行文本分类,容易出现忽视局部与整体之间关联性的问题,本文构建了一种基于压缩激发块的卷积神经网络文本分类模型,提高文本分类的精确度.主要工作分为三部分:1)使用字符级词向量作为卷积神经网络的输入;2)引入压... 针对单一卷积神经网络进行文本分类,容易出现忽视局部与整体之间关联性的问题,本文构建了一种基于压缩激发块的卷积神经网络文本分类模型,提高文本分类的精确度.主要工作分为三部分:1)使用字符级词向量作为卷积神经网络的输入;2)引入压缩-激发块学习使用全局信息,有选择地强调有用的特征,来增加提取特征的多样性,弥补单一卷积神经网络多样性的不足;3)使用多头注意力机制进行权重更新计算,突出类别向量的重要程度.实验结果显示,本文提出的文本分类模型,在THUCNews数据集和搜狐数据集上,比单一的字符级卷积神经网络模型精确度分别提高了2.29%、4.75%. 展开更多
关键词 字符 压缩—激发块 多头注意力机制 文本分类
下载PDF
基于字符级循环网络的查询意图识别模型 被引量:4
4
作者 孟奎 刘梦赤 胡婕 《计算机工程》 CAS CSCD 北大核心 2017年第3期181-186,共6页
以特征模板为主的查询意图识别方法存在人工抽取特征繁琐,并且难以捕捉文本语义信息的问题。为此,基于字符级循环网络,提出一种新的查询意图识别模型。为能有效提取句子深层次语义特征,减少长距离信息依赖的限制,使用长短时记忆网络(LS... 以特征模板为主的查询意图识别方法存在人工抽取特征繁琐,并且难以捕捉文本语义信息的问题。为此,基于字符级循环网络,提出一种新的查询意图识别模型。为能有效提取句子深层次语义特征,减少长距离信息依赖的限制,使用长短时记忆网络(LSTM)作为神经网络线性变换层,同时增加一层反向LSTM抽取字符的将来信息特征。使用原始汉字直接作为模型的输入,避免分词结果不准确带来的错误传导问题,利用字符的分布向量表示方法,提高句子语义特征的获取。实验结果表明,该方法整体准确率达到90.7%,相比特征模板方法有所提升,能提高用户查询意图的分类性能。 展开更多
关键词 查询意图 字符 循环神经网络 记忆网络 词向量
下载PDF
字符级全卷积神经网络的文本分类方法 被引量:3
5
作者 李思锐 《计算机科学与应用》 2020年第2期225-235,共11页
为了解决传统卷积神经网络的全连接层参数过多,计算效率低的问题。该文将图像处理中使用的全卷积神经网络和全局平均池化层用于文本分类,将卷积层和全局平均池化层结合并替换全连接层,同时参照Inception结构使用多尺度的卷积核,减少了... 为了解决传统卷积神经网络的全连接层参数过多,计算效率低的问题。该文将图像处理中使用的全卷积神经网络和全局平均池化层用于文本分类,将卷积层和全局平均池化层结合并替换全连接层,同时参照Inception结构使用多尺度的卷积核,减少了模型的参数数量,加快了模型的收敛速度,增加了模型的分类准确率。此外为了避免维度灾难和词级向量训练速度慢的问题,该文采用字符级进行向量化表示。并使用批量标准化层代替Dropout层,减少了过拟合问题。通过使用多指标在测试数据集中进行模型评估,充分验证了该模型的有效性,与传统模型相比,提出的模型在分类任务中具有更好的分类性能。 展开更多
关键词 文本分类 字符 全卷积神经网络 全局平局池化层
下载PDF
基于深度学习的法院信息文本分类 被引量:2
6
作者 杨帆 陈建峡 +2 位作者 郑吟秋 黄煜俊 李超 《湖北工业大学学报》 2019年第4期63-67,共5页
为解决在法院数据信息化过程中,海量的法院文书存在缺乏自动管理分类的问题,提出一种基于字符级卷积神经网络的文本分类模型。模型通过卷积神经网络进行特征提取,能够精确有效地解决文本分类问题。实验结果证明,该模型可以实现在测试集... 为解决在法院数据信息化过程中,海量的法院文书存在缺乏自动管理分类的问题,提出一种基于字符级卷积神经网络的文本分类模型。模型通过卷积神经网络进行特征提取,能够精确有效地解决文本分类问题。实验结果证明,该模型可以实现在测试集上准确率99.67%的分类,且训练用时只有常用循环神经网络算法的50%。 展开更多
关键词 法院信息文本 卷积神经网络 字符 深度学习 文本分类
下载PDF
基于卷积神经网络的字符级用户名嵌入跨社交网络身份匹配算法
7
作者 刘甜甜 《电脑知识与技术》 2021年第5期197-198,212,共3页
针对现有基于用户名的跨社交网络用户身份匹配算法,匹配时需要设计复杂的用户名字符串统计特征用于机器学习模型输入,本文提出了一个端到端的基于卷积神经网络的用户名字符级嵌入身份匹配算法。
关键词 卷积神经网络 用户名嵌入 字符 用户身份匹配
下载PDF
用于短文本分类的DC-BiGRU_CNN模型 被引量:16
8
作者 郑诚 薛满意 +1 位作者 洪彤彤 宋飞豹 《计算机科学》 CSCD 北大核心 2019年第11期186-192,共7页
文本分类是自然语言处理中一项比较基础的任务,如今深度学习技术被广泛用于处理文本分类任务。在处理文本序列时,卷积神经网络可以提取局部特征,循环神经网络可以提取全局特征,它们都表现出了不错的效果。但是,卷积神经网络不能很好地... 文本分类是自然语言处理中一项比较基础的任务,如今深度学习技术被广泛用于处理文本分类任务。在处理文本序列时,卷积神经网络可以提取局部特征,循环神经网络可以提取全局特征,它们都表现出了不错的效果。但是,卷积神经网络不能很好地捕获文本的上下文相关语义信息,循环神经网路对语义的关键信息不敏感。另外,利用更深层次的网络虽然可以更好地提取特征,但是容易产生梯度消失或梯度爆炸问题。针对以上问题,文中提出了一种基于密集连接循环门控单元卷积网络的混合模型(DC-BiGRU_CNN)。该模型首先用一个标准的卷积神经网络训练出字符级词向量,然后将其与词级词向量进行拼接并作为网络输入层。受密集连接卷积网络的启发,在对文本进行高级语义建模阶段时,采用文中提出的密集连接双向门控循环单元,其可以弥补梯度消失或梯度爆炸的缺陷,并且加强了每一层特征之间的传递,实现了特征复用;对前面提取的深层高级语义表示进行卷积和池化操作以获得最终的语义特征表示,再将其输入到softmax层,实现对文本的分类。在多个公开数据集上的研究结果表明,DC-BiGRU_CNN模型在执行文本分类任务时准确率有显著提升。此外,通过实验分析了模型的不同部件对性能提升的作用,研究了句子的最大长度值、网络的层数、卷积核的大小等参数对模型效果的影响。 展开更多
关键词 字符词向量 双向门控循环单元 密集连接 卷积神经网络 文本分类
下载PDF
基于细粒度词表示的命名实体识别研究 被引量:15
9
作者 林广和 张绍武 林鸿飞 《中文信息学报》 CSCD 北大核心 2018年第11期62-71,78,共11页
命名实体识别(NER)是自然语言处理中的一项基础任务,其性能的优劣极大地影响着关系抽取、语义角色标注等后续任务。传统的统计模型特征设计难度大、领域适应性差,一些神经网络模型则忽略了词本身所具有的形态学信息。针对上述问题,该文... 命名实体识别(NER)是自然语言处理中的一项基础任务,其性能的优劣极大地影响着关系抽取、语义角色标注等后续任务。传统的统计模型特征设计难度大、领域适应性差,一些神经网络模型则忽略了词本身所具有的形态学信息。针对上述问题,该文构建了一种基于细粒度词表示的端到端模型(Finger-BiLSTM-CRF)来进行命名实体识别任务。该文首先提出一种基于注意力机制的字符级词表示模型Finger来融合形态学信息和单词的字符信息,然后将Finger与BiLSTM-CRF模型联合进行实体识别,最终该方法以端到端、无任何特征工程的方式在CoNLL 2003数据集上取得了F1为91.09%的结果。实验表明,该文设计的Finger模型显著提升NER系统的召回率,从而使得模型的识别能力显著提升。 展开更多
关键词 命名实体识别 端到端模型 字符词表示模型 注意力机制
下载PDF
用于短文本分类的BLSTM_MLPCNN模型 被引量:10
10
作者 郑诚 洪彤彤 薛满意 《计算机科学》 CSCD 北大核心 2019年第6期206-211,共6页
文本表示和文本特征提取是自然语言处理的基础工作,直接影响文本分类的性能。文中提出了以字符级向量联合词向量作为输入的BLSTM_MLPCNN神经网络模型。该模型首先将卷积神经网络(CNN)作用于字符以获取字符级向量,并将字符级向量联合词... 文本表示和文本特征提取是自然语言处理的基础工作,直接影响文本分类的性能。文中提出了以字符级向量联合词向量作为输入的BLSTM_MLPCNN神经网络模型。该模型首先将卷积神经网络(CNN)作用于字符以获取字符级向量,并将字符级向量联合词向量作为预训练词嵌入向量,也即双向长短时记忆网(BLSTM)模型的输入;然后联合BLSTM模型的前向输出、词嵌入向量、后向输出构成文档特征图;最后利用多层感知器卷积神经网络(MLPCNN)进行特征提取。在相关数据集上的实验结果表明:相比于CNN,RNN以及CNN与RNN的组合模型,BLSTM_MLPCNN模型具有更优的分类性能。 展开更多
关键词 字符向量 词向量 卷积神经网络(CNN) 双向长短时记忆神经网络(BLSTM) 多层感知器(MLP) 多层感知器卷积网络(MLPCNN)
下载PDF
融合字符级滑动窗口和深度残差网络的僵尸网络DGA域名检测方法 被引量:7
11
作者 刘小洋 刘加苗 +1 位作者 刘超 张宜浩 《电子学报》 EI CAS CSCD 北大核心 2022年第1期250-256,共7页
本文提出了一种基于字符级滑动窗口的深度残差网络(Sliding Window-Depth Residual Network,SWDRN),首次将轻量级深度可分离式卷积应用于僵尸网络中DGA(Domain Generation Algorithm)域名检测.SW-DRN采用深度可分离式卷积,相比标准卷积... 本文提出了一种基于字符级滑动窗口的深度残差网络(Sliding Window-Depth Residual Network,SWDRN),首次将轻量级深度可分离式卷积应用于僵尸网络中DGA(Domain Generation Algorithm)域名检测.SW-DRN采用深度可分离式卷积,相比标准卷积减少了约56%的参数,增强了模型检测效率.采集两种不同来源的数据,分别命名为Real-Dataset和Gen-Dataset.SW-DRN与对照组模型在两个数据集上进行实验,实验结果表明:SW-DRN模型在DGA域名二分类任务中的F-Score评估指标上分别取得了99.23%和97.81%的成绩;并且在少样本DGA域名家族以及域名字符串易混淆DGA域名情形下多分类任务中取得不错的成绩,相比目前已有的DGA域名分类模型在总体FScore上提升了1.23%和1.01%的性能,增强了DGA域名家族之间的识别;同时还对所提出的模型在生成对抗模型产生域名进行测试,均能得到有效的识别. 展开更多
关键词 域名生成算法 字符向量 残差网络 深度可分离式卷积
下载PDF
基于字符级特征自适应的生物医学命名实体识别 被引量:3
12
作者 于祥钦 王香 +1 位作者 李智强 徐贤 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1876-1883,共8页
生物医学领域新增实体数量和类型迅速增加,在预训练词表容量有限的情况下,字符嵌入可以在一定程度上解决未登录词问题,单一的字符级特征提取器所提取字符嵌入的潜在表征有一定局限性.针对此问题,提出一种字符级特征自适应融合的生物医... 生物医学领域新增实体数量和类型迅速增加,在预训练词表容量有限的情况下,字符嵌入可以在一定程度上解决未登录词问题,单一的字符级特征提取器所提取字符嵌入的潜在表征有一定局限性.针对此问题,提出一种字符级特征自适应融合的生物医学命名实体模型.首先利用卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)提取文本的字符向量,训练过程中动态计算文本单词两种字符向量的权重并进行拼接,使得模型在字符粒度上更加充分的利用信息,并加入词性信息和组块分析作为额外特征;将词向量、字符级特征和额外特征拼接后输入到BiLSTM-CRF神经网络模型进行训练.结果表明,所提模型在NCBI-disease和BiocreativeⅡGM语料库上平均F1值达到87.14%和81.04%,有效的提升了生物医学命名实体识别的效果. 展开更多
关键词 生物医学命名实体识别 双向长短期记忆网络 卷积神经网络 字符特征 自适应
下载PDF
混合特征及多头注意力的中文短文本分类
13
作者 江结林 朱永伟 +2 位作者 许小龙 崔燕 赵英男 《计算机工程与应用》 CSCD 北大核心 2024年第9期237-243,共7页
传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本... 传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本的字符级向量和词级向量表示,以得到更全面的文本特征向量表示;采用多头注意力机制捕捉文本序列中的依赖关系,以提高文本的语义理解;通过卷积神经网络分别提取两种向量表示的特征,并将其融合为一个特征向量,以整合文本的全局和局部信息;通过输出层得到分类结果。在三个公开数据集上的实验表明,HF-MHA能够有效地提升中文短文本分类的性能。 展开更多
关键词 中文短文本分类 注意力机制 向量 字符向量
下载PDF
基于深度学习与规则结合的海运货物邮件命名实体识别
14
作者 滕俊凯 张俊 《计算机应用与软件》 北大核心 2024年第4期119-128,共10页
针对海运货物邮件实体识别中存在识别精度不高、实体边界确定困难的问题,提出一种结合深度学习与规则匹配的识别方法。其中:深度学习方法是在BiLSTM-CRF(Bidirectional Long Short Term Memory-Conditional Random Field)模型的基础上... 针对海运货物邮件实体识别中存在识别精度不高、实体边界确定困难的问题,提出一种结合深度学习与规则匹配的识别方法。其中:深度学习方法是在BiLSTM-CRF(Bidirectional Long Short Term Memory-Conditional Random Field)模型的基础上添加词的字符级特征,并融入多头注意力机制以捕获邮件文本中长距离依赖;规则匹配方法则根据领域实体特点制定规则来完成识别。根据货物邮件特点将语料进行标注并划分为:货物名称、货物重量、装卸港口、受载期和佣金五个类别。在自建语料中设置多组对比实验,实验表明所提方法在海运货物邮件实体识别的F1值达到79.3%。 展开更多
关键词 命名实体识别 海运货物邮件 多头注意力机制 字符特征 规则匹配
下载PDF
视频实时评论的深度语义表征方法 被引量:6
15
作者 吴法民 吕广奕 +5 位作者 刘淇 何明 常标 何伟栋 钟辉 张乐 《计算机研究与发展》 EI CSCD 北大核心 2019年第2期293-305,共13页
随着互联网技术的进步,以视频实时评论为代表的众包短文本(又称弹幕)逐渐流行,对在线媒体分享平台和娱乐产业都带来了重要影响.针对此类短文本展开研究,为推荐系统以及人工智能等领域的发展提供了新的机遇,在各行各业都具有巨大价值.然... 随着互联网技术的进步,以视频实时评论为代表的众包短文本(又称弹幕)逐渐流行,对在线媒体分享平台和娱乐产业都带来了重要影响.针对此类短文本展开研究,为推荐系统以及人工智能等领域的发展提供了新的机遇,在各行各业都具有巨大价值.然而在弹幕带来机遇的同时,理解和分析这种面向视频的众包短文本也面临诸多挑战:视频实时评论的高噪声、不规范表达和隐含语义等特性,使得传统自然语言处理(natural language processing, NLP)技术具有很大局限性,因此亟需一种容错性强、能刻画短文本深度语义的理解方法.针对以上挑战,在"相近时间段内的视频实时评论具有相似语义"假设的基础上,提出了一种基于循环神经网络(recurrent neural network, RNN)的深度语义表征模型.该模型由于引入了字符级别的循环神经网络,避免了弹幕噪声对文本分词带来的影响.通过使用神经网络,使所得的语义向量能够表达弹幕的隐含语义.在此基础上,进一步设计了基于语义检索的弹幕解释框架,同时作为对语义表征结果的应用验证.最后,设计了多种对比方法,并采用不同指标对所提出的模型进行充分的验证.该模型能够精准地刻画弹幕短文本的语义,也证明了关于弹幕相关假设的合理性. 展开更多
关键词 视频实时评论 弹幕 深度语义表征 语义检索 字符循环神经网络
下载PDF
基于字符级语言建模的汉蒙神经机器翻译方法研究 被引量:1
16
作者 胡泽林 高翊 +1 位作者 李淼 曹宜超 《昆明理工大学学报(自然科学版)》 北大核心 2023年第3期85-92,共8页
随着机器学习技术的发展,文字翻译模型的翻译效率与准确率逐步提高,要达到理想的翻译效果离不开大量高质量的平行语料.疫情以来,我国坚持扩大内需、形成强大的国内市场,各民族间的联系比以往更为紧密,各种语言间的翻译尤为重要.蒙古语... 随着机器学习技术的发展,文字翻译模型的翻译效率与准确率逐步提高,要达到理想的翻译效果离不开大量高质量的平行语料.疫情以来,我国坚持扩大内需、形成强大的国内市场,各民族间的联系比以往更为紧密,各种语言间的翻译尤为重要.蒙古语作为一类使用量较大的少数民族语言,不同词形涵义千差万别且缺少足够的平行语料支撑训练,导致现有的语言翻译模型效果不佳.本文针对以上问题,进行如下研究:(1)提出字符级语句分割,缓解平行语料不足带来的未登录词问题,降低了计算成本.(2)使用去噪自编码技术,迫使模型学习如何更加鲁棒地表达输入特征,增强模型的泛化能力.(3)使用无监督对偶式迭代翻译模型,将汉蒙翻译与蒙汉翻译以对偶方式同时进行无监督式迭代训练,实现语言建模与双向翻译,通过比较同数据集下该模型与传统Transformer模型训练的BLEU值得出,该模型具有更好的性能、更高的翻译准确率. 展开更多
关键词 汉蒙神经机器翻译 小语种语言翻译 翻译模型 去噪自编码 字符语言
原文传递
面向中文文本分类的字符级对抗样本生成方法 被引量:1
17
作者 张顺香 吴厚月 +2 位作者 朱广丽 许鑫 苏明星 《电子与信息学报》 EI CSCD 北大核心 2023年第6期2226-2235,共10页
对抗样本生成是一种通过添加较小扰动信息,使得神经网络产生误判的技术,可用于检测文本分类模型的鲁棒性。目前,中文领域对抗样本生成方法主要有繁体字和同音字替换等,这些方法都存在对抗样本扰动幅度大,生成对抗样本质量不高的问题。... 对抗样本生成是一种通过添加较小扰动信息,使得神经网络产生误判的技术,可用于检测文本分类模型的鲁棒性。目前,中文领域对抗样本生成方法主要有繁体字和同音字替换等,这些方法都存在对抗样本扰动幅度大,生成对抗样本质量不高的问题。针对这些问题,该文提出一种字符级对抗样本生成方法(PGAS),通过对多音字进行替换可以在较小扰动下生成高质量的对抗样本。首先,构建多音字字典,对多音字进行标注;然后对输入文本进行多音字替换;最后在黑盒模式下进行对抗样本攻击实验。实验在多种情感分类数据集上,针对多种最新的分类模型验证了该方法的有效性。 展开更多
关键词 对抗样本生成 文本分类 情感分类 多音字 字符对抗样本
下载PDF
基于字符级扩张卷积网络的Web攻击检测方法 被引量:4
18
作者 范敏 胥小波 聂小明 《计算机应用研究》 CSCD 北大核心 2020年第S02期234-237,共4页
Web应用程序经常被恶意HTTP请求利用,如XSS(cross-site scripting)攻击和SQLi(SQL injection)攻击是严重的网络威胁,会导致灾难性的数据泄露和丢失。Web应用程序防火墙通常使用规则模式匹配的方法保护Web应用程序免受已知的恶意攻击。然... Web应用程序经常被恶意HTTP请求利用,如XSS(cross-site scripting)攻击和SQLi(SQL injection)攻击是严重的网络威胁,会导致灾难性的数据泄露和丢失。Web应用程序防火墙通常使用规则模式匹配的方法保护Web应用程序免受已知的恶意攻击。然而,基于规则模式匹配的方式需要经验专家根据不同的攻击情景制定相应的规则,而且对于未知的恶意请求很难觉察。另一方面,由于网络攻击类型众多,传统机器学习算法难以构造人工泛化特征。因此,提出了基于字符级扩张卷积网络(CDCNN)的Web攻击智能检测方法。该方法基于深度学习技术,不用人工构造特征,在CSIC 2010公共数据集上实现了98.1%的精确度,相比传统的机器学习算法提高了10%以上。同时将该方法应用于云防真实数据集,相比基于规则的方法攻击漏报率从1.43%降低到0.98%;在线上XSS防御中相比基于传统的SVM方法,将误报率从2.76%降低到0.77%。 展开更多
关键词 WEB攻击 深度学习 字符扩张卷积网络 SQLi XSS
下载PDF
针对音变问题改进的维汉神经网络机器翻译鲁棒性方法研究
19
作者 阿里木·赛买提 沙丽瓦尔·阿里木 +3 位作者 卡哈尔·卡迪尔 刘轩铭 凌震华 刘俊华 《新疆师范大学学报(自然科学版)》 2023年第4期1-8,共8页
由于维吾尔语具有音变差异,在记录时容易混淆,这对机器翻译的容错能力提出了挑战。从词粒度研究的角度出发,针对维吾尔语中具有明显语音特性的音变词的翻译问题,采用字符级神经网络机器翻译(Character level Neural Network Machine Tra... 由于维吾尔语具有音变差异,在记录时容易混淆,这对机器翻译的容错能力提出了挑战。从词粒度研究的角度出发,针对维吾尔语中具有明显语音特性的音变词的翻译问题,采用字符级神经网络机器翻译(Character level Neural Network Machine Translation,CharNMT)结构,并结合覆盖率机制进行优化,这一方法不仅提高了音变词的翻译质量,还展现出较好的容错能力。在基础模型取得了1.25 Blue分的提升,并在训练和解码速度方面也具有优势。 展开更多
关键词 维吾尔语音变词 神经网络机器翻译技术 容错能力 字符神经网络机器翻译
下载PDF
维汉人名翻译中不雅字或OOV的前处理研究 被引量:3
20
作者 阿里木·赛买提 沙丽瓦尔·阿里木 +4 位作者 吐尔根·依不拉音 段雪明 古丽尼格尔·阿不都外力 麦合甫热提 吾守尔·斯拉木 《东北师大学报(自然科学版)》 CAS 北大核心 2022年第2期76-80,共5页
针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉... 针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉语部分训练1—4阶N-Gram语言模型,根据语言模型对该数据进行打分后筛选出best-2结果,并结合了维汉字符级端到端的神经网络人名翻译模型.通过实验可发现,结合本文提出的前处理方法后的维汉人名翻译模型效果是BLEU提升了0.95分,并且不雅字或不恰当表示问题也得到了明显的改善. 展开更多
关键词 机器翻译 OOV 维汉人名 Fast align 字符端到端的神经网络
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部