期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于多通道深度学习网络的混合语言短文本情感分类方法 被引量:9
1
作者 张洋 胡燕 《计算机应用研究》 CSCD 北大核心 2021年第1期69-74,共6页
相比于单一语言的短文本情感分类而言,混合语言由于其表达情感的单词语言不唯一,语法结构复杂,仅使用传统词嵌入的方法无法使分类器学到足够有用的特征,导致分类效果不佳。针对这些问题,提出一种融合字词特征的双通道复合模型。首先,针... 相比于单一语言的短文本情感分类而言,混合语言由于其表达情感的单词语言不唯一,语法结构复杂,仅使用传统词嵌入的方法无法使分类器学到足够有用的特征,导致分类效果不佳。针对这些问题,提出一种融合字词特征的双通道复合模型。首先,针对数据集不平衡问题,提出一种基于Bert语义相似度的数据集欠采样算法;其次,构建双通道深度学习网络,分别将以字、词方式嵌入的原始数据通过两个通道送入CNN和带有注意力机制的LSTM组成的模块中进行多粒度特征提取;最后融合多通道的特征进行分类。在NLPCC2018任务1公布的混合语言五分类数据集上的实验表明,该模型的整体性能较目前有代表性的深度学习模型有进一步提高。 展开更多
关键词 混合语言短文本 多通道 注意力机制 融合特征
下载PDF
编码器-解码器模型合成汉英语码转换文本
2
作者 黄哲莹 刘作桢 +1 位作者 徐及 赵庆卫 《信号处理》 CSCD 北大核心 2022年第10期2074-2081,共8页
为了解决汉英语码转换文本数据稀缺的问题,本文提出了基于编码器-解码器模型合成语码转换文本的方法,从有限的语码转换文本与大量单语种平行语料中学习语码转换语言学规则与语种内部的语言学规则,来合成语码转换文本。但是该模型合成的... 为了解决汉英语码转换文本数据稀缺的问题,本文提出了基于编码器-解码器模型合成语码转换文本的方法,从有限的语码转换文本与大量单语种平行语料中学习语码转换语言学规则与语种内部的语言学规则,来合成语码转换文本。但是该模型合成的语码转换文本自然度低,因此本文又提出基于带复制机制的编码器-解码器模型合成语码转换文本的方法,在编码器-解码器的基础上,增加了一个门控,用来决定从编码器的预测结果还是从编码器的输入源文本中产生下一个词。最终,该方法使语言模型在SEAME测试集上的困惑度降低了绝对13.96。由此可得出结论,本文提出的方法可大规模地合成自然度高的语码转换文本,缓解语码转换文本数据的稀缺性。 展开更多
关键词 语码转换 编码器-解码器 合成文本 语言模型 语音识别
下载PDF
流行歌曲中汉英语码转换的会话分析模式
3
作者 张京涛 赵荣改 《海外英语》 2015年第16期234-235,共2页
许多脍炙人口的流行歌曲中包含不少汉英语码转换的例子。这种语码转换是随意的、随机的还是有规律可循的?对这一社会语言学问题人们似乎关注较少。文章引入会话分析模式,以流行歌曲的歌词语篇为语料,着重从其汉英语码转换的内在过程、... 许多脍炙人口的流行歌曲中包含不少汉英语码转换的例子。这种语码转换是随意的、随机的还是有规律可循的?对这一社会语言学问题人们似乎关注较少。文章引入会话分析模式,以流行歌曲的歌词语篇为语料,着重从其汉英语码转换的内在过程、规律和特点对这一现象进行了分析和研究。分析表明,中文流行歌曲中出现最多的是与语篇相关的交替式语码转换,与语言偏好相关的交替式语码转换相对较少,而与语篇相关的插入式语码转换最少。 展开更多
关键词 语码转换 流行歌曲 汉英语码 歌词语篇 会话分析模式
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部