期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于Word2Vec的情感词典自动构建与优化 被引量:40
1
作者 杨小平 张中夏 +4 位作者 王良 张永俊 马奇凤 吴佳楠 张悦 《计算机科学》 CSCD 北大核心 2017年第1期42-47,74,共7页
情感词典的构建是文本挖掘领域中重要的基础性工作。近几年,情感词典的极性标注从二元褒贬标注向多元情绪标注发展,词典的领域特性也日趋明显。但是情感类别的手工标注不但费时费力,而且情感强度难以得到准确量化,同时对领域性的过分关... 情感词典的构建是文本挖掘领域中重要的基础性工作。近几年,情感词典的极性标注从二元褒贬标注向多元情绪标注发展,词典的领域特性也日趋明显。但是情感类别的手工标注不但费时费力,而且情感强度难以得到准确量化,同时对领域性的过分关注也大大限制了情感词典的适用性[1]。通过神经网络语言模型对大规模中文语料进行统计训练,并在此基础上提出了基于转换约束集的多维情感词典自动构建方法;然后研究了基于词分布密度的感情色彩消歧方法,对兼具褒贬意味词语的感情极性进行区分和识别,并分别计算两种感情色彩下的情感类别与强度;最后提出基于多个语义资源的全局优化方案,得到包含10种情绪标注的多维汉语情感词典SentiRuc。实验证实该词典1)在类别标注检验、强度标注检验、情感消歧效果及情感分类任务中均具有良好的效果,其中的情感强度检验证实该词典具有极强的情感语义描述力。 展开更多
关键词 情感分析 多元情感分类 神经网络语言模型 情感消歧 情感强度优化框架
下载PDF
基于关键词语义网络的领域主题演化分析方法研究 被引量:35
2
作者 巴志超 杨子江 +1 位作者 朱世伟 王蕾 《情报理论与实践》 CSSCI 北大核心 2016年第3期67-72,共6页
有效揭示领域中主题的浮现机理及发展轨迹,对学科、领域未来发展态势进行预测和战略决策具有重要意义。文章提出一种基于关键词语义网络的领域主题演化分析方法。首先,通过引入浅层神经网络语言模型word2vec对领域文献的题名、摘要进行... 有效揭示领域中主题的浮现机理及发展轨迹,对学科、领域未来发展态势进行预测和战略决策具有重要意义。文章提出一种基于关键词语义网络的领域主题演化分析方法。首先,通过引入浅层神经网络语言模型word2vec对领域文献的题名、摘要进行建模学习,将关键词表示成语义级别的词向量结构;其次,在建模基础上,结合Equivalence共现系数进行关键词语义相似度计算并构建关键词语义网络;最后采用社会网络分析方法从合著网络、共现网络等角度对领域主题进行演化特征分析。实验表明:该方法能够有效地识别领域的热点主题及发展趋势。 展开更多
关键词 语义网络 神经网络语言模型 词向量 主题演化分析 语义模型
原文传递
基于深度信念网络的命名实体识别 被引量:14
3
作者 冯蕴天 张宏军 +1 位作者 郝文宁 陈刚 《计算机科学》 CSCD 北大核心 2016年第4期224-230,共7页
传统的命名实体识别方法是将大量手工制定的特征输入到统计学习模型中以实现对词语的标记,能够取得较好的效果,但其手工特征制定的方式增加了模型建立的难度。为了减轻传统方法中手工特征制定的工作量,首先对神经网络语言模型进行无监... 传统的命名实体识别方法是将大量手工制定的特征输入到统计学习模型中以实现对词语的标记,能够取得较好的效果,但其手工特征制定的方式增加了模型建立的难度。为了减轻传统方法中手工特征制定的工作量,首先对神经网络语言模型进行无监督训练以得到词语特征的分布式表示,然后将分布式的特征输入到深度信念网络中以发现词语的深层特征,最后进行命名实体识别。该方法在前人研究的基础上利用深度信念网络对神经网络语言模型进行了扩展,提出了一种可用于命名实体识别的深层架构。实验表明,在仅使用词特征和词性特征的条件下,该方法用于命名实体识别的性能略优于基于条件随机场模型的方法,具有一定的使用价值。 展开更多
关键词 深度信念网络 命名实体识别 神经网络语言模型
下载PDF
借重于人工知识库的词和义项的向量表示:以HowNet为例 被引量:11
4
作者 孙茂松 陈新雄 《中文信息学报》 CSCD 北大核心 2016年第6期1-6,14,共7页
该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无... 该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无法获得。该文提出了融合HowNet和大规模语料库的义原向量学习神经网络模型,并以义原向量为桥梁,自动得到义项向量及完善词向量。初步的实验结果表明该模型能有效提升在词相似度和词义消歧任务上的性能,有助于低频词和多义词的处理。作者指出,借重于人工知识库的神经网络语言模型应该成为今后一段时期自然语言处理的研究重点之一。 展开更多
关键词 词向量 义项向量 义原向量 HOWNET 神经网络语言模型
下载PDF
基于语义网络的研究兴趣相似性度量方法 被引量:11
5
作者 巴志超 李纲 朱世伟 《现代图书情报技术》 CSSCI 2016年第4期81-90,共10页
【目的】为准确识别研究内容相似但使用不同关键词的作者关系,解决传统共现分析方法缺乏语义关联的问题,提出一种基于关键词语义网络构建的作者研究兴趣相似性度量方法。【方法】通过引入word2vec模型对作者关键词进行词向量表示,将关... 【目的】为准确识别研究内容相似但使用不同关键词的作者关系,解决传统共现分析方法缺乏语义关联的问题,提出一种基于关键词语义网络构建的作者研究兴趣相似性度量方法。【方法】通过引入word2vec模型对作者关键词进行词向量表示,将关键词表示成语义级别的低维实值分布;计算关键词之间的语义相关度并构造关键词语义网络,采用JS距离对构建的作者研究兴趣矩阵进行相似性度量。【结果】该方法能计算出共现及非共现词对的相关性,有效地挖掘出作者之间的潜在合作关系。【局限】训练语料的数量和准确性有待进一步提高,提出的度量方法仅考虑两个作者之间的潜在合作关系。【结论】研究结果对改进基于传统的共现分析方法度量作者合作关系具有重要的参考价值。 展开更多
关键词 网络 神经网络语言模型 语义相似度 研究兴趣矩阵
原文传递
基于依存句法分析的病理报告结构化处理方法 被引量:10
6
作者 田驰远 陈德华 +1 位作者 王梅 乐嘉锦 《计算机研究与发展》 EI CSCD 北大核心 2016年第12期2669-2680,共12页
病理检查报告中的文本通常为非结构化数据,不利于计算机自动分析和处理.目前文本结构化主要采用信息关系抽取方法,然而病理检查报告所具有的语义特殊性,给中文信息关系抽取带来了挑战.为解决上述问题,设计了一种针对病理检查报告的结构... 病理检查报告中的文本通常为非结构化数据,不利于计算机自动分析和处理.目前文本结构化主要采用信息关系抽取方法,然而病理检查报告所具有的语义特殊性,给中文信息关系抽取带来了挑战.为解决上述问题,设计了一种针对病理检查报告的结构化方法,首先通过神经网络语言模型获得病理报告中的同义词表,合并一义多词现象;在此基础上,生成病理检查报告文本的依存关系树,并提出切分短句和信息标注的剪裁策略,以简化初始生成的依存关系树结构,从而使语法关系更加清晰,提高结构化结果的准确度;进而,利用依存句法分析结果从中文检查报告中提取指标及对应指标值,并自动生成结构化模板.实验采用医生真实使用的医疗病理检查报告进行验证,其结果表明:该方法在指标词和对应指标值提取任务中的准确率可以分别达到82.91%和79.11%,为相关研究打下了基础. 展开更多
关键词 医疗数据 病理报告 依存句法分析 文本结构化处理 神经网络语言模型
下载PDF
电话交谈语音识别中基于LSTM-DNN语言模型的重评估方法研究 被引量:8
7
作者 左玲云 张晴晴 +2 位作者 黎塔 梁宏 颜永红 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2016年第2期180-186,193,共8页
近年来,神经网络语言模型的研究越来越受到学术界的广泛关注。基于长短期记忆(long short-term memory,LSTM)结构的深度神经网络(LSTM-deep neural network,LSTM-DNN)语言模型成为当前的研究热点。在电话交谈语音识别系统中,语料本身具... 近年来,神经网络语言模型的研究越来越受到学术界的广泛关注。基于长短期记忆(long short-term memory,LSTM)结构的深度神经网络(LSTM-deep neural network,LSTM-DNN)语言模型成为当前的研究热点。在电话交谈语音识别系统中,语料本身具有一定的上下文相关性,而传统的语言模型对历史信息记忆能力有限,无法充分学习语料的相关性。针对这一问题,基于LSTM-DNN语言模型在充分学习电话交谈语料相关性的基础上,将其应用于语音识别系统的重评估过程,并将这一方法与基于高元语言模型、前向神经网络(feed forward neural network,FFNN)以及递归神经网络(recurrent neural network,RNN)语言模型的重评估方法进行对比。实验结果表明,LSTMDNN语言模型在重评估方法中具有最优性能,与一遍解码结果相比,在中文测试集上字错误率平均下降4.1%。 展开更多
关键词 长短期记忆 神经网络语言模型 语音识别 重评估
下载PDF
从线性位置看神经网络模型中语言规律的获得与表征 被引量:2
8
作者 张子豪 刘海涛 《当代语言学》 北大核心 2023年第6期791-809,共19页
采用位置编码的Transformer语言模型,超越前代循环神经网络(RNN)语言模型,在各项语言任务中均表现优异,表明该系列模型通过对语料的学习获得了文本数据中的语言规律。相较于前代RNN语言模型,Transformer模型加入的线性位置编码机制,为... 采用位置编码的Transformer语言模型,超越前代循环神经网络(RNN)语言模型,在各项语言任务中均表现优异,表明该系列模型通过对语料的学习获得了文本数据中的语言规律。相较于前代RNN语言模型,Transformer模型加入的线性位置编码机制,为模型充分利用语言数据中的涌现规律提供了新的路径。然而,语言规律表征形式的差异以及语言学传统研究中对词的线性位置研究的忽视,使得研究者未能关注到这一浅层特征中蕴含的规律。本文通过探索六种印欧语中功能词的线性位置分布,揭示了其中的规律性和高度可预测的分布模式,即功能词线性位置分布的句长稳定性、历时稳定性以及跨语言近义词线性位置分布的相似性,并探讨了这些规律的语言学意义。同时,本文通过对基于Transformer的神经网络语言模型注意力矩阵的研究,发现语言模型能够充分利用位置编码提供的位置信息,即掌握了线性位置分布中潜在的语言规律。研究也揭示了线性位置分布对于语言规律表征的价值。 展开更多
关键词 线性位置分布 神经网络语言模型 TRANSFORMER 位置编码 语言规律
原文传递
使用语义解析构建面向分布式SCADA系统的自然语言接口
9
作者 王涛 郭武士 +1 位作者 邓健 陈亮 《计算机科学》 CSCD 北大核心 2023年第S01期74-82,共9页
受限于传统的程式固定的视窗界面人机交互方式,大型分布式工业过程SCADA系统主要运营于中控机房,配置专业人员维持运行,系统建设和运营维护成本很高,因此探索人机自然交互接口,引导系统自适应服务意义重大。以一种面向多种专业领域的分... 受限于传统的程式固定的视窗界面人机交互方式,大型分布式工业过程SCADA系统主要运营于中控机房,配置专业人员维持运行,系统建设和运营维护成本很高,因此探索人机自然交互接口,引导系统自适应服务意义重大。以一种面向多种专业领域的分布式SCADA系统为背景,从实际运营的角度分析人机自然交互的核心需求。按照自然语言指令的复杂程度,推荐不同的语义解析算法。首先对指令采取词性标注,确定指令是否包含子指令。对于基本自然语言指令,采用TF-IDF关键词提取算法并结合余弦相似度进行结构化抽取,将其解析为SCADA操控中间语言后经形式化转换为实际操控指令。对于复杂自然语言指令,采用基于依存句法分析的结构化指令解析算法,实现实时操控接口。实验结果表明,所提出的自然语言接口能较好地解决SCADA系统的人机自然语言交互问题,指令解析方面的平均精确率、召回率以及F值分别达到了89.27%,89.28%以及89.27%,平均响应时间为1.593s,特别是为工农业信息化管控提供了更为便捷的交互手段。 展开更多
关键词 自然语言接口 神经网络语言模型 依存句法分析 SCADA系统 语义解析
下载PDF
基于神经网络语言模型的作者身份验证 被引量:2
10
作者 郭旭 祁瑞华 《情报理论与实践》 CSSCI 北大核心 2020年第3期138-144,共7页
[目的/意义]为了进一步降低作者身份验证中训练语料的字符数和测试样本的颗粒度,满足更多情报分析工作实际应用的需要。[方法/过程]文章提出了一种基于神经网络语言模型的作者身份验证方法。该方法在用某一作者的语料训练出的语言模型,... [目的/意义]为了进一步降低作者身份验证中训练语料的字符数和测试样本的颗粒度,满足更多情报分析工作实际应用的需要。[方法/过程]文章提出了一种基于神经网络语言模型的作者身份验证方法。该方法在用某一作者的语料训练出的语言模型,将给予该作者书写的其他语料更高概率的指导思想下提出。[结果/结论]实验结果表明,相较于传统的作者身份验证方法,文章提出的方法可以使用更少的训练语料,并且在小于传统方法一个数量级的测试样本颗粒度上,仍能获得略高于传统方法的AUC值,最终使得可有效验证的测试样本的颗粒度降到50。[局限]在跨体裁方面效果仍有待提高。 展开更多
关键词 情报分析 作者身份验证 神经网络语言模型 新奇检测
原文传递
基于话题翻译模型的双语文本纠错 被引量:1
11
作者 陈欢 张奇 《计算机应用与软件》 CSCD 2016年第3期284-287,共4页
近年来,随着信息全球化的影响,社交网络文本上的多语言混合现象越来越普遍。许多中文文本中混杂着其他语言的情况已很常见。绝大多数现有的自然语言处理算法都是基于单一语言的,并不能很好地处理多语言混合的文本,因此在进行其他自然语... 近年来,随着信息全球化的影响,社交网络文本上的多语言混合现象越来越普遍。许多中文文本中混杂着其他语言的情况已很常见。绝大多数现有的自然语言处理算法都是基于单一语言的,并不能很好地处理多语言混合的文本,因此在进行其他自然语言处理任务之前对文本进行预处理显得尤为重要。面对网络文本语义空间双语对齐语料的匮乏,提出一种基于话题翻译模型的方法,利用不同语义空间的语料计算网络文本语义空间的双语对齐概率,再结合神经网络语言模型将网络混合文本中的英文翻译成对应中文。实验在人工标注的测试语料上进行,实验结果表明,通过不同的对比试验证明文中的方法是有效的,能提升翻译正确率。 展开更多
关键词 网络文本 话题翻译模型 神经网络语言模型
下载PDF
结合神经文本生成的FLAT模型的中文电子病历命名实体识别
12
作者 陈鹏 苏志同 余肖生 《重庆理工大学学报(自然科学)》 CAS 北大核心 2022年第9期98-109,共12页
随着医疗信息化的发展,电子病历命名实体识别受到了广泛关注。电子病历中包含大量的专业词汇,而专业词汇的切分错误会使命名实体识别效果不佳。FLAT模型在引入词边界信息时能有效避免分词错误信息的传播,提高命名实体识别效果,但FALT模... 随着医疗信息化的发展,电子病历命名实体识别受到了广泛关注。电子病历中包含大量的专业词汇,而专业词汇的切分错误会使命名实体识别效果不佳。FLAT模型在引入词边界信息时能有效避免分词错误信息的传播,提高命名实体识别效果,但FALT模型依赖于高质量的词典信息。针对这一问题,提出了结合神经文本生成的FLAT模型,使用神经文本生成方法生成大量新病历文本,通过提出的评分函数筛选通顺的文本训练词向量作为FLAT模型的词典信息。实验表明:结合神经文本生成的FLAT模型在CCKS2017数据集上取得了95.32%的F1分数,比BiLSTM CRF模型提高了1.16%,比BERT CRF模型提高了0.89%;在CCKS2019数据集上取得了85.87%的F1分数,比BiLSTM CRF模型提高了5.19%,比BERT CRF模型提高了1.34%。 展开更多
关键词 命名实体识别 电子病历 FLAT 神经文本生成
下载PDF
基于知网相关概念场的中文词向量 被引量:1
13
作者 冯煜博 蔡东风 宋彦 《中文信息学报》 CSCD 北大核心 2020年第3期13-22,共10页
词向量是词的低维稠密实数向量表示,在自然语言处理的各项任务中都扮演了重要角色。目前词向量大多都是通过构造神经网络模型,在大规模语料库上以无监督学习的方式训练得到,这样的模型存在着两个问题:一是低频词词向量的语义表示质量较... 词向量是词的低维稠密实数向量表示,在自然语言处理的各项任务中都扮演了重要角色。目前词向量大多都是通过构造神经网络模型,在大规模语料库上以无监督学习的方式训练得到,这样的模型存在着两个问题:一是低频词词向量的语义表示质量较差;二是忽视了知识库可以对该模型提供的帮助。该文提出了利用知网相关概念场来提升词向量语义表示质量的模型。实验结果表明,在词语相似度任务、词语相关度任务和词语类比任务上,该模型使得斯皮尔曼相关性系数和准确率都得到了显著的提升。 展开更多
关键词 词向量 知网相关概念场 低频词 神经网络语言模型
下载PDF
一种基于词语抽象度的汉语隐喻识别方法 被引量:1
14
作者 黄孝喜 张华 +2 位作者 陆蓓 王荣波 吴铤 《现代图书情报技术》 CSSCI 2015年第4期34-40,共7页
【目的】设计一种自动计算汉语词语抽象度的方法,并将其用在自然语言理解中的隐喻识别任务。【方法】以统计学习理论中逻辑回归为计算模型,把神经网络语言模型获取的词语词向量作为特征,通过构建抽象词库得到特征权重向量,计算汉语词语... 【目的】设计一种自动计算汉语词语抽象度的方法,并将其用在自然语言理解中的隐喻识别任务。【方法】以统计学习理论中逻辑回归为计算模型,把神经网络语言模型获取的词语词向量作为特征,通过构建抽象词库得到特征权重向量,计算汉语词语抽象度。提出一种基于词语抽象度的汉语隐喻识别算法,验证该方法的应用效果。【结果】通过与已有的方法进行实验对比,本文设计的汉语词语抽象度计算方法更接近于人的认知常识;并且在隐喻识别任务中,也体现出更好的准确率。【局限】词语词向量表示词语抽象程度有一些缺陷;抽象词语库的规模影响特征权重向量的学习。【结论】词语抽象度计算可以表现为人对概念的一种抽象分类能力,本文提出的汉语词语抽象度计算方法得到的结果能够较好地拟合人的认知,并且实验证明词语抽象度可有效提高隐喻识别的效果。 展开更多
关键词 词语抽象度 神经网络语言模型 隐喻识别
原文传递
基于词向量的产品评论有用度评估方法
15
作者 郑华飞 周向东 《计算机工程》 CAS CSCD 北大核心 2017年第4期188-193,共6页
产品评论的快速增长以及质量的参差不齐,使得消费者获得有用的产品评论变得困难。为此,提出一种新的产品评论有用度评估方法。引入词向量作为评论文本的深度特征表示,结合结构特征、情感特征、元数据特征等训练回归模型,自动地对评论进... 产品评论的快速增长以及质量的参差不齐,使得消费者获得有用的产品评论变得困难。为此,提出一种新的产品评论有用度评估方法。引入词向量作为评论文本的深度特征表示,结合结构特征、情感特征、元数据特征等训练回归模型,自动地对评论进行有用度评估并基于有用度对评论进行排序。在Amazon真实数据集上的实验结果表明,该方法在回归性能和排序性能上均优于UGR+LEN+STR方法和基准方法。另外通过挖掘特定领域的词向量特征,该向量模型在RMSE,NDCG等评价指标上可有效地改善评估效果。 展开更多
关键词 产品评论 词向量 有用度 深度学习 神经网络语言模型
下载PDF
基于神经网络语言模型的时间序列趋势预测方法 被引量:32
16
作者 王慧健 刘峥 +1 位作者 李云 李涛 《计算机工程》 CAS CSCD 北大核心 2019年第7期13-19,25,共8页
对于时序数据的预测,传统方法多数通过分析历史数据预测出后面的一个或者多个具体值,但预测的具体数值准确率较低。为此,提出一种新的时间序列短期趋势预测方法。通过对时序数据进行离散化,用字符表示各个时间段数据的范围,并利用神经... 对于时序数据的预测,传统方法多数通过分析历史数据预测出后面的一个或者多个具体值,但预测的具体数值准确率较低。为此,提出一种新的时间序列短期趋势预测方法。通过对时序数据进行离散化,用字符表示各个时间段数据的范围,并利用神经网络语言模型预测得到下一个字符,即下一段数据的范围。实验结果表明,与支持向量机、循环神经网络、随机森林等算法相比,在预测结果分为5个区间的情况下,该算法平均预测准确率为 56.7 %,具有较高的可行性,且由于字符表示带有语义信息,所得预测结果可以反映数据趋势以及趋势变化程度。 展开更多
关键词 数据挖掘 时间序列预测 数据离散 长短时记忆 神经网络语言模型 深度学习
下载PDF
基于神经网络特征的句子级别译文质量估计 被引量:14
17
作者 陈志明 李茂西 王明文 《计算机研究与发展》 EI CSCD 北大核心 2017年第8期1804-1812,共9页
机器翻译质量估计是自然语言处理中的一个重要任务,与传统的机器翻译自动评价方法不同,译文质量估计方法评估机器译文的质量不使用人工参考译文.针对目前句子级别机器译文质量估计特征提取严重依赖语言学分析导致泛化能力不足,并且制约... 机器翻译质量估计是自然语言处理中的一个重要任务,与传统的机器翻译自动评价方法不同,译文质量估计方法评估机器译文的质量不使用人工参考译文.针对目前句子级别机器译文质量估计特征提取严重依赖语言学分析导致泛化能力不足,并且制约着后续支持向量回归算法的性能,提出了利用深度学习中上下文单词预测模型和矩阵分解模型提取句子向量特征,并将其与递归神经网络语言模型特征相结合来提高译文质量自动估计与人工评价的相关性.在WMT15和WMT16译文质量估计子任务数据集上的实验结果表明:利用上下文单词预测模型提取句子向量特征的方法性能统计一致地优于传统的QuEst方法和连续空间语言模型句子向量特征提取方法,这揭示了提出的特征提取方法不仅不需要语言学分析,而且显著地提高了译文质量估计的效果. 展开更多
关键词 机器翻译质量估计 句子级别 词向量 递归神经网络语言模型 支持向量回归
下载PDF
联合无监督词聚类的递归神经网络语言模型 被引量:1
18
作者 刘章 陈小平 《计算机系统应用》 2014年第5期101-106,共6页
研究表明,在递归神经网络语言模型的输入层加入词性标注信息,可以显著提高模型的效果.但使用词性标注需要手工标注的数据训练,耗费大量的人力物力,并且额外的标注器增加了模型的复杂性.为了解决上述问题,本文尝试将布朗词聚类的... 研究表明,在递归神经网络语言模型的输入层加入词性标注信息,可以显著提高模型的效果.但使用词性标注需要手工标注的数据训练,耗费大量的人力物力,并且额外的标注器增加了模型的复杂性.为了解决上述问题,本文尝试将布朗词聚类的结果代替词性标注信息加入到递归神经网络语言模型输入层.实验显示,在PennTreebank语料上,加入布朗词类信息的递归神经网络语言模型相比原递归神经网络语言模型困惑度下降8~9%. 展开更多
关键词 递归神经网络 词性标注 布朗词聚类 语言模型
下载PDF
图像语义相似性网络的文本描述方法 被引量:2
19
作者 刘畅 周向东 施伯乐 《计算机应用与软件》 北大核心 2018年第1期211-216,231,共7页
图像的文本化描述解决图像理解的高级语义问题。由于存在语义鸿沟,导致自动生成的文本与图像内容有较大差异,浅层神经网络构建的语言模型很难生成通顺的语句。为此,提出图像语义相似性神经网络,在递归神经网络的输出层之后添加全连接网... 图像的文本化描述解决图像理解的高级语义问题。由于存在语义鸿沟,导致自动生成的文本与图像内容有较大差异,浅层神经网络构建的语言模型很难生成通顺的语句。为此,提出图像语义相似性神经网络,在递归神经网络的输出层之后添加全连接网络,引入图像间的视觉相似性和文本相似性信息,从而在预测图像的文本描述时保持相似图像的有效语义信息。增加栈式隐层和普通隐层的深度来提高语言模型的学习能力,最终得到接近自然语言的文本。实验结果表明,该方法在BLEU、ROUGE、METEOR和CIDEr等评价指标上均取得较好的效果,能够生成符合图像内容的高质量文本描述。 展开更多
关键词 图像文本化描述 递归神经网络 语义相似性 语言模型 语义鸿沟 束搜索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部