期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
面向课堂教学内容的知识点标题生成
1
作者 肖思羽 赵晖 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期770-779,共10页
互联网时代信息量庞大,简洁的标题可以提高信息阅读效率。在课堂场景下,知识点标题生成便于用户整理和记忆课堂内容,提高课堂学习效率。该文将标题生成应用于课堂教学领域,制作了课堂知识点文本—标题数据集;提出了一种改进的TextRank... 互联网时代信息量庞大,简洁的标题可以提高信息阅读效率。在课堂场景下,知识点标题生成便于用户整理和记忆课堂内容,提高课堂学习效率。该文将标题生成应用于课堂教学领域,制作了课堂知识点文本—标题数据集;提出了一种改进的TextRank算法——考虑关键字和句子位置的文本排序(textranking considering keywords and sentence positions, TKSP)算法,该算法综合考虑了关键词和句子位置等因素对句子权重的影响,能够更准确地提取文本重点信息。使用以召回率为导向的摘要评价(recall-oriented understudy for gisting evaluation, ROUGE)方法,TKSP算法在ROUGE-1、 ROUGE-2和ROUGE-L指标上的得分率分别为51.20%、 33.42%和50.48%,将TKSP抽取式算法与统一语言模型(unified language model, UniLM)结合,并融合文本主题信息,提出统一语言模型结合考虑关键字和句子位置的文本排序算法的模型(unified language modeling combined textranking considering keywords and sentence positions, UniLM-TK), UniLM-TK在各指标上的得分率分别为73.29%、 58.12%和72.87%,与UniLM模型相比,UniLM-TK在各指标上分别提高了0.74%、 2.26%和0.87%,证明UniLM-TK模型生成的标题更准确、更有效。 展开更多
关键词 课堂教学 标题生成 主题信息 TextRank UniLM
原文传递
基于句子级LSTM编码的文本标题生成 被引量:4
2
作者 钱揖丽 马雪雯 《计算机应用与软件》 北大核心 2021年第5期190-195,共6页
在标题自动生成任务中,BiLSTM表示文本是随着时间循环递归对每个单词进行编码,需要逐字读取单词序列,语义信息会随着状态的传递不断减弱。对此,构建一个句子级LSTM的编码器,并行对文本中每个单词编码表示。循环步骤同时对单词之间的局... 在标题自动生成任务中,BiLSTM表示文本是随着时间循环递归对每个单词进行编码,需要逐字读取单词序列,语义信息会随着状态的传递不断减弱。对此,构建一个句子级LSTM的编码器,并行对文本中每个单词编码表示。循环步骤同时对单词之间的局部状态和整体文本的全局状态进行信息交换,编码得到语义表示后使用混合指针网络的解码器生成标题。在相关数据集上进行实验,结果验证了该模型在标题生成任务上的有效性。 展开更多
关键词 标题生成 句子级 LSTM 序列到序列模型
下载PDF
基于神经网络的文本标题生成原型系统设计 被引量:3
3
作者 张仕森 孙宪坤 +1 位作者 尹玲 李世玺 《电子科技》 2021年第5期35-41,共7页
针对传统人工总结、编写标题的方法在耗费大量人力、时间成本的同时难以应对互联网中大量不规范的文本的问题,文中设计了一种基于神经网络的文本标题生成原型系统。在文本标题生成原型系统中通过基于神经网络编码器-解码器模型对文本进... 针对传统人工总结、编写标题的方法在耗费大量人力、时间成本的同时难以应对互联网中大量不规范的文本的问题,文中设计了一种基于神经网络的文本标题生成原型系统。在文本标题生成原型系统中通过基于神经网络编码器-解码器模型对文本进行建模计算,从而经济、高效地生成一条准确、简洁、切合原文的标题。在编码器部分采用双向长短期记忆神经网络,充分利用上下文之间的语义联系。解码器部分则采用单向神经网络进行解码操作,并引入注意力机制来缓解信息丢失,提高标题生成效果。在LCSTS数据集上进行实验得到ROUGE-1、ROUGE-L评价指标分别为29.91和24.68,证明了该标题生成原型系统的有效性。 展开更多
关键词 人工智能 自然语言处理 神经网络 标题生成 原型系统 词向量 注意力机制 生成式技术
下载PDF
基于序列模型的单文档标题生成研究 被引量:3
4
作者 焦利颖 郭岩 +2 位作者 刘悦 俞晓明 程学旗 《中文信息学报》 CSCD 北大核心 2021年第1期64-71,共8页
中文单文档摘要是把一篇文档压缩成一个更短描述的过程。随着互联网数据量的增长,文档压缩技术对文本分析、数据浏览等有着重大的应用价值。但在基于序列模型的单文档单句摘要生成即标题生成领域中仍然存在数据使用率不高的问题。该文... 中文单文档摘要是把一篇文档压缩成一个更短描述的过程。随着互联网数据量的增长,文档压缩技术对文本分析、数据浏览等有着重大的应用价值。但在基于序列模型的单文档单句摘要生成即标题生成领域中仍然存在数据使用率不高的问题。该文提出基于关键信息指导的标题生成算法。算法中的关键信息除了主流方法中使用的新闻首段句子之外,还包括新闻后续内容中有实质信息的句子,以及新闻中的重点词语。该算法将这些关键信息作为序列模型的输入,指导其生成标题,使得生成的标题能够覆盖更多的新闻信息。实验表明,在基于序列模型生成标题时,使用关键信息能够提升新闻标题生成的效果。 展开更多
关键词 单文档 标题生成 序列模型
下载PDF
密集帧率采样的视频标题生成 被引量:2
5
作者 汤鹏杰 谭云兰 +1 位作者 李金忠 谭彬 《计算机科学与探索》 CSCD 北大核心 2018年第6期981-993,共13页
使用固定时间间隔取帧的方式用于视频标题生成,易导致多种静态或动态信息丢失,使得生成的句子质量难以提高。针对这一问题,提出了一种使用密集帧率采样的标题生成方法(dense frame rate sampling based captioning model,DFS-CM),将视... 使用固定时间间隔取帧的方式用于视频标题生成,易导致多种静态或动态信息丢失,使得生成的句子质量难以提高。针对这一问题,提出了一种使用密集帧率采样的标题生成方法(dense frame rate sampling based captioning model,DFS-CM),将视频分为多个长度统一的片段,提取片段中所有视频帧的深度CNN(convolutional neural network)特征,然后使用均值或最大值方法,降低了特征数量,增强了特征的稀疏程度;同时,还改善了模型的训练策略,增强了模型的稳定性和泛化能力。最后在S2VT框架的基础上,使用Goog Le Net和Res Net-152两种CNN模型,对所提方法进行了验证。在Youtube2Text数据集上的实验结果表明,无论是采用均值特征还是最大值特征,其模型性能与基准模型相比均得到了改善,尤其是使用Res Net-152和最大值方式,其B@4和CIDEr分别达到了47.1%和34.1%。 展开更多
关键词 视频 标题生成 GoogLeNet ResNet 长短时记忆(LSTM) 密集帧率采样
下载PDF
人工智能写作中小说标题生成的算法研究 被引量:1
6
作者 刘赛 《写作》 2019年第4期38-43,共6页
算法研究是人工智能写作领域研究的基础,目前小说创作算法研究还处于肇始阶段,非常不成熟。但是基于已有成果进行大小标题的人工智能创作,则是非常可能的,且可为未来小说创作算法研究提供经验。在小说标题生成的算法研究中,语义空间算... 算法研究是人工智能写作领域研究的基础,目前小说创作算法研究还处于肇始阶段,非常不成熟。但是基于已有成果进行大小标题的人工智能创作,则是非常可能的,且可为未来小说创作算法研究提供经验。在小说标题生成的算法研究中,语义空间算法、修辞算法和遗传算法具有内容生产的可推广性。标题生成的三种算法研究,可以打通人工智能写作中叙事语法层和语义算法层的深层逻辑关系,具有较大研究价值。 展开更多
关键词 人工智能 算法研究 标题生成
下载PDF
融入显著性事件信息的标题生成方法 被引量:1
7
作者 杨冰 孙锐 姬东鸿 《计算机工程与应用》 CSCD 北大核心 2016年第24期236-240,266,共6页
标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事... 标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事件信息的标题生成模型。该模型首先利用互增强原则学习显著性事件,并指导生成候选语句,然后根据这些候选语句构造词图,再结合路径显著性、流畅度,以及覆盖度等因素,设计相应的排名策略生成最终的标题。在标准评测集上的实验结果表明,提出的模型相对于目前主流的方法,取得了更好的性能。 展开更多
关键词 标题生成 显著性事件 多语句压缩 互增强原则
下载PDF
基于深度学习的标题生成方法综述
8
作者 蒋敏 《信息与电脑》 2018年第18期119-121,共3页
近年来,神经网络模型被广泛应用于解决根据给定的文档生成对应的标题任务,并取得了良好的结果。从基于深度学习的标题生成方法的基本框架、模型训练方法得出结论,将近年来在编码-解码框架下性能表现较好的部件和训练方法进行综合性描述... 近年来,神经网络模型被广泛应用于解决根据给定的文档生成对应的标题任务,并取得了良好的结果。从基于深度学习的标题生成方法的基本框架、模型训练方法得出结论,将近年来在编码-解码框架下性能表现较好的部件和训练方法进行综合性描述,为本领域的研究者提供参考。 展开更多
关键词 深度学习 自然语言处理 标题生成
下载PDF
基于事件图的新闻标题生成研究
9
作者 孙锐 《乐山师范学院学报》 2017年第4期42-46,共5页
为新闻自动生成标题是一个极具挑战的任务。文章基于事件图,提出一种有效的无监督标题生成方法。给定一篇新闻文档,首先为其构造事件图以表示整个篇章,然后采用图排序方法以计算每个事件的显著性得分。随后为排序后的多个事件,抽取其在... 为新闻自动生成标题是一个极具挑战的任务。文章基于事件图,提出一种有效的无监督标题生成方法。给定一篇新闻文档,首先为其构造事件图以表示整个篇章,然后采用图排序方法以计算每个事件的显著性得分。随后为排序后的多个事件,抽取其在文中的依存片段作为候选标题,最后设计一个目标优化函数以搜索最终的标题。在英文和中文数据集上的实验结果表明,文章提出的方法能有效地学习显著性事件并能较好地生成标题。 展开更多
关键词 事件抽取 互增强原则 标题生成
下载PDF
机器生成语言的质量评价方法综述 被引量:7
10
作者 秦颖 《计算机工程与科学》 CSCD 北大核心 2022年第1期138-148,共11页
生成语言的质量评价很大程度上影响着自然语言生成的研究,已成为制约该领域发展的瓶颈问题。通过对机器翻译、自动文摘、对话系统、图像标题生成和机器写作等广义自然语言生成任务的语言质量评价方法的汇总,介绍了人工评价和自动评价的... 生成语言的质量评价很大程度上影响着自然语言生成的研究,已成为制约该领域发展的瓶颈问题。通过对机器翻译、自动文摘、对话系统、图像标题生成和机器写作等广义自然语言生成任务的语言质量评价方法的汇总,介绍了人工评价和自动评价的特点、优缺点和开放评价资源,分析了不同任务的不同评价角度和适用面。不同评价方法的对比分析,可为方法融合和关键问题的探索提供借鉴。整体上机器生成语言质量评价还局限于语言形式的比较,在语义表达的准确性、衔接连贯性等深层评价上存在诸多挑战。结合评价难点问题和现有研究的推进情况,分析了生成语言质量评价的研究趋势。 展开更多
关键词 生成语言质量评价 机器翻译 自动文摘 对话系统 图像标题生成 故事生成
下载PDF
短文本新闻标题生成方法
11
作者 赵明 《电子科技》 2024年第9期87-94,共8页
当今新闻具有文本短、发布频繁、时效性强等特点,一个媒体账号一天内发布数十条新闻。为大量新闻制定适用且有吸引力的标题已经成为媒体工作者的一项主要工作内容。媒体工作者需要一个自动生成短文本标题的系统来缓解工作压力。为解决... 当今新闻具有文本短、发布频繁、时效性强等特点,一个媒体账号一天内发布数十条新闻。为大量新闻制定适用且有吸引力的标题已经成为媒体工作者的一项主要工作内容。媒体工作者需要一个自动生成短文本标题的系统来缓解工作压力。为解决该问题,文中提出了一种短文本新闻标题生成模型。该模型采用序列到序列结构,在编码器和解码器分别应用预训练语言模型和分层自注意力解码器。为了使生成标题包含原始新闻的关键信息,提出一种基于LCSTS数据集和Weibo4数据集的分阶段训练方法,并使模型分别从这两个数据集学习提取关键新闻信息和构建风格化表达,使模型生成标题能够准确表达新闻的核心内容从而吸引读者。 展开更多
关键词 新闻标题生成 预训练语言模型 分层自注意力解码器 编码器 文本提取 文本生成
下载PDF
基于T5预训练模型的时政新闻标题生成应用设计
12
作者 孟祥文 《电子技术与软件工程》 2023年第1期182-185,共4页
本文通过训练T5深度学习模型,用于生成优质的标题和摘要,通过服务调用模型,并利用人机友好的Web界面进行应用的部署,帮助创作者提升时政新闻标题创作的效率和质量。本文从五个方面叙述:系统整体功能架构、后端系统设计、深度学习模型、... 本文通过训练T5深度学习模型,用于生成优质的标题和摘要,通过服务调用模型,并利用人机友好的Web界面进行应用的部署,帮助创作者提升时政新闻标题创作的效率和质量。本文从五个方面叙述:系统整体功能架构、后端系统设计、深度学习模型、数据库设计、第三方依赖和接口调用。最后对整个项目进行总结,并提出系统的不足和未来改进思路。 展开更多
关键词 自然语言处理 T5模型 文本标题生成 软件开发
下载PDF
结合新颖的互注意力和门控机制的图像标题生成
13
作者 胡卫兵 米金鹏 +2 位作者 吴旭明 刘丹 杨芳艳 《小型微型计算机系统》 CSCD 北大核心 2023年第8期1785-1791,共7页
图像标题生成是通过机器产生描述图像的语句,属于多模态领域的重要研究方向之一,现有的工作大多数有两点不足:1)采用单一的图像特征,导致在非结构化场景中无法完全描述图像中更加细粒度的内容信息;2)模型大多数完全依赖图像的特征生成句... 图像标题生成是通过机器产生描述图像的语句,属于多模态领域的重要研究方向之一,现有的工作大多数有两点不足:1)采用单一的图像特征,导致在非结构化场景中无法完全描述图像中更加细粒度的内容信息;2)模型大多数完全依赖图像的特征生成句子,而没有引入外部知识作为辅助信息.针对上述两点,提出一种互注意力和门控机制的方法.在MSCOCO2014数据集上和Flickr30k数据集上分别进行实验,结果在各项指标上相较于主流模型均有一定的提升,表明该方法对图像内容的理解更加全面且生成的句子更加丰富. 展开更多
关键词 图像标题生成 外部知识 互注意力 门控机制
下载PDF
基于语境辅助转换器的图像标题生成算法
14
作者 连政 王瑞 +2 位作者 李海昌 姚辉 胡晓惠 《自动化学报》 EI CAS CSCD 北大核心 2023年第9期1889-1903,共15页
在图像标题生成领域,交叉注意力机制在建模语义查询与图像区域的关系方面,已经取得了重要的进展.然而,其视觉连贯性仍有待探索.为填补这项空白,提出一种新颖的语境辅助的交叉注意力(Context-assisted cross attention,CACA)机制,利用历... 在图像标题生成领域,交叉注意力机制在建模语义查询与图像区域的关系方面,已经取得了重要的进展.然而,其视觉连贯性仍有待探索.为填补这项空白,提出一种新颖的语境辅助的交叉注意力(Context-assisted cross attention,CACA)机制,利用历史语境记忆(Historical context memory,HCM),来充分考虑先前关注过的视觉线索对当前注意力语境生成的潜在影响.同时,提出一种名为“自适应权重约束(Adaptive weight constraint,AWC)”的正则化方法,来限制每个CACA模块分配给历史语境的权重总和.本文将CACA模块与AWC方法同时应用于转换器(Transformer)模型,构建一种语境辅助的转换器(Context-assisted transformer,CAT)模型,用于解决图像标题生成问题.基于MS COCO(Microsoft common objects in context)数据集的实验结果证明,与当前先进的方法相比,该方法均实现了稳定的提升. 展开更多
关键词 图像标题生成 注意力机制 转换器 视觉连贯性
下载PDF
SOM-NCSCM+:抽取式神经网络中文标题生成方法研究
15
作者 资康莉 王石 曹存根 《高技术通讯》 CAS 2023年第8期836-848,共13页
标题生成作为文本摘要任务的一个分支,能够帮助人们高效获取信息。本文针对中文标题生成任务面临的大规模、高质量中文标注数据缺乏的问题,利用标题往往可由原文中的词语来构成的特点,从将无监督学习模型与有监督的序列标注模型结合的... 标题生成作为文本摘要任务的一个分支,能够帮助人们高效获取信息。本文针对中文标题生成任务面临的大规模、高质量中文标注数据缺乏的问题,利用标题往往可由原文中的词语来构成的特点,从将无监督学习模型与有监督的序列标注模型结合的角度出发,提出了融合聚类模型和主题模型的抽取式深度神经网络中文标题生成方法和模型。在缺乏人工分类标注信息的中文新闻数据集上,该模型可利用聚类和主题模型自动挖掘数据内部潜在的特征信息,获得不同的数据簇及各簇内的主题词来辅助中文新闻标题生成,使模型在具有潜在主题类别特征的、标题质量参差的中文新闻数据集上都具有较好的适用性。本文提出的中文标题生成模型在互联网上公开的中文新闻标题数据集上的实验结果也表明其在微观F1、BLEU、ROUGE、压缩率等评价指标上都取得了较基准模型更好的效果。 展开更多
关键词 中文标题生成 神经网络模型 主题模型 聚类模型 序列标注
下载PDF
基于CNN与Transformer混合结构的多语言图像标题生成研究 被引量:2
16
作者 张大任 艾山·吾买尔 +2 位作者 宜年 刘婉月 韩越 《东北师大学报(自然科学版)》 CAS 北大核心 2022年第2期68-75,共8页
针对现有图像标题生成模型在非英语语言中质量不高且仅能实现单一语言图像标题生成的问题,提出基于CNN与Transformer混合结构的多语言图像标题生成模型.首先利用CNN提取图像特征作为Transformer模型的编码端输入,然后解码端的输入为添... 针对现有图像标题生成模型在非英语语言中质量不高且仅能实现单一语言图像标题生成的问题,提出基于CNN与Transformer混合结构的多语言图像标题生成模型.首先利用CNN提取图像特征作为Transformer模型的编码端输入,然后解码端的输入为添加语言标签、进行分词与拉丁化处理后的6种语言,训练时将不同语言的损失和作为优化目标,最终实现不同语言间的联合训练.以Flickr8K数据集为基础,拓展了包含6种语言的多语言图像标题生成数据集,并在该数据集上进行了验证.结果表明:该模型可以同时生成多种语言的图像标题,且生成质量比相同规模的单语言模型质量高,并验证了该方法的有效性. 展开更多
关键词 多语言 深度学习 TRANSFORMER 联合训练 图像标题生成
下载PDF
一种改进的LSTM模型在图像标题生成中的应用 被引量:3
17
作者 王志平 郑宝友 刘仪伟 《计算机与现代化》 2020年第4期37-41,共5页
为解决传统长短时记忆(LSTM)神经网络存在过早饱和的问题,使得对给定的图片能够生成更准确的描述,提出一种基于反正切函数的长短时记忆(ITLSTM)神经网络模型。首先,利用经典的卷积神经网络模型提取图像特征;然后,利用ITLSTM神经网络模... 为解决传统长短时记忆(LSTM)神经网络存在过早饱和的问题,使得对给定的图片能够生成更准确的描述,提出一种基于反正切函数的长短时记忆(ITLSTM)神经网络模型。首先,利用经典的卷积神经网络模型提取图像特征;然后,利用ITLSTM神经网络模型来表征图像对应的描述;最后在Flickr8K数据集上评估模型的性能,并与几种经典的图像标题生成模型如Google NIC等进行比较,实验结果表明本文提出的模型能够有效地提高图像标题生成的准确性。 展开更多
关键词 图像标题生成 反正切函数 长短时记忆神经网络 卷积神经网络
下载PDF
从图像到语言:图像标题生成与描述 被引量:2
18
作者 谭云兰 汤鹏杰 +1 位作者 张丽 罗玉盘 《中国图象图形学报》 CSCD 北大核心 2021年第4期727-750,共24页
图像标题生成与描述的任务是通过计算机将图像自动翻译成自然语言的形式重新表达出来,该研究在人类视觉辅助、智能人机环境开发等领域具有广阔的应用前景,同时也为图像检索、高层视觉语义推理和个性化描述等任务的研究提供支撑。图像数... 图像标题生成与描述的任务是通过计算机将图像自动翻译成自然语言的形式重新表达出来,该研究在人类视觉辅助、智能人机环境开发等领域具有广阔的应用前景,同时也为图像检索、高层视觉语义推理和个性化描述等任务的研究提供支撑。图像数据具有高度非线性和繁杂性,而人类自然语言较为抽象且逻辑严谨,因此让计算机自动地对图像内容进行抽象和总结,具有很大的挑战性。本文对图像简单标题生成与描述任务进行了阐述,分析了基于手工特征的图像简单描述生成方法,并对包括基于全局视觉特征、视觉特征选择与优化以及面向优化策略等基于深度特征的图像简单描述生成方法进行了梳理与总结。针对图像的精细化描述任务,分析了当前主要的图像"密集描述"与结构化描述模型与方法。此外,本文还分析了融合情感信息与个性化表达的图像描述方法。在分析与总结的过程中,指出了当前各类图像标题生成与描述方法存在的不足,提出了下一步可能的研究趋势与解决思路。对该领域常用的MS COCO2014(Microsoft common objects in context)、Flickr30K等数据集进行了详细介绍,对图像简单描述、图像密集描述与段落描述和图像情感描述等代表性模型在数据集上的性能进行了对比分析。由于视觉数据的复杂性与自然语言的抽象性,尤其是融合情感与个性化表达的图像描述任务,在相关特征提取与表征、语义词汇的选择与嵌入、数据集构建及描述评价等方面尚存在大量问题亟待解决。 展开更多
关键词 图像标题生成 深度特征 视觉描述 语段生成 图像情感 逻辑语义
原文传递
基于融合注意力机制的图像标题生成 被引量:2
19
作者 侯一雯 田玉玲 《计算机应用研究》 CSCD 北大核心 2021年第7期2209-2212,共4页
图像标题生成利用机器自动产生描述图像的句子,属于计算机视觉与自然语言处理的交叉领域。传统基于注意力机制的算法侧重特征图不同区域,忽略特征图通道,易造成注意偏差。该模型通过当前嵌入单词与隐藏层状态的耦合度来赋予特征图不同... 图像标题生成利用机器自动产生描述图像的句子,属于计算机视觉与自然语言处理的交叉领域。传统基于注意力机制的算法侧重特征图不同区域,忽略特征图通道,易造成注意偏差。该模型通过当前嵌入单词与隐藏层状态的耦合度来赋予特征图不同通道相应权重,并将其与传统方法结合为融合注意力机制,准确定位注意位置。实验结果均在指定的评估方法上有一定的提升,表明该模型可以生成更加流利准确的自然语句。 展开更多
关键词 图像标题生成 注意偏差 通道 耦合度 融合注意力
下载PDF
编码-解码技术的图像标题生成方法研究综述
20
作者 耿耀港 梅红岩 +1 位作者 张兴 李晓会 《计算机科学与探索》 CSCD 北大核心 2022年第10期2234-2248,共15页
近年来,图像标题生成作为人工智能领域中的多模态任务,融合了计算机视觉和自然语言处理的相关研究,能够实现从图像到文本的模态转换,在视觉辅助和图像理解等方面有着重要作用,备受研究者们的广泛关注。首先对图像标题生成任务进行了阐述... 近年来,图像标题生成作为人工智能领域中的多模态任务,融合了计算机视觉和自然语言处理的相关研究,能够实现从图像到文本的模态转换,在视觉辅助和图像理解等方面有着重要作用,备受研究者们的广泛关注。首先对图像标题生成任务进行了阐述,介绍了三种图像标题生成方法,基于模板的方法、基于检索的方法和基于编码-解码的方法以及各自的方法思路、代表性研究和优缺点。其次从方法的模型构成、图像理解阶段和标题生成阶段的研究进展等方面对基于编码-解码的方法进行了详细阐述。将近年来的研究总结归纳为图像理解方面的研究和标题生成方面的研究,其中图像理解方面的研究包括注意力机制的研究和语义获取方面的研究,标题生成方面的研究分为传统标题、密集标题和个性化标题生成的研究,并总结了模型性能及优缺点,介绍了图像标题生成模型进行性能评估的数据集和评测指标。最后指出图像标题生成领域研究面对的挑战和难点。 展开更多
关键词 图像标题生成 编码 解码 多模态 注意力机制
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部