期刊文献+
共找到81篇文章
< 1 2 5 >
每页显示 20 50 100
用于问题生成的知识增强双图交互网络 被引量:1
1
作者 李亚峰 叶东毅 陈羽中 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1032-1038,共7页
问题生成是一项具有挑战性的自然语言处理任务,旨在生成具有给定答案和上下文的问题,近年来受到了广泛关注.最近,由于神经网络的发展,问题生成任务取得了较大的进展.然而,现有模型仍然存在未有效利用外部知识以及在利用图神经网络捕获... 问题生成是一项具有挑战性的自然语言处理任务,旨在生成具有给定答案和上下文的问题,近年来受到了广泛关注.最近,由于神经网络的发展,问题生成任务取得了较大的进展.然而,现有模型仍然存在未有效利用外部知识以及在利用图神经网络捕获隐藏结构信息未捕获语法信息等问题.针对上述问题本文提出知识增强双图交互网络KE-BGINN(Knowledge-Enhanced Bi-Graph Interaction Neural Network).首先为了有效利用外部知识信息,KE-BGINN通过知识图谱本身的图结构信息构造知识增强图,并利用图卷积网络对文本以及答案上下文语义信息进行扩充.其次,KE-BGINN引入一种双图交互机制,利用两个图卷积网络学习上下文的隐藏结构信息以及语法信息,在图间信息融合时,构造一个虚拟图来充分融合不同图之间的异构信息.最后,KE-BGINN利用指针网络解码机制来解决问题生成时罕见和未知词的问题.在SQuAD数据集上的实验结果证明,与对比模型相比较,KE-BGINN模型的综合性能更加优异. 展开更多
关键词 问题生成 知识图谱 图卷积网络 双图交互 虚拟图
下载PDF
基于多视角匹配的中文问答对自动生成框架
2
作者 尹文峰 黄莉 顾进广 《计算机应用与软件》 北大核心 2024年第3期163-168,共6页
针对目前问答对生成方法中问题与答案不完全匹配的问题,提出一种基于神经网络自动从中文生成问答对的方法。使用命名实体识别和规则的方法从文本中抽取关键词,确定问题的主题;使用多视角匹配的神经网络模型从文本中生成问题,避免对手工... 针对目前问答对生成方法中问题与答案不完全匹配的问题,提出一种基于神经网络自动从中文生成问答对的方法。使用命名实体识别和规则的方法从文本中抽取关键词,确定问题的主题;使用多视角匹配的神经网络模型从文本中生成问题,避免对手工模板强依赖;使用阅读理解模型根据问题生成置信度更高的答案。实验结果分析表明,生成问题的质量高于基于模板的方法,并且能够过滤80%的不匹配问答对。 展开更多
关键词 中文 问题生成 神经网络
下载PDF
基于文本知识增强的问题生成模型
3
作者 陈佳玉 王元龙 张虎 《计算机工程》 CAS CSCD 北大核心 2024年第6期86-93,共8页
预训练语言模型在大规模训练数据和超大规模算力的基础上,能够从非结构化的文本数据中学到大量的知识。针对三元组包含信息有限的问题,提出利用预训练语言模型丰富知识的问题生成方法。首先,利用预训练语言模型中丰富的知识增强三元组信... 预训练语言模型在大规模训练数据和超大规模算力的基础上,能够从非结构化的文本数据中学到大量的知识。针对三元组包含信息有限的问题,提出利用预训练语言模型丰富知识的问题生成方法。首先,利用预训练语言模型中丰富的知识增强三元组信息,设计文本知识生成器,将三元组中的信息转化为子图描述,丰富三元组的语义;然后,使用问题类型预测器预测疑问词,准确定位答案所在的领域,从而生成语义正确的问题,更好地控制问题生成的效果;最后,设计一种受控生成框架对关键实体和疑问词进行约束,保证关键实体和疑问词同时出现在问题中,使生成的问题更加准确。在公开数据集WebQuestion和PathQuestion中验证所提模型的性能。实验结果表明,与现有模型LFKQG相比,所提模型的BLUE-4、METEOR、ROUGE-L指标在WebQuestion数据集上分别提升0.28、0.16、0.22个百分点,在PathQuestion数据集上分别提升0.8、0.39、0.46个百分点。 展开更多
关键词 自然语言理解 问题生成 知识图谱 预训练语言模型 知识增强
下载PDF
基于Graph Transformer的知识库问题生成 被引量:4
4
作者 胡月 周光有 《中文信息学报》 CSCD 北大核心 2022年第2期111-120,共10页
知识库问答依靠知识库推断答案,需要大量带标注信息的问答对,但构建大规模且精准的数据集不仅代价昂贵,还受领域等因素限制。为缓解数据标注问题,面向知识库的问题生成任务引起了研究者关注,该任务的特点是利用知识库三元组自动生成问题... 知识库问答依靠知识库推断答案,需要大量带标注信息的问答对,但构建大规模且精准的数据集不仅代价昂贵,还受领域等因素限制。为缓解数据标注问题,面向知识库的问题生成任务引起了研究者关注,该任务的特点是利用知识库三元组自动生成问题,但现有方法仅由一个三元组生成的问题过于简短,且缺乏多样性。为生成信息量丰富且多样化的问题,该文采用Graph Transformer和BERT两个编码层来加强三元组多粒度语义表征以获取背景信息,在SimpleQuestions数据集上的实验结果证明了该方法的有效性。 展开更多
关键词 问题生成 知识库 语义表征 知识库问答
下载PDF
基于答案及其上下文信息的问题生成模型 被引量:5
5
作者 谭红叶 孙秀琴 闫真 《中文信息学报》 CSCD 北大核心 2020年第5期74-81,共8页
基于文本的问题生成是从给定的句子或段落中生成相关问题。目前,主要采用序列到序列的神经网络模型来研究包含答案的句子生成问题,然而这些方法存在以下问题:①生成的疑问词与答案类型不匹配;②问题与答案的相关性不强。该文提出一个基... 基于文本的问题生成是从给定的句子或段落中生成相关问题。目前,主要采用序列到序列的神经网络模型来研究包含答案的句子生成问题,然而这些方法存在以下问题:①生成的疑问词与答案类型不匹配;②问题与答案的相关性不强。该文提出一个基于答案及其上下文信息的问题生成模型。该模型首先根据答案与上下文信息的关系确定与答案类型匹配的疑问词;然后利用答案及其上下文信息确定问题相关词,使问题尽可能使用原文中的词;最后结合原句作为输入来生成问题。相关实验表明,该文提出的模型性能明显优于基线系统。 展开更多
关键词 问题生成 神经网络 问题相关词
下载PDF
融合预训练模型的中文知识图谱问题生成方法 被引量:5
6
作者 叶子 陈小平 +2 位作者 张波 欧阳昱 刘辉舟 《小型微型计算机系统》 CSCD 北大核心 2021年第2期246-250,共5页
基于知识图谱的问答方法旨在通过知识图谱的三元组检索和推断来对自然语言形式的问题进行解答.然而,现有中文知识图谱问答语料库存在规模较小,质量较差等问题,相关语料库构建方法亟待完善.因此,本文提出一种融合预训练模型的中文知识图... 基于知识图谱的问答方法旨在通过知识图谱的三元组检索和推断来对自然语言形式的问题进行解答.然而,现有中文知识图谱问答语料库存在规模较小,质量较差等问题,相关语料库构建方法亟待完善.因此,本文提出一种融合预训练模型的中文知识图谱问题生成方法,目标是以中文知识图谱三元组作为输入生成正确且多样的问题.该方法汲取了条件变分自编码器的思想,以预编码器-源编码器-解码器为核心架构,利用BERT模型进行预编码,并以Transformer模型为基础构建源编码器和解码器.此外,该方法还结合了答案编码技术并进行了改进.本文使用NLPCC2017 KBQA数据集进行实验,实验表明该模型在BLEU、ROUGE以及人工评价指标上较基线模型有明显提升,并且能够生成更具多样性的问题,证明了该方法的有效性. 展开更多
关键词 知识图谱 问题生成 预训练模型 条件变分自编码器
下载PDF
基于条件变分自编码器的问题生成方法
7
作者 刘东 洪宇 +1 位作者 苏玉兰 张民 《山东大学学报(理学版)》 CAS CSCD 北大核心 2023年第1期48-58,共11页
将条件变分自编码器作为辅助模块,引入预训练语言模型的编码解码过程,通过数据增强(潜在的语义扩充)以提高模型的鲁棒性。通过建立陈述句与疑问句之间的高维分布联系,由分布采样实现一对多的问题生成。结果表明,融合条件变分自编码器不... 将条件变分自编码器作为辅助模块,引入预训练语言模型的编码解码过程,通过数据增强(潜在的语义扩充)以提高模型的鲁棒性。通过建立陈述句与疑问句之间的高维分布联系,由分布采样实现一对多的问题生成。结果表明,融合条件变分自编码器不仅能生成多样性的问题,也有助于提升问题生成的模型性能。在基于SQuAD数据集划分的2个答案可知问题生成数据集Split1和Split2上,BLEU-4值分别被提升到20.75%和21.61%。 展开更多
关键词 条件变分自编码器 问题生成 预训练语言模型
原文传递
基于模板学习的智能侨情问句生成方法
8
作者 方昱龙 王泽锦 +1 位作者 王华珍 何霆 《华侨大学学报(自然科学版)》 CAS 2023年第6期735-742,共8页
为解决侨情问句甚少导致训练的侨情语料较少的问题,提出一种基于模板学习的智能侨情问句生成方法。首先,对侨情篇章文本进行包含主题、关系、对象的三元组抽取;其次,构建训练数据集,输入数据由主题和关系构成,输出数据为问句模板;随后,... 为解决侨情问句甚少导致训练的侨情语料较少的问题,提出一种基于模板学习的智能侨情问句生成方法。首先,对侨情篇章文本进行包含主题、关系、对象的三元组抽取;其次,构建训练数据集,输入数据由主题和关系构成,输出数据为问句模板;随后,采用以BERT+LSTM+Attention为核心算法的seq2seq框架,实现问句模板生成;最后,对模板问句进行主题文本替换,从而得到最终的实例化问句。采用BLEU,ROUGE-N,公开问答系统评测及人工评价方式对文中方法进行评价。结果表明:BLEU,ROUGE-N,公开问答系统评测及人工评价方式对文中方法的评测结果分别为0.77,0.67,81%,88%,较基线模型有较大的提升。 展开更多
关键词 侨情 问句生成 模板学习 seq2seq 注意力机制
下载PDF
基于改进注意力机制的问题生成模型研究 被引量:3
9
作者 易也难 卞艺杰 《微电子学与计算机》 2022年第4期49-57,共9页
问题生成是一项应用非常广泛的自然语言生成任务,现有的研究大多数是采用基于循环神经网络构建的序列到序列模型.由于循环神经网络自带的“长期依赖”问题,导致模型编码器在对输入语句建模表示时,无法有效地捕获到词语间的相互关系信息... 问题生成是一项应用非常广泛的自然语言生成任务,现有的研究大多数是采用基于循环神经网络构建的序列到序列模型.由于循环神经网络自带的“长期依赖”问题,导致模型编码器在对输入语句建模表示时,无法有效地捕获到词语间的相互关系信息.此外,在解码阶段,模型解码器通常只利用编码器的单层输出或者顶层输出来计算全局注意力权重,无法充分利用从原始输入语句中提取到的语法语义信息.针对以上两个缺陷,现提出一种基于改进注意力机制的问题生成模型.该模型在编码器中加入了自注意力机制,用来获取输入词语间的相互关系信息,并且在解码器生成问题词语时,采用编码器的多层输出联合计算全局注意力权重,可以充分利用语法语义信息提高解码效果.利用SQuAD数据集对上述改进模型进行了实验,实验结果表明,改进模型在自动评估方法和人工评估方法中均优于基准模型,并且通过样例分析可以看出,改进模型生成的自然语言问题质量更高. 展开更多
关键词 问题生成 序列到序列模型 自注意力机制 全局注意力机制
下载PDF
基于双注意力的段落级问题生成研究 被引量:3
10
作者 曾碧卿 裴枫华 +1 位作者 徐马一 丁美荣 《中文信息学报》 CSCD 北大核心 2022年第8期154-162,174,共10页
段落级问题生成是指从给定的段落中生成一个或多个与之相关的问题。目前的研究主要使用序列到序列的神经网络最大程度地利用段落信息,但这种方法存在冗余信息干扰、无法聚焦重点句子的问题。针对上述问题,该文提出了一种基于双注意力的... 段落级问题生成是指从给定的段落中生成一个或多个与之相关的问题。目前的研究主要使用序列到序列的神经网络最大程度地利用段落信息,但这种方法存在冗余信息干扰、无法聚焦重点句子的问题。针对上述问题,该文提出了一种基于双注意力的段落级问题生成模型。该模型首先对段落和答案所在句子分别使用注意力机制,然后利用门控机制动态地分配权重并融合上下文信息,最后利用改进的指针生成网络结合上下文向量和注意力分布来生成问题。实验结果表明,该模型在SQuAD数据集上比现有主流模型具有更高的性能。 展开更多
关键词 问题生成 双注意力 指针生成网络
下载PDF
基于密令位置信息特征的问题生成 被引量:4
11
作者 董孝政 洪宇 +2 位作者 朱芬红 姚建民 朱巧明 《中文信息学报》 CSCD 北大核心 2019年第8期93-100,共8页
问题生成是指在理解特定陈述句语义的前提下,自动地生成一条或多条关于该陈述句的问题。该文主要针对其中一项子任务开展研究,即一对一的问题生成(Point-wise Question Generation,PQG)。现有PQG研究,主要以端到端的序列化生成模型为框... 问题生成是指在理解特定陈述句语义的前提下,自动地生成一条或多条关于该陈述句的问题。该文主要针对其中一项子任务开展研究,即一对一的问题生成(Point-wise Question Generation,PQG)。现有PQG研究,主要以端到端的序列化生成模型为框架,相应方法生成的问句,在流畅度方面已达到有限的可接受度(BlEU-4约13%)。尽管如此,现有方法缺乏语块一级的注意力建模,从而无法将"潜在提问对象"的语义独立且整体地纳入表示学习过程。这一不足往往负面影响解码端的问题类型预测和提问词估计。针对这一问题,该文提出了一种融合密令注意力机制的端对端PQG模型。其中,密令是对短语和语块一级的潜在答案的总体概括,其往往表现为陈述句中的一组连续的词项。在方法实现方面,该文在端对端架构的编码过程中,将密令的位置信息与全句语义信息进行融合,而在解码过程中,则加强了针对密令的注意力。实验采用SQuAD语料予以实施,测试结果显示,该文所提方法的性能优于现有主流模型,其获得的BLEU-4指标高于基准系统1.98%。 展开更多
关键词 问题生成 密令 端到端
下载PDF
基于迭代信息传递和滑动窗口注意力的问题生成模型研究
12
作者 陈千 高晓影 +1 位作者 王素格 郭鑫 《中文信息学报》 CSCD 北大核心 2023年第12期106-114,共9页
知识图谱问题生成任务是从给定的知识图谱中生成与其相关的问题。目前,知识图谱问题生成模型主要使用基于RNN或Transformer对知识图谱子图进行编码,但这种方式丢失了显式的图结构化信息,在解码器中忽视了局部信息对节点的重要性。该文... 知识图谱问题生成任务是从给定的知识图谱中生成与其相关的问题。目前,知识图谱问题生成模型主要使用基于RNN或Transformer对知识图谱子图进行编码,但这种方式丢失了显式的图结构化信息,在解码器中忽视了局部信息对节点的重要性。该文提出用迭代信息传递图编码器来编码子图,获取子图显式的图结构化信息,此外,该文采用滑动窗口层次注意力机制学习子图局部信息对节点的重要度。从WebQuestions和PathQuestions数据集上的实验结果看,该文提出的模型比KTG模型在BLEU-4指标上分别高出2.16和15.44,证明了该模型的有效性。 展开更多
关键词 知识图谱 问题生成 图神经网络
下载PDF
Leveraging Structured Information from a Passage to Generate Questions
13
作者 Jian Xu Yu Sun +2 位作者 Jianhou Gan Mingtao Zhou Di Wu 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2023年第3期464-474,共11页
Question Generation(QG)is the task of utilizing Artificial Intelligence(AI)technology to generate questions that can be answered by a span of text within a given passage.Existing research on QG in the educational fiel... Question Generation(QG)is the task of utilizing Artificial Intelligence(AI)technology to generate questions that can be answered by a span of text within a given passage.Existing research on QG in the educational field struggles with two challenges:the mainstream QG models based on seq-to-seq fail to utilize the structured information from the passage;the other is the lack of specialized educational QG datasets.To address the challenges,a specialized QG dataset,reading comprehension dataset from examinations for QG(named RACE4QG),is reconstructed by applying a new answer tagging approach and a data-filtering strategy to the RACE dataset.Further,an end-to-end QG model,which can exploit the intra-and inter-sentence information to generate better questions,is proposed.In our model,the encoder utilizes a Gated Recurrent Units(GRU)network,which takes the concatenation of word embedding,answer tagging,and Graph Attention neTworks(GAT)embedding as input.The hidden states of the GRU are operated with a gated self-attention to obtain the final passage-answer representation,which will be fed to the decoder.Results show that our model outperforms baselines on automatic metrics and human evaluation.Consequently,the model improves the baseline by 0.44,1.32,and 1.34 on BLEU-4,ROUGE-L,and METEOR metrics,respectively,indicating the effectivity and reliability of our model.Its gap with human expectations also reflects the research potential. 展开更多
关键词 automatic question generation(QG) RACE4QG dataset Answer-Oriented GAT(AO-GAT) attention mechanism structured information
原文传递
多阶段时序和语义信息增强的问题生成模型
14
作者 周菊香 周明涛 +1 位作者 甘健侯 徐坚 《计算机工程与科学》 CSCD 北大核心 2023年第10期1847-1857,共11页
针对图到序列的问题生成模型编码器的多阶段编码以及解码过程中容易丢失段落中丰富的序列信息和语义结构信息的问题,设计了基于多阶段时序和语义信息增强的模型MS-SIE。首先,将编码器不同阶段编码的段落语义信息进行融合,输入到循环神... 针对图到序列的问题生成模型编码器的多阶段编码以及解码过程中容易丢失段落中丰富的序列信息和语义结构信息的问题,设计了基于多阶段时序和语义信息增强的模型MS-SIE。首先,将编码器不同阶段编码的段落语义信息进行融合,输入到循环神经网络进行编码;然后,在解码阶段引入迭代图神经网络,将编码后的段落信息与解码阶段隐藏在先前生成的文本问题中丰富的语义结构信息相结合;最后,利用基于注意力机制的循环神经网络生成问题。实验结果表明,提出的模型在自动评估指标和人工评价指标上均明显优于现有的序列到序列模型和图到序列模型。 展开更多
关键词 问题生成 多阶段时序融合 语义信息增强 循环神经网络 迭代图神经网络
下载PDF
基于语义特征提取与层次结构的问题生成方法
15
作者 白诗瑶 吕佳键 +2 位作者 彭涛 刘露 崔海 《吉林大学学报(理学版)》 CAS 北大核心 2023年第1期94-100,共7页
针对传统端到端模型在输入文本语义较复杂情况下生成的问题普遍存在语义不完整的情形,提出一种基于语义特征提取的文本编码器架构.首先构建双向长短时记忆网络获得基础的上下文信息,然后采用自注意力机制及双向卷积神经网络模型分别提... 针对传统端到端模型在输入文本语义较复杂情况下生成的问题普遍存在语义不完整的情形,提出一种基于语义特征提取的文本编码器架构.首先构建双向长短时记忆网络获得基础的上下文信息,然后采用自注意力机制及双向卷积神经网络模型分别提取语义的全局特征和局部特征,最后设计一种层次结构,融合特征及输入自身信息得到最终的文本表示进行问题生成.在数据集SQuAD上的实验结果表明,基于语义特征提取与层次结构进行问题生成效果显著,结果明显优于已有方法,并且语义特征提取和层次结构在任务的各评价指标上均有提升. 展开更多
关键词 问题生成 双向长短时记忆网络 卷积神经网络 自注意力机制 层次结构
下载PDF
结合问题类型及惩罚机制的问题生成 被引量:3
16
作者 武恺莉 朱朦朦 +2 位作者 朱鸿雨 张熠天 洪宇 《中文信息学报》 CSCD 北大核心 2021年第4期110-119,共10页
问题生成旨在理解输入端的语义,从而自动生成疑问句。该文主要解决目标答案可知的问题生成任务,输入为陈述句和目标答案,输出为疑问句,该疑问句的答案为给定的目标答案。为了提高问题类型的准确率,使问句的表述更确切,该文提出一种融合... 问题生成旨在理解输入端的语义,从而自动生成疑问句。该文主要解决目标答案可知的问题生成任务,输入为陈述句和目标答案,输出为疑问句,该疑问句的答案为给定的目标答案。为了提高问题类型的准确率,使问句的表述更确切,该文提出一种融合问题类型及惩罚机制的问题生成模型,首先使用预训练BERT模型对问题类型进行分类,得到对应问题类型的表示。在编码端,通过门控机制将源端陈述句与问题类型进行融合,得到具有问题类型信息的源端表示。此外,在现有工作中观测到生成的问句和目标答案存在重复词的现象。为了缓解上述问题,该文提出一种惩罚机制,即在损失函数中加入对重复词的惩罚。实验证明,该文所提方法有效提高了问题类型的准确率,并在一定程度上降低了生成重复词的情况。在SQuAD数据集上BLEU-4值达到18.52%,问题类型的准确率达到93.46%。 展开更多
关键词 问题生成 问题类型 惩罚机制
下载PDF
AI-infused Semantic Model to Enrich and Expand Programming Question Generation 被引量:2
17
作者 I-Han Hsiao Cheng-Yu Chung 《Journal of Artificial Intelligence and Technology》 2022年第2期47-54,共8页
Creating practice questions for programming learning is not easy.It requires the instructor to diligently organize heterogeneous learning resources,that is,conceptual programming concepts and procedural programming ru... Creating practice questions for programming learning is not easy.It requires the instructor to diligently organize heterogeneous learning resources,that is,conceptual programming concepts and procedural programming rules.Today’s programming question generation(PQG)is still largely relying on the demanding creation task performed by the instructors without advanced technological support.In this work,we propose a semantic PQG model that aims to help the instructor generate new programming questions and expand the assessment items.The PQG model is designed to transform conceptual and procedural programming knowledge from textbooks into a semantic network by the Local Knowledge Graph(LKG)and Abstract Syntax Tree(AST).For any given question,the model queries the established network to find related code examples and generates a set of questions by the associated LKG/AST semantic structures.We conduct analysis to compare instructor-made questions from 9 undergraduate introductory programming courses and textbook questions.The results show that the instructormade questions had much simpler complexity than the textbook ones.The disparity of topic distribution intrigued us to further research the breadth and depth of question quality and also to investigate the complexity of the questions in relation to the student performances.Finally,we report a user study results on the proposed Artificial Intelligent-infused semantic PQG model in examining the machine-generated questions’quality. 展开更多
关键词 ASSESSMENT PROGRAMMING Semantic Modeling Automatic question generation
下载PDF
问题生成研究综述 被引量:3
18
作者 吴云芳 张仰森 《中文信息学报》 CSCD 北大核心 2021年第7期1-9,共9页
问题生成是给定文本,自动生成内容通顺、语义相关的自然语言问题。问题生成可应用于教育领域的阅读理解、辅助问答系统和对话系统,因此近年来引起了研究者的广泛关注和兴趣。该文对问题生成的相关研究进行了综述。首先阐释了问题生成的... 问题生成是给定文本,自动生成内容通顺、语义相关的自然语言问题。问题生成可应用于教育领域的阅读理解、辅助问答系统和对话系统,因此近年来引起了研究者的广泛关注和兴趣。该文对问题生成的相关研究进行了综述。首先阐释了问题生成的研究意义与应用场景,继而简略概述了基于规则的问题生成方法,然后从输入文本是句子/段落、有/无答案信息等不同角度全面阐述了基于神经网络的问题生成模型。该文还介绍了问题生成的评价方法,分析讨论了现有工作的不足,并展望了未来可能的研究方向。 展开更多
关键词 问题生成 机器阅读理解 神经网络模型
下载PDF
基于义原知识和双向注意力流的问题生成模型 被引量:2
19
作者 段建勇 徐丽闪 +3 位作者 刘杰 李欣 张家铭 王昊 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第5期44-53,共10页
【目的】为解决现有模型存在的生成问题语义偏离于给定上下文文本和答案的问题,提出一种基于义原知识和双向注意力流的问题生成模型。【方法】提出两种语义增强策略:(1)通过在嵌入层融入义原外部知识的方法来捕捉比词向量更小粒度的语... 【目的】为解决现有模型存在的生成问题语义偏离于给定上下文文本和答案的问题,提出一种基于义原知识和双向注意力流的问题生成模型。【方法】提出两种语义增强策略:(1)通过在嵌入层融入义原外部知识的方法来捕捉比词向量更小粒度的语义知识,进而增强文本自身的语义特征。此外,通过余弦相似度算法得到更符合上下文文本语义的扩充义原知识库,这样做不仅可以筛除原有义原知识库中可能会导致语义嘈杂的义原,而且可以为词表中无义原标注的单词推荐符合语义的义原集合。(2)通过在编码层后融入双向注意力流的方法,增强文本与答案之间的语义表征。【结果】本模型在SQuAD1.1数据集上的Bleu_1、Bleu_2、Bleu_3、Blue_4评价指标分别达到46.70%、31.07%、22.90%、17.48%。实验证明,本文所提改进模型性能优于基线模型。【局限】当融入双向注意力流时,由于模型需要分别对段落文本及问题进行特征提取,因此训练模型时需要消耗成倍的内存和时间。【结论】义原知识和双向注意力流这两种语义增强策略可以增强问题生成模型的效果,并且使模型生成更符合人类语言习惯的更高质量的问题。 展开更多
关键词 问题生成 义原知识 余弦相似度 双向注意力流
原文传递
基于文章和近答案句信息的问题生成模型 被引量:3
20
作者 石航 刘瑞芳 +1 位作者 刘欣瑜 陈泓宇 《中文信息学报》 CSCD 北大核心 2021年第8期127-134,共8页
自动问题生成任务旨在给文章中的一段文本生成相应的自然语言的问句,该研究在问答系统和语音助手的对话系统中有重要作用,可以帮助它们启动对话和继续对话。目前的神经网络问题生成模型主要是将包含答案的句子或者整篇文章作为模型的输... 自动问题生成任务旨在给文章中的一段文本生成相应的自然语言的问句,该研究在问答系统和语音助手的对话系统中有重要作用,可以帮助它们启动对话和继续对话。目前的神经网络问题生成模型主要是将包含答案的句子或者整篇文章作为模型的输入,而这些方法存在语义表示不能很好地结合句子和文章信息的问题。因此该文提出多输入层次注意力序列到序列的问题生成网络,能更好地利用文章和答案上下文的两重信息。模型通过关注对答案更有价值的句子信息和全文更丰富的语义信息来生成高质量的问题。在公开数据集SQuAD上的问题生成对比实验表明,该方法在BLEU4值上表现优越。通过训练好的问答系统来评估问题的可回答率,明显优于基准系统。 展开更多
关键词 序列到序列 问题生成 神经网络
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部