基于单向Transformer和孪生网络的多轮任务型对话技术

Multi-turn Task-oriented Dialogue Technology Based on Unidirectional Transformer and Siamese Network

下载PDF

导出

摘要循环神经网络和Transformer在多轮对话系统的建模上依赖大量的样本数据且回复准确率过低。为此,提出一种针对任务型对话系统的建模方法。引入预训练模型对句子语意和对话过程进行深度编码,对Transformer模型进行精简,仅保留编码器部分的单向Transformer,将应答部分抽象成不同的指令,采用孪生网络对指令进行相似度排序,选择相似度最高的指令生成应答。在MultiWOZ数据集上的实验结果表明,与LSTM和基于Transformer模型相比,该方法预测速度更快,在小数据集上具有更好的性能,在大数据集上也能取得与当前先进模型相当的效果。 The existing Recurrent Neural Network(RNN)and Transformer models rely on a large amount of sample data for the modeling of the multi-turn dialogue system,and the accuracy of answering is low.To address the problem,a new modeling method for the task-oriented dialogue system is proposed. Some pre-trained models are introduced for deep encoding of the sentence semantics and the dialog contents.At the same time,the Transformer model is simplified to a unidirectional transformer with only the encoder retained.On this basis,the answering part is abstracted to different commands,which are sorted based on similarity by using the siamese network.The command with the highest similarity is chosen to generate the answer.The experimental results on the MultiWOZ dataset show that compared to LSTM and Transformer-based models,the proposed method has a faster prediction speed,providing better performance on small datasets and equal performance on large datasets.

作者王涛刘超辉郑青青黄嘉曦 WANG Tao;LIU Chaohui;ZHENG Qingqing;HUANG Jiaxi(Shenzhen Immotor Technology Co.,Ltd.,Shenzhen,Guangdong 518055,China)

机构地区深圳市易马达科技有限公司

出处《计算机工程》 CAS CSCD 北大核心 2021年第7期55-58,66,共5页 Computer Engineering

基金中美绿色基金(MA009RX18)。

关键词循环神经网络多轮对话系统预训练模型 Transformer模型孪生网络 Recurrent Neural Network(RNN) multi-turn dialogue system pre-training model Transformer model siamese network

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1QIU XiPeng,SUN TianXiang,XU YiGe,SHAO YunFan,DAI Ning,HUANG XuanJing.Pre-trained models for natural language processing: A survey[J].Science China(Technological Sciences),2020,63(10):1872-1897. 被引量：146

共引文献145

1王伟,阮文翰,孟祥福.融合对抗训练的中文GPT对话模型研究[J].辽宁工程技术大学学报（自然科学版）,2023(3):378-384.
2邱凯锋,王则远,何志超,付凯利,梅童霖,关英杰,高飞,伍俊妍.人工智能技术在超说明书用药循证中的应用研究[J].中华临床医师杂志（电子版）,2023,17(12):1212-1218.
3余同瑞,金冉,韩晓臻,李家辉,郁婷.自然语言处理预训练模型的研究综述[J].计算机工程与应用,2020,56(23):12-22. 被引量：48
4Yi HAN,Linbo QIAO,Jianming ZHENG,Hefeng WU,Dongsheng LI,Xiangke LIAO.A survey of script learning[J].Frontiers of Information Technology & Electronic Engineering,2021,22(3):341-373.
5郝超,裘杭萍,孙毅,张超然.多标签文本分类研究进展[J].计算机工程与应用,2021,57(10):48-56. 被引量：25
6邱石贵,章化奥,段湘煜,张民.神经机器翻译的词级别正则化[J].厦门大学学报（自然科学版）,2021,60(4):662-669.
7陈晓玲,唐丽玉,胡颖,江锋,彭巍,冯先超.基于ALBERT模型的园林植物知识实体与关系抽取方法[J].地球信息科学学报,2021,23(7):1208-1220. 被引量：5
8王永鹏,周晓磊,马慧敏,曹吉龙,无.联合知识的融合训练模型[J].计算机系统应用,2021,30(7):50-56. 被引量：1
9杨修远,彭韬,杨亮,林鸿飞.基于知识蒸馏的自适应多领域情感分析[J].山东大学学报（工学版）,2021,51(3):15-21. 被引量：1
10陈德光,马金林,马自萍,周洁.自然语言处理预训练技术综述[J].计算机科学与探索,2021,15(8):1359-1389. 被引量：34

1曹帅.基于深度学习的文本匹配研究综述[J].现代计算机,2021,27(16):74-78. 被引量：6
2朱凯诺,马玉慧.基于百度UNIT的对话式智能导学系统的设计与实现[J].信息与电脑,2021,33(8):161-163. 被引量：1
3杨飞洪,孙海霞,李姣.一种文本相似度与BERT模型融合的手术操作术语归一化方法[J].中文信息学报,2021,35(4):44-50. 被引量：2
4王蕾,杨洪秀,孙能卓.无线网络技术的图书馆书籍智能推荐系统[J].现代电子技术,2021,44(13):85-89. 被引量：1
5贾克斌,崔腾鹤,刘鹏宇,刘畅.基于深层特征学习的高效率视频编码中帧内快速预测算法[J].电子与信息学报,2021,43(7):2023-2031. 被引量：6
6王静.大数据时代科技信息资源服务科技创新模式研究[J].明日,2021(6):0031-0031.

计算机工程

2021年第7期

浏览历史

内容加载中请稍等...

基于单向Transformer和孪生网络的多轮任务型对话技术

参考文献1

共引文献145

相关作者

相关机构

相关主题

浏览历史