基于预训练模型的无监督剧本摘要被引量：1

Unsupervised Script Summarization Based on Pre-trained Model

下载PDF

导出

摘要剧本是一种特殊的文本结构,以人物的对话和对场景的描述信息组成文本。无监督剧本摘要是指对篇幅很长的剧本进行压缩、提取,形成能够概括剧本信息的短文本。提出了一种基于预训练模型的无监督剧本摘要方法,首先在预训练过程中通过增加对文本序列处理的预训练任务,使得预训练生成的模型能够充分考虑剧本中对话的场景描述及人物说话的情感特点,然后使用该预训练模型作为训练器计算剧本中的句间相似度,结合TextRank算法对关键句进行打分、排序,最终抽取得分最高的句子作为摘要。实验结果表明,该方法相比基准模型方法取得了更好的效果,系统性能在ROUGE评价上有显著的提高。 The script is a special text structure,which is composed of the dialogue between characters and the description of the scene.Unsupervised script summary refers to compressing and extracting a long script to form a short text that can summarize the information of the script.Therefore,this paper proposes an unsupervised script summary method based on a pre-training mo-del.By adding pre-training tasks for text sequence processing in pre-training,the generated pre-training model fully takes into account the description of the dialogue in the script and the emotional characteristics of the characters,then the model is used as a trainer to calculate the similarity between sentences and combined with the TextRank algorithm to score and sort the key sentences.Finally,the sentence with the highest score is selected as the summary.Experimental results show that the proposed method has better performance than the base model,and the performance is significantly improved in the ROUGE evaluation.

作者苏琦王红玲王中卿 SU Qi;WANG Hongling;WANG Zhongqing(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China)

机构地区苏州大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2023年第2期310-316,共7页 Computer Science

基金国家自然科学基金(61976146)。

关键词训练模型预训练任务剧本摘要无监督句间相似度对话 Pre-trained model Pre-training task Script summary Unsupervised Sentence similarity Dialogue

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献3

1张睿思,潘烨.用于角色表情动画生成的深度学习技术[J].计算机辅助设计与图形学学报,2022,34(5):675-682. 被引量：4
2张天翔.现代动画艺术中审美价值研究[J].青春岁月,2013,0(23):83-83. 被引量：3
3刘哲良,朱玮,袁梓洋.结合全卷积网络与CycleGAN的图像实例风格迁移[J].中国图象图形学报,2019(8):1283-1291. 被引量：18

引证文献1

1杨富圣,李通.科技美学视域下AIGC技术对动画创作的影响[J].现代电影技术,2023(6):50-54. 被引量：8

二级引证文献8

1靳丽娜,于小凡.《长安三万里》:中国古典诗歌的视觉探索和特效呈现[J].现代电影技术,2023(9):57-63. 被引量：4
2洪宇,何渊吟.基于AIGC赋能的影视技术与影视色彩设计研究[J].色彩,2023(9):44-46. 被引量：4
3李默尘.AIGC技术+动画对非遗文化数字经济发展的影响[J].特区经济,2024(1):145-148. 被引量：3
4胡冬梅,雷桐.AIGC:影视内容生产的变革动能[J].科技传播,2023,15(21):101-105. 被引量：4
5姜安琪.基于AIGC技术的数字三维模型制作与应用[J].信息与电脑,2024,36(4):156-158.
6谭俊,彭绍东,高洁.基于AIGC的绘画教学:潜能风险与实践探讨[J].中小学电教（综合）,2024(5):69-75.
7唐希希.AIGC发展背景下高校动画创作课程教学改革研究[J].大学（教学与教育）,2024(7):45-49. 被引量：1
8王一超.生成式AI在动画角色创作中的技术演变及创作机制研究[J].佳木斯大学学报（自然科学版）,2024,42(11):122-125.

1许文军,郑虹,郑肇谦.基于ALBERT预训练模型生成式文本摘要[J].长春工业大学学报,2022,43(6):719-725. 被引量：1
2成悦,赵康,勾智楠,高凯.基于度量学习和层级推理网络的抽取式摘要方法[J].河北科技大学学报,2022,43(6):594-601.
3Le Défi des Vignerons du Ningxia:le rouge de la réussite[J].今日中国（法文版）,2018,56(1):66-67.
4Relever le défi de la biodiversité par la ligne rouge écologique[J].今日中国（法文版）,2021,59(10):5-5.
5钟志峰,晏阳天,何佳伟,夏一帆,张龑.一种情感可控的古诗自动生成模型[J].现代电子技术,2023,46(4):154-160.
6高玮军,朱婧,赵华洋,李磊.基于TRF-IM模型的个性化酒店评论摘要生成[J].计算机工程与应用,2023,59(2):135-142. 被引量：1
7郭继峰,费禹潇,孙文博,谢培浇,张健.一种融合主题的PGN-GAN文本摘要模型[J].小型微型计算机系统,2023,44(1):199-203. 被引量：1
8关海桢,包莞晖,罗正,禤世丽(指导).基于LDA模型的旅游市场需求分析[J].华东科技,2022(12):77-79.
9邓维斌,李云波,张一明,王国胤,朱坤.融合BERT和卷积门控的生成式文本摘要方法[J].控制与决策,2023,38(1):152-160. 被引量：6
10杨忠,赵玉顺.兰州管制区通航飞行空管保障能力提升建议[J].中国民用航空,2023(1):38-39.

计算机科学

2023年第2期

浏览历史

内容加载中请稍等...

基于预训练模型的无监督剧本摘要被引量：1

同被引文献3

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于预训练模型的无监督剧本摘要 被引量：1

同被引文献3

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于预训练模型的无监督剧本摘要被引量：1