大语言模型微调技术的研究综述

Comprehensive Review of Large Language Model Fine-Tuning

下载PDF

导出

摘要大型语言模型的崛起是深度学习领域的全新里程碑,而微调技术在优化模型性能方面的起到了关键作用。对大型语言模型微调技术进行了全面的综述,回顾了语言模型的统计语言模型、神经网络语言模型、预训练语言模型和大语言模型四个阶段的发展历程和微调技术的基本概念,从经典参数微调、高效参数微调、提示微调和强化学习微调方法四大部分,探讨总结了各微调技术的原理与发展,并进行了一定的对比分析。最后,总结了当前微调技术的研究状况与发展重点,强调了该领域的潜在研究价值,并展望了未来的发展方向。 The rise of large-scale language models signifies a new milestone in the field of deep learning,with fine-tuning techniques playing a crucial role in optimizing model performance.This paper provides a comprehensive overview of fine tuning techniques for large-scale language models.It reviews the development stages of language models,including statis-tical language models,neural network language models,pre-trained language models,and large language models.The basic concepts of fine-tuning are explored,covering classic fine-tuning,efficient parameter fine-tuning,prompt tuning,and reinforcement learning fine-tuning.The paper delves into the principles and development of each fine-tuning tech-nique,offering a comparative analysis across these four major categories.In conclusion,the paper summarizes the current state of research on fine-tuning techniques and underscores the potential research value in this domain,providing insights into future directions of development.

作者张钦彤王昱超王鹤羲王俊鑫陈海 ZHANG Qintong;WANG Yuchao;WANG Hexi;WANG Junxin;CHEN Hai(School of Arts and Sciences,Beijing Normal University at Zhuhai,Zhuhai,Guangdong 519087,China)

机构地区北京师范大学珠海校区文理学院

出处《计算机工程与应用》 CSCD 北大核心 2024年第17期17-33,共17页 Computer Engineering and Applications

基金广东省教育科学规划课题(2022GXJK47) 认知智能全国重点实验室智能教育开放课题(iED2023-005)。

关键词大语言模型微调方法预训练模型自然语言处理 large language model fine-tuning methods pre-trained models natural language processing

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1QIU XiPeng,SUN TianXiang,XU YiGe,SHAO YunFan,DAI Ning,HUANG XuanJing.Pre-trained models for natural language processing: A survey[J].Science China(Technological Sciences),2020,63(10):1872-1897. 被引量：151
2林令德,刘纳,王正安.Adapter与Prompt Tuning微调方法研究综述[J].计算机工程与应用,2023,59(2):12-21. 被引量：2

二级参考文献1

1QIU XiPeng,SUN TianXiang,XU YiGe,SHAO YunFan,DAI Ning,HUANG XuanJing.Pre-trained models for natural language processing: A survey[J].Science China(Technological Sciences),2020,63(10):1872-1897. 被引量：151

共引文献151

1王伟,阮文翰,孟祥福.融合对抗训练的中文GPT对话模型研究[J].辽宁工程技术大学学报（自然科学版）,2023(3):378-384.
2邱凯锋,王则远,何志超,付凯利,梅童霖,关英杰,高飞,伍俊妍.人工智能技术在超说明书用药循证中的应用研究[J].中华临床医师杂志（电子版）,2023,17(12):1212-1218.
3余同瑞,金冉,韩晓臻,李家辉,郁婷.自然语言处理预训练模型的研究综述[J].计算机工程与应用,2020,56(23):12-22. 被引量：48
4Yi HAN,Linbo QIAO,Jianming ZHENG,Hefeng WU,Dongsheng LI,Xiangke LIAO.A survey of script learning[J].Frontiers of Information Technology & Electronic Engineering,2021,22(3):341-373.
5郝超,裘杭萍,孙毅,张超然.多标签文本分类研究进展[J].计算机工程与应用,2021,57(10):48-56. 被引量：25
6邱石贵,章化奥,段湘煜,张民.神经机器翻译的词级别正则化[J].厦门大学学报（自然科学版）,2021,60(4):662-669.
7王涛,刘超辉,郑青青,黄嘉曦.基于单向Transformer和孪生网络的多轮任务型对话技术[J].计算机工程,2021,47(7):55-58.
8陈晓玲,唐丽玉,胡颖,江锋,彭巍,冯先超.基于ALBERT模型的园林植物知识实体与关系抽取方法[J].地球信息科学学报,2021,23(7):1208-1220. 被引量：6
9王永鹏,周晓磊,马慧敏,曹吉龙,无.联合知识的融合训练模型[J].计算机系统应用,2021,30(7):50-56. 被引量：1
10杨修远,彭韬,杨亮,林鸿飞.基于知识蒸馏的自适应多领域情感分析[J].山东大学学报（工学版）,2021,51(3):15-21. 被引量：1

1携手同行比亚迪第500万辆新能源汽车下线[J].汽车之友,2023(9):88-91.
2潘晓辉.物联网中智能传感器的实践应用[J].光源与照明,2023(10):154-156. 被引量：1
3比亚迪达成第500万辆新能源汽车下线[J].车主之友,2023(5):113-113.
4比亚迪第500万辆新能源汽车下线全球首家达成这一里程碑[J].磁性元件与电源,2023(9):94-94.
5温昕.20年王传福证明了一件事[J].智能网联汽车,2023(5):12-14.
6NavVis推出新一代可穿戴式移动扫描系统VLX3[J].机械制造,2023,61(7):61-61.
7第500万辆新能源汽车下线比亚迪携手同行打造世界级汽车品牌[J].产品可靠性报告,2023(8):33-33.
8Chaos.TUDOR 开启制表新时代[J].钟表,2023(4):80-83.
9王昀,胡珉,塔娜,孙海涛,郭毅峰,周武爱,郭昱,张皖哲,冯建华.大语言模型及其在政务领域的应用[J].清华大学学报（自然科学版）,2024,64(4):649-658. 被引量：3
10宗学军,隋一凡,王国刚,宁博伟,何戡,连莲,孙逸菲.基于生成对抗网络的工控协议模糊测试研究[J].网络安全与数据治理,2024,43(7):13-20.

计算机工程与应用

2024年第17期

浏览历史

内容加载中请稍等...

大语言模型微调技术的研究综述

参考文献2

二级参考文献1

共引文献151

相关作者

相关机构

相关主题

浏览历史