基于人工智能大模型技术的果蔬农技知识智能问答系统被引量：8

Agricultural Technology Knowledge Intelligent Question-Answering System Based on Large Language Model

下载PDF

导出

摘要 [目的/意义]乡村振兴战略给农业技术推广提出新的要求,使农业推广知识的供给形式有待进一步创新。以果蔬农技知识服务为需求导向,基于前沿大语言模型技术,面向新型农业知识导读和知识问答等农技推广服务,构建果蔬农技知识智能问答系统。[方法]基于草莓种植户需求分析,把草莓栽培农技知识划分为不同主题,形成知识对象识别和知识问答两种大模型下游任务,结合机器自动标注和人工标注的方法构建小样本高质量训练语料;通过对比已有的4种大语言模型:Baichuan2-13B-Chat、Chat GLM2-6B、Llama-2-13B-Chat、Chat GPT的性能表现,选择性能最优的模型作为基础模型,按照“优质语料+预训练大模型+微调”的研究思路,训练具有语义分析、上下文关联和生成能力,能够适应多种下游任务的深度神经网络,构建农业知识问答大模型;采用数据优化、检索增强生成技术等多种策略缓解大模型幻觉问题;研发果蔬农技知识智能问答系统,生成高精度、无歧义的农业知识答案,同时支持用户多轮问答。[结果和讨论]以精准率和召回率为命名实体识别任务的性能表现指标,参与测评的国内主流模型在微调后不同知识主题下的平均精准率均超过85%,平均召回率表现各异,其中知识实体类型的数量、标注语料数量等因素都会影响大模型性能;以幻觉率和语义相似度为知识问答任务的性能表现指标,数据优化、采用检索增强生成技术等策略以10%~40%的幅度有效降低大模型幻觉率,并有效提高大模型的语义相似度。[结论]在农业领域的命名实体识别和知识问答任务中,预训练大模型Chat GLM的表现性能最优。针对预训练大模型下游任务的微调和基于检索增强生成(Retrieval-Augmented Generation,RAG)技术的模型优化可以缓解大模型幻觉问题,显著提升大模型性能。大模型技术具有创新农技知识服务模式、 [Objective]The rural revitalization strategy presents novel requisites for the extension of agricultural technology.However,the conventional method encounters the issue of a contradiction between supply and demand.Therefore,there is a need for further innovation in the supply form of agricultural knowledge.Recent advancements in artificial intelligence technologies,such as deep learning and large-scale neural networks,particularly the advent of large language models(LLMs),render anthropomorphic and intelligent agricultural technology extension feasible.With the agricultural technology knowledge service of fruit and vegetable as the demand orientation,the intelligent agricultural technology question answering system was built in this research based on LLM,providing agricultural technology extension services,including guidance on new agricultural knowledge and question-and-answer sessions.This facilitates farmers in accessing high-quality agricultural knowledge at their convenience.[Methods]Through an analysis of the demands of strawberry farmers,the agricultural technology knowledge related to strawberry cultivation was categorized into six themes:basic production knowledge,variety screening,interplanting knowledge,pest diagnosis and control,disease diagnosis and control,and drug damage diagnosis and control.Considering the current situation of agricultural technology,two primary tasks were formulated:named entity recognition and question answering related to agricultural knowledge.A training corpus comprising entity type annotations and question-answer pairs was constructed using a combination of automatic machine annotation and manual annotation,ensuring a small yet high-quality sample.After comparing four existing Large Language Models(Baichuan2-13B-Chat,ChatGLM2-6B,Llama 2-13B-Chat,and ChatGPT),the model exhibiting the best performance was chosen as the base LLM to develop the intelligent question-answering system for agricultural technology knowledge.Utilizing a highquality corpus,pre-training of a Large Lang

作者王婷王娜崔运鹏刘娟 WANG Ting;WANG Na;CUI Yunpeng;LIU Juan(Agricultural Information Institute,Chinese Academy of Agricultural Sciences,Beijing 100081,China;Key Laborato‐ry of Big Agri-data,Ministry of agriculture and rural areas,Beijing 100081,China;Unit 96962,Beijing 102206,China)

机构地区中国农业科学院农业信息研究所农业农村部农业大数据重点实验室 [

出处《智慧农业（中英文）》 CSCD 2023年第4期105-116,共12页 Smart Agriculture

基金北京市数字农业创新团队项目(BAIC10-2023) 中国农业科学院基本科研业务费项目(JBYW-AII-2023-31) 国家重点研发计划项目(2022YFF0711902)。

关键词大模型生成式预训练变换器农技知识智能问答命名实体识别 LLM generative pre-trained transformer agricultural technology knowledge intelligent question answering name entity identity

分类号 TP399 [自动化与计算机技术—计算机应用技术] S126 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献3

1李秋生,郑凯欣,刘小春.新时代基层农技推广体系改革创新实践探索、制约因素及深化路径[J].世界农业,2022(2):80-89. 被引量：16
2刘娜.浅析我国农业推广的现状及策略[J].河北农业,2023(10):27-28. 被引量：3
3李冬梅,罗斯斯,张小平,许福.命名实体识别方法研究综述[J].计算机科学与探索,2022,16(9):1954-1968. 被引量：18

二级参考文献42

1李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：55
2李艳军.公益性农技推广的市场化营运:必要性与路径选择[J].农业技术经济,2004(5):42-45. 被引量：13
3胡瑞法,孙顶强,董晓霞.农技推广人员的下乡推广行为及其影响因素分析[J].中国农村经济,2004(11):29-35. 被引量：63
4俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：160
5李丽双,黄德根,陈春荣,杨元生.基于支持向量机的中文文本中地名识别[J].大连理工大学学报,2007,47(3):433-438. 被引量：16
6陈霄,刘慧,陈玉泉.基于支持向量机方法的中文组织机构名的识别[J].计算机应用研究,2008,25(2):362-364. 被引量：20
7张小衡,王玲玲.中文机构名称的识别与分析[J].中文信息学报,1997,11(4):21-32. 被引量：84
8张玥杰,徐智婷,薛向阳.融合多特征的最大熵汉语命名实体识别模型[J].计算机研究与发展,2008,45(6):1004-1010. 被引量：33
9冯元勇,孙乐,张大鲲,李文波.基于小规模尾字特征的中文命名实体识别研究[J].电子学报,2008,36(9):1833-1838. 被引量：26
10黄季焜,胡瑞法,智华勇.基层农业技术推广体系30年发展与改革:政策评估和建议[J].农业技术经济,2009(1):4-11. 被引量：178

共引文献34

1韩雪雅.琼中县基层农技推广体系建设现状与思考[J].基层农技推广,2023(10):1-3. 被引量：2
2梁雪,夏文月,龚亚军.长丰县基层农业技术推广队伍建设现状及对策建议[J].南方农业,2022,16(13):18-20.
3孙明.浅析如何做好新时期基层农技推广工作[J].江西农业,2022(18):107-108. 被引量：1
4侯霞.如何创新推广法提高农技推广人员积极性[J].农村实用技术,2022(9):10-11.
5张龙豪,邬雯,朱宵月.面向心血管疾病的实体识别算法研究[J].福建电脑,2022,38(12):1-7.
6邵峰,胡云,刘安乐,岳芳.修文县猕猴桃果园高效综合利用制约因素分析及对策[J].农技服务,2022,39(12):91-93. 被引量：4
7张贝富,李好中.辉县市基层农技推广体系建设实践与思考[J].中国农技推广,2022,38(11):7-9. 被引量：1
8杨崇洛,生龙,魏忠诚,王巍.新冠文本实体关系抽取及数据集构建方法研究[J].计算机工程与应用,2023,59(8):97-104. 被引量：1
9赵秋倩.技术推广引领乡村振兴:模式构建、协同效应与进路反思——以农林院校专家驻村建站为例[J].安徽乡村振兴研究,2023(1):43-51. 被引量：1
10李萍.农业重大技术协同推广约束因素及其深化对策研究[J].山西农经,2023(7):148-150.

同被引文献46

1胡志强,潘鑫瑜,文思捷,李心雨,鲍劲松.结合多模态知识图谱与大语言模型的风机装配工艺问答系统[J].机械设计,2023,40(S02):20-26. 被引量：9
2刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600. 被引量：993
3韩文霆,李广,苑梦婵,张立元,师志强.基于无人机遥感技术的玉米种植信息提取方法研究[J].农业机械学报,2017,48(1):139-147. 被引量：59
4漆桂林,高桓,吴天星.知识图谱研究进展[J].情报工程,2017,3(1):4-25. 被引量：237
5Jihong YAN,Chengyu WANG,Wenliang CHENG,Ming GAO,Aoying ZHOU.A retrospective of knowledge graphs[J].Frontiers of Computer Science,2018,12(1):55-74. 被引量：34
6帅爱华.浅谈人工智能与计算机技术在农业现代化中的应用[J].数码世界,2018,0(4):551-551. 被引量：12
7李雪.一种基于Neo4j图数据库的模糊查询研究与实现[J].计算机技术与发展,2018,28(11):16-21. 被引量：21
8杜保佳,张晶,王宗明,毛德华,张淼,吴炳方.应用Sentinel-2A NDVI时间序列和面向对象决策树方法的农作物分类[J].地球信息科学学报,2019,21(5):740-751. 被引量：55
9吴赛赛,周爱莲,谢能付,梁晓贺,汪汇涓,李小雨,陈桂鹏.基于深度学习的作物病虫害可视化知识图谱构建[J].农业工程学报,2020,36(24):177-185. 被引量：43
10陈诗扬,刘佳.基于GF-6时序数据的农作物识别深度学习算法评估[J].农业工程学报,2021,37(15):161-168. 被引量：13

引证文献8

1郭旺,杨雨森,吴华瑞,朱华吉,缪祎晟,顾静秋.农业大模型:关键技术、应用分析与发展方向[J].智慧农业（中英文）,2024,6(2):1-13. 被引量：4
2石致远,张佳蕾,孔志伟,伏洪兵,徐海,王淑营,闫富乾,王立闻,凌乐.结合知识图谱与大语言模型的风电装备智能问答系统[J].东方电气评论,2024,38(3):77-84.
3王家,龙冬梅.基于大语言模型的智能问答系统在高校中的设计与应用[J].移动信息,2024,46(6):288-290.
4黄芳,宋涛,周虹.大模型在农业场景中的应用初探[J].山东农业工程学院学报,2024,41(8):31-38.
5张宇芹,朱景全,董薇,李富忠,郭雷风.农业垂直领域大语言模型构建流程和技术展望[J].农业大数据学报,2024,6(3):412-423.
6吴祥美.基于知识图谱和大语言模型的高校智能问答系统研究[J].信息与电脑,2024,36(16):190-193.
7吴华瑞,李晓锁.大模型在设施蔬菜智能化生产中的应用[J].蔬菜,2024(11):1-8.
8赵泽行,吴晓鹏,王怡馨,闫小丽,黄玉祥,高筱钧.基于知识图谱的农作物病虫害问答系统研究[J].智能化农业装备学报（中英文）,2024,5(4):39-50.

二级引证文献4

1张宇芹,朱景全,董薇,李富忠,郭雷风.农业垂直领域大语言模型构建流程和技术展望[J].农业大数据学报,2024,6(3):412-423.
2镇帅,林远山,盛亦凡,洪胜呈,王文良,陈启俊,杨志庆,李智军.基于双目视觉的海参体积测量方法[J].农业工程学报,2024,40(21):165-174.
3王海军.矿山行业大模型建设路径探索与应用展望[J].煤炭科学技术,2024,52(11):45-59.
4翟肇裕,张梓涵,徐焕良,王海清,陈曦,杨陈敏.YOLO算法在动植物表型研究中应用综述[J].农业机械学报,2024,55(11):1-20.

1石鑫珏,高玉艳.GPT技术下的职业教育变革与展望[J].卫生职业教育,2024,42(5):11-14.
2樊燕姝.中职计算机教学中培养学生自主学习能力的策略[J].中国科技期刊数据库科研,2024(1):0125-0128.
3周亮.我国0~3岁婴幼儿普惠性托育服务的结构性矛盾与政策建议——基于湖南省的统计数据与调查分析[J].学前教育研究,2023(12):51-60. 被引量：14
4王凤梅.语文阅读教学的文本变革——基于PISA阅读素养测评文本的分析[J].中学生作文指导,2023(28):106-109.
5李萍.大单元视域下小学数学课堂类型的有效研究[J].山西教育（教学版）,2023(8):23-24.
6蒋希娜,刘佳,蒋莹莹,侍俊,姚曳.知识分类视角下儿童科普游戏的叙事设计与效果验证[J].包装工程,2023,44(22):338-347. 被引量：4
7王艺璇.基于项目式教学法的OpenCV机器视觉实践教学[J].电脑知识与技术,2023,19(29):169-171. 被引量：3
8王金宝.农业技术创新对全面实施乡村振兴战略的作用探讨[J].当代农机,2024(1):50-50. 被引量：3
9高天志,冯辉,陆迁.数字农技推广服务促进了农户绿色生产技术选择吗——基于黄河流域3省微观调查数据[J].农业技术经济,2023(9):23-38. 被引量：23
10张辉蓉,王静.“双减”背景下小学跨学科作业的重要价值与设计程序[J].教育与教学研究,2023,37(12):40-50. 被引量：6

智慧农业（中英文）

2023年第4期

浏览历史

内容加载中请稍等...

基于人工智能大模型技术的果蔬农技知识智能问答系统被引量：8

参考文献3

二级参考文献42

共引文献34

同被引文献46

引证文献8

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于人工智能大模型技术的果蔬农技知识智能问答系统 被引量：8

参考文献3

二级参考文献42

共引文献34

同被引文献46

引证文献8

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于人工智能大模型技术的果蔬农技知识智能问答系统被引量：8