期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
基于大语言模型与语义增强的文本关系抽取算法 被引量:4
1
作者 李敬灿 肖萃林 +1 位作者 覃晓婷 谢夏 《计算机工程》 CAS CSCD 北大核心 2024年第4期87-94,共8页
关系抽取是一项基础且重要的任务,旨在从非结构化文本中提取出实体之间的关系。最近研究证明,大型语言模型(LLM)和基础模型相结合可以改进许多自然语言处理(NLP)任务的性能。这些模型利用深度学习和预训练模型的语言表示能力,能够自动... 关系抽取是一项基础且重要的任务,旨在从非结构化文本中提取出实体之间的关系。最近研究证明,大型语言模型(LLM)和基础模型相结合可以改进许多自然语言处理(NLP)任务的性能。这些模型利用深度学习和预训练模型的语言表示能力,能够自动学习关系的语义特征。有效利用大模型来解决实体重叠和信息交互差等问题仍是一个挑战。针对以上问题,提出基于大语言模型的关系抽取算法。对大型语言模型Meta AI(LLa MA)进行微调训练,使其更加适应关系抽取的任务,在提取关系的基础上,使用自注意力机制增强实体对之间关联程度,增强关系和实体之间的信息共享,接着使用平均池化泛化到整个句子中。针对实体对设计一个过滤矩阵,并引入词性信息进行语义增强,根据过滤矩阵中实体对的相关性过滤掉无效的三元组。实验结果表明,该算法在纽约时报(NYT)和Web NLG公开数据集上的F1值结果分别为93.1%、90.4%。在微调之后的LLa MA模型作为编码器的情况下,所提算法在准确率和F1值指标上均优于基线模型,验证了算法的有效性。 展开更多
关键词 关系抽取 人工智能 注意力机制 大语言模型 词性
下载PDF
ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路 被引量:81
2
作者 赵朝阳 朱贵波 王金桥 《数据分析与知识发现》 CSSCI CSCD 北大核心 2023年第3期26-35,共10页
【目的】剖析ChatGPT的基础技术原理,探讨其对大语言模型发展产生的影响,以及对多模态大模型发展思路产生的影响。【方法】通过分析ChatGPT的发展过程和技术原理,探讨指令微调、数据采集与标注、基于人类反馈的强化学习等模型构建方法... 【目的】剖析ChatGPT的基础技术原理,探讨其对大语言模型发展产生的影响,以及对多模态大模型发展思路产生的影响。【方法】通过分析ChatGPT的发展过程和技术原理,探讨指令微调、数据采集与标注、基于人类反馈的强化学习等模型构建方法对大语言模型产生的影响。分析当前多模态大模型构建过程中遇到的关键科学问题,并借鉴ChatGPT的技术方案,探讨多模态大模型未来的发展发展思路。【结论】ChatGPT为预训练大模型向下游任务的发展提供了良好的参考技术路径,未来的多模态大模型构建以及下游任务实现过程中,可以充分利用高质量的指令微调等技术来显著提升多模态大模型的下游任务性能。 展开更多
关键词 语言大模型 预训练大模型 多模态预训练模型 ChatGPT
原文传递
大语言模型融合知识图谱的问答系统研究 被引量:42
3
作者 张鹤译 王鑫 +3 位作者 韩立帆 李钊 陈子睿 陈哲 《计算机科学与探索》 CSCD 北大核心 2023年第10期2377-2388,共12页
大语言模型(large language model,LLM),包括ChatGPT,在理解和响应人类指令方面表现突出,对自然语言问答影响深远。然而,由于缺少针对垂直领域的训练,LLM在垂直领域的表现并不理想。此外,由于对硬件的高要求,训练和部署LLM仍然具有一定... 大语言模型(large language model,LLM),包括ChatGPT,在理解和响应人类指令方面表现突出,对自然语言问答影响深远。然而,由于缺少针对垂直领域的训练,LLM在垂直领域的表现并不理想。此外,由于对硬件的高要求,训练和部署LLM仍然具有一定困难。为了应对这些挑战,以中医药方剂领域的应用为例,收集领域相关数据并对数据进行预处理,基于LLM和知识图谱设计了一套垂直领域的问答系统。该系统具备以下能力:(1)信息过滤,过滤出垂直领域相关的问题,并输入LLM进行回答;(2)专业问答,基于LLM和自建知识库来生成更具备专业知识的回答,相比专业数据的微调方法,该技术无需重新训练即可部署垂直领域大模型;(3)抽取转化,通过强化LLM的信息抽取能力,利用生成的自然语言回答,从中抽取出结构化知识,并和专业知识图谱匹配以进行专业验证,同时可以将结构化知识转化成易读的自然语言,实现了大模型与知识图谱的深度结合。最后展示了该系统的效果,并通过专家主观评估与选择题客观评估两个实验,从主客观两个角度验证了系统的性能。 展开更多
关键词 大语言模型(llm) 知识图谱 问答系统 垂直领域 中医药方剂
下载PDF
智能技术赋能教育评价改革 被引量:32
4
作者 吴砥 郭庆 +1 位作者 吴龙凯 程浩 《开放教育研究》 CSSCI 北大核心 2023年第4期4-10,共7页
以通用人工智能大模型为代表的智能技术与教育评价的融合,已成为数字时代教育评价改革的重大课题。本文回顾了我国教育评价改革发展历程,分析了智能技术应用于教育领域的主要阶段和特征,阐释了智能技术重塑教育评价改革的核心关注点,包... 以通用人工智能大模型为代表的智能技术与教育评价的融合,已成为数字时代教育评价改革的重大课题。本文回顾了我国教育评价改革发展历程,分析了智能技术应用于教育领域的主要阶段和特征,阐释了智能技术重塑教育评价改革的核心关注点,包括更加丰富的教育评价内容,个性化、综合性、伴随式的评价方式,多元化的教育评价主体,数据驱动的评价手段等。文章在研判评价改革未来趋势的基础上,指出智能技术自身的发展进步及其在评价中日益广泛深入的应用,将助推结果评价更加科学、过程评价更加智慧、增值评价更加便捷、综合评价更加完善。最后,文章给出智能技术赋能教育评价改革的实践路径建议,即协同推进评价改革,突破关键评价技术,试点探索新评价范式,注重技术伦理与隐私。 展开更多
关键词 人工智能 大模型技术 教育评价改革 综合评价
下载PDF
类ChatGPT大模型发展、应用和前景 被引量:21
5
作者 严昊 刘禹良 +1 位作者 金连文 白翔 《中国图象图形学报》 CSCD 北大核心 2023年第9期2749-2762,共14页
生成式人工智能技术自ChatGPT发布以来,不断突破瓶颈,吸引了资本规模投入、多领域革命和政府重点关注。本文首先分析了大模型的发展动态、应用现状和前景,然后从以下3个方面对大模型相关技术进行了简要介绍:1)概述了大模型相关构造技术... 生成式人工智能技术自ChatGPT发布以来,不断突破瓶颈,吸引了资本规模投入、多领域革命和政府重点关注。本文首先分析了大模型的发展动态、应用现状和前景,然后从以下3个方面对大模型相关技术进行了简要介绍:1)概述了大模型相关构造技术,包括构造流程、研究现状和优化技术;2)总结了3类当前主流图像—文本的大模型多模态技术;3)介绍了根据评估方式不同而划分的3类大模型评估基准。参数优化与数据集构建是大模型产品普及与技术迭代的核心问题;多模态能力是大模型重要发展方向之一;设立评估基准是比较与约束大模型的关键方法。此外,本文还讨论了现有相关技术面临的挑战与未来可能的发展方向。现阶段的大模型产品已有强大的理解能力和创造能力,在教育、医疗和金融等领域已展现出广阔的应用前景。但同时,它们也存在训练部署困难、专业知识不足和安全隐患等问题。因此,完善参数优化、优质数据集构建、多模态等技术,并建立统一、全面、便捷的评估基准,将成为大模型突破现有局限的关键。 展开更多
关键词 人工智能(AI) ChatGPT 多模态技术 自然语言处理 大模型(llm)
原文传递
大模型:基于自然交互的人机协同软件开发与演化工具带来的挑战 被引量:13
6
作者 李戈 彭鑫 +5 位作者 王千祥 谢涛 金芝 王戟 马晓星 李宣东 《软件学报》 EI CSCD 北大核心 2023年第10期4601-4606,共6页
以自然语言生成为核心的大模型技术正在人工智能领域掀起热潮,并持续向更多的领域穿透其影响力.以ChatGPT为代表的自然语言生成大模型(以下简称大模型),已经在软件工程的多项活动中展示出其通过自然交互方式给人提供一定程度帮助的能力... 以自然语言生成为核心的大模型技术正在人工智能领域掀起热潮,并持续向更多的领域穿透其影响力.以ChatGPT为代表的自然语言生成大模型(以下简称大模型),已经在软件工程的多项活动中展示出其通过自然交互方式给人提供一定程度帮助的能力和潜力,正在发展成为一种基于自然交互的人机协同软件开发与演化工具.从人机协同软件开发与演化的视角,大模型作为一种软件工具呈现出了两大特征:其一是基于自然语言的人机交互,在相当大程度上拓展了人机协同的工作空间、提高了人机协同的效率和灵活性;其二是基于已积累的软件开发和演化知识、针对给定软件开发和演化任务的预测性内容生成,可以对软件开发和演化工作提供一定程度的支持和帮助.然而,由于大模型本质是基于概率与统计原理和训练数据所形成的数学模型,具有不可解释性和内生不确定性,其生成的是缺失可信性判断的预测性内容,而人在软件开发与演化中所需要完成的是具有可信保障的决策性任务,所以大模型作为一种软件工具,在人机协同的软件开发和演化工作环境中给人提供帮助的同时,也带来了诸多的挑战.围绕如何构造对软件开发与演化更有帮助的代码大模型、如何引导大模型生成对软件开发与演化更有帮助的预测性内容、如何基于大模型生成的预测性内容开发与演化高质量的软件系统等大模型带来的挑战进行分析和阐述. 展开更多
关键词 软件开发与演化 大语言模型 人机协同
下载PDF
基于大语言模型的水工程调度知识图谱的构建与应用 被引量:7
7
作者 冯钧 畅阳红 +3 位作者 陆佳民 唐海麟 吕志鹏 邱钰淳 《计算机科学与探索》 CSCD 北大核心 2024年第6期1637-1647,共11页
随着水利事业的发展和信息化需求的增加,处理和表示海量水利数据变得复杂而繁琐。特别是调度文本数据通常以自然语言的形式存在,缺乏明确的结构和规范,并且处理和应用这些多样性的数据需要具备广泛的领域知识和专业背景。为此,提出了基... 随着水利事业的发展和信息化需求的增加,处理和表示海量水利数据变得复杂而繁琐。特别是调度文本数据通常以自然语言的形式存在,缺乏明确的结构和规范,并且处理和应用这些多样性的数据需要具备广泛的领域知识和专业背景。为此,提出了基于大语言模型的水工程调度知识图谱的构建方法。通过数据层的调度规则数据收集与预处理,再利用大语言模型挖掘和抽取数据中蕴藏的知识,完成概念层本体构建和实例层“三步法”提示策略抽取。在数据层、概念层、实例层的相互作用下,实现了规则文本的高性能抽取,完成了数据集和知识图谱的构建。实验结果表明,大语言模型抽取方法F1值达到85.5%,且通过消融实验验证了模型各模块的有效性和合理性。构建的水工程调度知识图谱整合了分散的水利规则信息,有效处理非结构化文本数据,并提供可视化查询和功能追溯功能。这有助于领域从业人员判断来水情况并选择适当的调度方案,为水利决策和智能推荐等提供了重要支持。 展开更多
关键词 知识图谱 大语言模型(llm) 本体构建 知识抽取 水工程调度
下载PDF
大语言模型的技术应用前景与风险挑战 被引量:7
8
作者 徐月梅 胡玲 +2 位作者 赵佳艺 杜宛泽 王文清 《计算机应用》 CSCD 北大核心 2024年第6期1655-1662,共8页
针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative P... 针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-Trained Transformer)等语言模型为代表,综述LLM的发展脉络、核心技术和评估体系;其次,分析LLM现存的技术局限和安全风险;最后,提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM,现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺,算力需求庞大,对数据质量和数量依赖性强,语言风格单一;存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进,从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”;从政策上实时跟进,实施有针对性的监管措施,规范应用和发展。 展开更多
关键词 大语言模型 风险挑战 技术监管 应用前景 通用人工智能
下载PDF
2023年生成式AI大模型发展热点回眸 被引量:5
9
作者 邓佳文 任福继 《科技导报》 CAS CSCD 北大核心 2024年第1期266-285,共20页
2023年,生成式大模型技术发展迅速,取得了一系列突破性的进展。回顾了2023年备受关注的大模型关键技术,包括大模型的能力涌现、多模态大语言模型的发展,以及大模型对齐和知识增强技术。介绍了大模型技术在医疗、教育等领域的垂直应用,... 2023年,生成式大模型技术发展迅速,取得了一系列突破性的进展。回顾了2023年备受关注的大模型关键技术,包括大模型的能力涌现、多模态大语言模型的发展,以及大模型对齐和知识增强技术。介绍了大模型技术在医疗、教育等领域的垂直应用,以及对AI智能体与元宇宙技术发展的促进作用。此外,从数据隐私、有偏价值观、版权争议及虚假新闻传播等方面讨论了生成式大模型技术面临的安全挑战和发展趋势。 展开更多
关键词 生成式人工智能 大模型 人工智能内容生成 AI安全
原文传递
面向大语言模型的越狱攻击综述 被引量:2
10
作者 李南 丁益东 +2 位作者 江浩宇 牛佳飞 易平 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1156-1181,共26页
近年来,大语言模型(large language model,LLM)在一系列下游任务中得到了广泛应用,并在多个领域表现出了卓越的文本理解、生成与推理能力.然而,越狱攻击正成为大语言模型的新兴威胁.越狱攻击能够绕过大语言模型的安全机制,削弱价值观对... 近年来,大语言模型(large language model,LLM)在一系列下游任务中得到了广泛应用,并在多个领域表现出了卓越的文本理解、生成与推理能力.然而,越狱攻击正成为大语言模型的新兴威胁.越狱攻击能够绕过大语言模型的安全机制,削弱价值观对齐的影响,诱使经过对齐的大语言模型产生有害输出.越狱攻击带来的滥用、劫持、泄露等问题已对基于大语言模型的对话系统与应用程序造成了严重威胁.对近年的越狱攻击研究进行了系统梳理,并基于攻击原理将其分为基于人工设计的攻击、基于模型生成的攻击与基于对抗性优化的攻击3类.详细总结了相关研究的基本原理、实施方法与研究结论,全面回顾了大语言模型越狱攻击的发展历程,为后续的研究提供了有效参考.对现有的安全措施进行了简略回顾,从内部防御与外部防御2个角度介绍了能够缓解越狱攻击并提高大语言模型生成内容安全性的相关技术,并对不同方法的利弊进行了罗列与比较.在上述工作的基础上,对大语言模型越狱攻击领域的现存问题与前沿方向进行探讨,并结合多模态、模型编辑、多智能体等方向进行研究展望. 展开更多
关键词 生成式人工智能 越狱攻击 大语言模型 自然语言处理 网络空间安全
下载PDF
大模型技术在专利审查中的应用探讨 被引量:2
11
作者 费一楠 张文 +1 位作者 邬小倩 曹竟成 《中国发明与专利》 2024年第6期4-12,共9页
当前,我们既处于专利审查提质增效的紧要关头,又迎来了全面开启知识产权强国建设的重要时期。大模型技术凭借其优秀的自然语言理解和生成能力为专利审查工作的高质量发展提供了难得的契机。本文从专利审查工作现存问题出发,明确大模型... 当前,我们既处于专利审查提质增效的紧要关头,又迎来了全面开启知识产权强国建设的重要时期。大模型技术凭借其优秀的自然语言理解和生成能力为专利审查工作的高质量发展提供了难得的契机。本文从专利审查工作现存问题出发,明确大模型技术在专利审查工作中的应用方向,初步提出将大模型技术引入专利审查工作中的方案设想,最后对引入大模型带来的风险挑战进行展望,并提出对策建议。 展开更多
关键词 大模型 专利 专利审查
下载PDF
基于大语言模型的中文科技文献标注方法 被引量:2
12
作者 杨冬菊 黄俊涛 《计算机工程》 CAS CSCD 北大核心 2024年第9期113-120,共8页
高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科... 高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科技文献的细粒度标注规范,明确标注实体类型以及标注粒度;其次,设计结构化文本标注提示模板和生成解析器,将中文科技文献标注任务设置成单阶段单轮问答过程,将标注规范和带标注文本填充至提示模板中相应的槽位以构建任务提示词;然后,将提示词注入到大语言模型中生成包含标注信息的输出文本,经由解析器解析得到结构化的标注数据;最后,利用基于大语言模型的提示学习生成中文科技文献实体标注数据集ACSL,其中包含分布在48个学科的10000篇标注文档以及72536个标注实体,并在ACSL上提出基于RoBERTa-wwm-ext的3个基准模型。实验结果表明,BERT+Span模型在长跨度的中文科技文献实体识别任务中表现最佳,F1值为0.335。上述结果可作为后续研究的测试基准。 展开更多
关键词 文本标注方法 中文科技文献 大语言模型 提示学习 信息抽取
下载PDF
分割一切模型SAM的潜力与展望:综述 被引量:1
13
作者 王淼 黄智忠 +3 位作者 何晖光 卢湖川 单洪明 张军平 《中国图象图形学报》 CSCD 北大核心 2024年第6期1479-1509,共31页
随着基于对比文本—图像对的预训练(contrastive language-image pre-training,CLIP)方法或者模型、聊天生成预训练转换器(chat generative pre-trained Transformer,ChatGPT)、生成预训练转换器-4(generative pre-trained Transformer-... 随着基于对比文本—图像对的预训练(contrastive language-image pre-training,CLIP)方法或者模型、聊天生成预训练转换器(chat generative pre-trained Transformer,ChatGPT)、生成预训练转换器-4(generative pre-trained Transformer-4,GPT-4)等基础大模型的出现,通用人工智能(artificial general intelligence, AGI)的研究得到快速发展。AGI旨在为人工智能系统赋予更强大的执行能力,使其能够自主学习、不断进化,解决各种问题和处理不同的任务,从而在多个领域得到广泛应用。这些基础模型在大规模数据集上进行训练后,能够成功应对多样的下游任务。在这一背景下,Meta公司提出的分割一切模型(segment anything model,SAM)于2023年取得重要突破,在图像分割领域获得了优异的性能,以至于被称为图像分割终结者。其原因之一是,通过SAM数据引擎方法用三阶段采集的、包含1 100万图像和超过10亿掩码的分割一切—十亿(segment anything 1 billion,SA-1B)图像分割数据集,同时保证了掩码的品质和多样性,继续导致在分割领域的突破。在SAM开源后不久,科研人员提出了一系列改进的方法和应用。为了能全面深入了解分割一切模型的发展脉络、优势与不足,本文对SAM的研究进展进行了梳理和综述。首先,从基础模型、数据引擎和数据集等多个方面简要介绍了分割一切模型的背景和核心框架。在此基础上,本文详细梳理了目前分割一切模型的改进方法,包括提高推理速度和增进预测精度两个关键方向。然后,深入探讨分割一切模型在图像处理任务、视频相关任务以及其他领域中的广泛应用。这一部分详细介绍了模型在各种任务和数据类型上的卓越性能,突出其在多个领域的泛用性和发展潜力。最后,对分割一切模型未来的发展方向和潜在应用前景进行了深入分析和讨论。 展开更多
关键词 通用人工智能(AGI) 计算机视觉 图像分割 视觉基础模型 分割一切模型(SAM) 大型语言模型(llm)
原文传递
数据稀缺性与大模型数据价值的非对称性 被引量:4
14
作者 王翔 周辉 +1 位作者 李志鹏 邢云 《信息安全研究》 CSCD 2023年第7期637-642,共6页
随着大模型产业的快速发展,出于市场竞争的需要,模型规模快速膨胀,但同时可用于训练的数据供给相对不足、未来日趋稀缺,特别是高质量数据无法满足大模型计算规模指数级增长需求.在数据制度性约束日趋严密的今天,大模型的运行机理呈现自... 随着大模型产业的快速发展,出于市场竞争的需要,模型规模快速膨胀,但同时可用于训练的数据供给相对不足、未来日趋稀缺,特别是高质量数据无法满足大模型计算规模指数级增长需求.在数据制度性约束日趋严密的今天,大模型的运行机理呈现自然垄断特征,而主要经济体之间数据治理思路的差异、国际段技术条件的差异以及算法歧视等因素都在持续加大供需双方的价值非对称性,影响大模型的数据价值分配,进而强化大模型所有者的数据垄断.我国发展大模型产业尽管面临国际段一系列技术条件限制,但是拥有数据禀赋优势,无论数量还是质量均具有很大潜力.为了更好积累数据价值收益,未来需要在自主平台、评估指标、国际规则等方面加强建设,并注重对大模型产业的政策引导. 展开更多
关键词 数据稀缺性 数据价值非对称性 数据垄断 智能生成(AIGC) 大模型(llm) 跨境数据链
下载PDF
基于大语言模型的命名实体识别 被引量:1
15
作者 叶名玮 汤嘉 +1 位作者 郭燕 吴桂兴 《计算机系统应用》 2024年第8期257-263,共7页
虽然以ChatGPT为代表的自然语言生成(NLG)大语言模型在自然语言处理中的大多数任务中取得了良好的表现,但其在序列识别任务,如命名实体识别任务中的表现暂且不如基于BERT的深度学习模型.针对这一点,本文探究性的通过将现有的中文命名实... 虽然以ChatGPT为代表的自然语言生成(NLG)大语言模型在自然语言处理中的大多数任务中取得了良好的表现,但其在序列识别任务,如命名实体识别任务中的表现暂且不如基于BERT的深度学习模型.针对这一点,本文探究性的通过将现有的中文命名实体识别问题改造成机器阅读理解问题,提出并设计了基于情境学习和模型微调的新方法,使NLG语言模型在识别命名实体达到了更好的效果,并且该方法不同于其他方法需要改变基层模型的预训练参数.同时,由于命名实体是模型生成的结果而不是对原始数据的分类,不存在边界问题.为了验证新框架在命名实体识别任务上的有效性,本文在多个中文命名实体识别数据集上进行了实验.其中,在Resume和Weibo数据集上的F1分数分别达到了96.04%和67.87%,相较于SOTA模型分别提高了0.4和2.7个百分点,从而验证了新框架能有效利用NLG语言模型在文本生成上的优势完成命名实体识别任务. 展开更多
关键词 命名实体识别 模型微调 机器阅读理解 情境学习 大语言模型
下载PDF
基于大模型的标准文献智能问答技术研究 被引量:1
16
作者 程云 吕爽 陈国祥 《信息技术与标准化》 2024年第8期38-43,共6页
为了优化标准化工作流程,提高标准化工作效率,推动标准数字化发展,介绍了大语言模型(Large Language Model,LLM)在智能问答中的演进与创新,利用大语言模型和检索增强生成(Retrieval-Augmented Generation,RAG)技术,构建了一个标准文献... 为了优化标准化工作流程,提高标准化工作效率,推动标准数字化发展,介绍了大语言模型(Large Language Model,LLM)在智能问答中的演进与创新,利用大语言模型和检索增强生成(Retrieval-Augmented Generation,RAG)技术,构建了一个标准文献智能问答解决方案,可通过对标准文档的深入理解和智能化处理,实现对复杂标准问题的准确回答,从而增强标准文献的应用价值和实际效益。 展开更多
关键词 标准数字化 大语言模型 智能问答系统 检索增强生成
下载PDF
维吾尔语机器翻译研究综述 被引量:1
17
作者 哈里旦木·阿布都克里木 侯钰涛 +2 位作者 姚登峰 阿布都克力木·阿布力孜 陈吉尚 《计算机工程》 CSCD 北大核心 2024年第1期1-16,共16页
维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语... 维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语机器翻译发展的不同阶段,研究人员针对其特点在算法和模型上不断优化与创新,取得了一定的研究成果,但缺乏系统性的综述。全面回顾维吾尔语机器翻译的相关研究,并根据方法的不同将其分为基于规则和实例的维吾尔语机器翻译、基于统计的维吾尔语机器翻译以及基于神经网络的维吾尔语机器翻译3种类型,同时对相关学术活动和语料库资源进行汇总。为进一步探索维吾尔语机器翻译的潜力,采用ChatGPT模型对维吾尔语-汉语机器翻译任务进行初步研究,实验结果表明,在Few-shot情景下,随着示例数的增加,翻译性能先升后降,在10-shot时表现最佳。此外,思维链方法在维吾尔语机器翻译任务中并未展示出更优的翻译能力。最后对维吾尔语机器翻译未来的研究方向进行了展望。 展开更多
关键词 维吾尔语 基于规则和实例的机器翻译 统计机器翻译 神经机器翻译 大语言模型
下载PDF
社交媒体数据中水灾事件求助信息提取模型 被引量:1
18
作者 孙焕良 王思懿 +1 位作者 刘俊岭 许景科 《计算机应用》 CSCD 北大核心 2024年第8期2437-2445,共9页
由于社交媒体平台上所发布的非结构化信息存在数据不一致、重要程度不同等问题,使自动准确抽取所需信息并标注受灾级别成为一个有挑战性的工作。因此,结合形式概念分析(FCA)、词共现关系和上下文语义信息构建了水灾事件知识体系。利用... 由于社交媒体平台上所发布的非结构化信息存在数据不一致、重要程度不同等问题,使自动准确抽取所需信息并标注受灾级别成为一个有挑战性的工作。因此,结合形式概念分析(FCA)、词共现关系和上下文语义信息构建了水灾事件知识体系。利用所构建的知识体系,基于TencentPretrain框架对大规模语言预训练模型(LLM)进行指令微调,构建了ChatFlowFlood信息抽取模型,可以在少量人工标记情况下,准确自动抽取被困情况、紧缺物资等信息;在信息抽取模型的基础上,通过模糊层次分析法(FAHP)和CRITIC法(CRiteria Importance Through Intercriteria Correlation)主客观结合评定求助信息的救援优先级,帮助决策者理解灾情紧急程度。实验结果表明,在中文社交媒体数据上,与ChatFlow-7B模型相比,ChatFlowFlood模型的FBERT指标提升了73.09%。 展开更多
关键词 中文社交媒体 命名实体识别 大规模语言模型 指令微调 水灾事件
下载PDF
当代自然语言处理技术驱动的城市公共空间“共建共治”初探
19
作者 李洋 李彦婕 +3 位作者 冯楚凡 赵桐 马申 李依浓 《城市与区域规划研究》 2024年第1期98-116,共19页
以大语言模型(LLM)为代表的当代自然语言处理(NLP)技术为进一步汇聚专业领域知识智慧、赋能多元主体共塑城市公共空间品质带来巨大契机。文章探索了当代NLP技术支持的公共空间“共建共治”技术框架与关键问题:首先,梳理明确城市公共空... 以大语言模型(LLM)为代表的当代自然语言处理(NLP)技术为进一步汇聚专业领域知识智慧、赋能多元主体共塑城市公共空间品质带来巨大契机。文章探索了当代NLP技术支持的公共空间“共建共治”技术框架与关键问题:首先,梳理明确城市公共空间“共建共治”机制及技术发展需求;其次,结合当代NLP技术特征归纳其在公共空间“共建共治”中的潜力;最后,提出当代NLP技术驱动的城市公共空间“共建共治”技术框架、原型案例并展望未来发展方向。 展开更多
关键词 公共空间 参与 人工智能 自然语言处理(NLP) 大语言模型(llm)
下载PDF
基于大模型的电子信息领域知识图谱自动构建与检索技术
20
作者 谢明华 《电讯技术》 北大核心 2024年第8期1228-1234,共7页
当前电子信息领域积累的越来越多宝贵经验知识对知识使用技术提出了新的挑战。知识图谱(Knowledge Graph, KG)技术和大规模预训练语言模型(Large Language Model, LLM)技术在知识使用方面都各自存在缺陷,但两种技术的优缺点能够形成互... 当前电子信息领域积累的越来越多宝贵经验知识对知识使用技术提出了新的挑战。知识图谱(Knowledge Graph, KG)技术和大规模预训练语言模型(Large Language Model, LLM)技术在知识使用方面都各自存在缺陷,但两种技术的优缺点能够形成互补。因此,基于LLM技术,提出了应用于电子信息领域的知识图谱自动构建与检索增强问答技术。首先基于LLM的语义理解能力自动构建电子信息领域知识图谱,然后构建基于知识图谱和检索增强大模型的知识问答系统。在CoNLL2003数据集和构建的电子信息领域数据集上的实验证明了所方法具有较好质量,知识问答系统具有较好的实用效果。所提方法能够更好地满足从业人员从海量文档中提取相关知识,提高知识利用效率的迫切需求,为推动大模型结合知识图谱技术在电子信息垂直领域的落地应用提供参考。 展开更多
关键词 电子信息领域 知识图谱构建 检索增强 大模型
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部