期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
迎接拐点——前瞻工程教育的变革 被引量:4
1
作者 李培根 《高等工程教育研究》 北大核心 2023年第5期1-6,40,共7页
人工智能技术的发展,正以前所未有的速度改变世界。人类在很多方面或许正面临拐点,如人类的存在形式、科学发现和技术创新的方式、人才需求、教师工作形态等。如何培养应对拐点到来的人才,这就需要教育率先做好转型变革的准备。文中指出... 人工智能技术的发展,正以前所未有的速度改变世界。人类在很多方面或许正面临拐点,如人类的存在形式、科学发现和技术创新的方式、人才需求、教师工作形态等。如何培养应对拐点到来的人才,这就需要教育率先做好转型变革的准备。文中指出,工程中的易变性、不确定性、复杂性和模糊性等问题足以让我们全面地审视现在的专业教育,而依稀可见的拐点,更需要从理念到方式的变革,而非修补式的改革。本文提出若干迥异于传统工程教育的模式或方式,如从知识导向转向问题导向、学习空间和学习方式的转变等。文中还有关于工程教育的大胆预测,如培养学生具备引导AI、驾驭AI的意识流,利用虚拟现实/混合现实以及元宇宙等技术构建超越空间限制的实践学习环境等。 展开更多
关键词 人工智能 AI大模型 工程教育 工程教育变革 VUCA 意识流 思维链 问题导向
原文传递
LLaMA-LoRA Neural Prompt Engineering:A Deep Tuning Framework for Automatically Generating Chinese Text Logical Reasoning Thinking Chains
2
作者 Songlin Chen Weicheng Wang +3 位作者 Xiaoliang Chen Peng lu Zaiyan Yang Yajun Du 《Data Intelligence》 EI 2024年第2期375-408,共34页
The exption of Chinese natural language processing(NLP)has stimulated research in the broader NLP domain.However,existing large language models have limitations in comprehending and reasoning in Chinese.This paper add... The exption of Chinese natural language processing(NLP)has stimulated research in the broader NLP domain.However,existing large language models have limitations in comprehending and reasoning in Chinese.This paper addresses these limitations by enhancing Chinese language models comprehension and reasoning capabilities while minimizing resource requirements.We propose LLaMA-LoRA,a neural prompt engineering framework that builds upon the LLaMA-13B model and incorporates the Low-Rank Adaptation(LoRA)of Large Language Models technique for refinement.Chain-of-Thought(CoT)are crucial for generating intermediate reasoning chains in language models,but their effectiveness can be limited by isolated language patterns.Erroneous reasoning resulting from conventional prompts negatively impacts model performance.Automatic prompts are introduced to encourage reasoning chain generation and accurate answer inference.Training the model with an extensive corpus of Chinese CoT data enhances its comprehension and reasoning abilities.The LLaMA-LoRA model demonstrates exceptional performance across numerous Chinese language tasks,surpassing benchmark performance achieved by related language models such as GPT-3.5,Chat-GLM,and OpenAssistant,delivering accurate,comprehensive,and professional answers.The availability of our open-source model code facilitates further research in the field of Chinese text logical reasoning thinking chains. 展开更多
关键词 Chinese natural language processing Neural prompt engineering Large language models Low-Rank adaptation chain-of-thought
原文传递
工程教育需要从“知识导向”到“问题导向”的转型
3
作者 李培根 《高等工程教育研究》 北大核心 2024年第3期1-8,200,共9页
本文提出,工程教育要适应智能时代的需求,其中最为关键的可能是从“知识导向”到“问题导向”的转型。文中详细探讨了“问题导向”模式需触及的诸多“问题”,如:如何帮助学生构建问题空间?工程问题空间中的节点关联;基于问题的思维链;... 本文提出,工程教育要适应智能时代的需求,其中最为关键的可能是从“知识导向”到“问题导向”的转型。文中详细探讨了“问题导向”模式需触及的诸多“问题”,如:如何帮助学生构建问题空间?工程问题空间中的节点关联;基于问题的思维链;提问与问题提示;学生的“问题”能力检测,等等。文中提出意识流对于“问题导向”学习的重要性,重点讨论了问题意识和思维方式等与意识流的关系,人类需要利用自己的意识流去驱使AI(人工智能)、驾驭AI。本文还探讨了教师在基于“问题导向”的教育中所应有的作用。 展开更多
关键词 工程教育 工程教育转型 知识导向 问题导向 思维链 意识流
原文传递
InstructGPT在命名实体识别任务中的表现和挑战
4
作者 孙瑜 颜航 +3 位作者 邱锡鹏 王定 牟小峰 黄萱菁 《中文信息学报》 CSCD 北大核心 2024年第1期74-85,共12页
当前,关于大规模语言模型,例如,InstructGPT的研究主要聚焦在自由形式生成任务上,而忽略了在结构化抽取任务上的探索。为了让未来的工作在结构化抽取任务上有一个全面的认知,该文在零样本和少样本设定下,全面分析了InstructGPT在基础的... 当前,关于大规模语言模型,例如,InstructGPT的研究主要聚焦在自由形式生成任务上,而忽略了在结构化抽取任务上的探索。为了让未来的工作在结构化抽取任务上有一个全面的认知,该文在零样本和少样本设定下,全面分析了InstructGPT在基础的结构化抽取任务,命名实体识别上的表现。为了让结论更加可靠,该文的实验同时包含了生物医学领域和通用领域的常规和嵌套数据集。实验结果表明,InstructGPT在零样本学习上的性能只能达到微调小规模语言模型的11%~56%,增加少量样本也最多只能提升至72%。为了探究InstructGPT在命名实体识别上表现性能不佳的原因,该文通过分析模型的输出,发现接近50%的句子都存在无效生成的问题。另外,由于无效生成会同时导致“虚假错误预测”和“虚假正确预测”,解决生成无效问题并不能保证性能的提升。此外,InstructGPT抽取嵌套实体的能力还是有待提高,抽取嵌套实体的比例也偏低。因此,用InstructGPT解决命名实体识别任务,除了要保证生成的有效性,还需要更加深入地研究才能找到行之有效的方法。 展开更多
关键词 大规模语言模型 命名实体识别 上下文学习 思维链
下载PDF
大语言模型在数学推理中的研究进展
5
作者 罗焕坤 葛一烽 刘帅 《计算机工程》 CAS CSCD 北大核心 2024年第9期1-17,共17页
全面概述大语言模型(LLM)在数学推理中的研究进展、机制原理以及应用趋势,为后续开展相关研究提供参考借鉴。选取与大语言模型在数学推理领域相关的122篇文献。系统描述了数学推理问题的类型及其数据集,分别从增强模型推理能力的策略和... 全面概述大语言模型(LLM)在数学推理中的研究进展、机制原理以及应用趋势,为后续开展相关研究提供参考借鉴。选取与大语言模型在数学推理领域相关的122篇文献。系统描述了数学推理问题的类型及其数据集,分别从增强模型推理能力的策略和思维链提示方法这两方面深入解析各技术的原理、应用价值和存在问题。通过定性分析,提出未来可能的研究方向。大语言模型相关研究发展迅速,相关调研工作可能未覆盖完整。基于思维链提示技术、微调、利用编程语言等外部工具、验证机制等方法可以有效提升大语言模型的数学推理能力,特别是基于思维链提示的方法成为当前大语言模型的主要研究热点。未来研究工作可在进一步提升大语言模型的推理能力、提出解决数学推理问题的新方法等方面展开深入研究。 展开更多
关键词 大语言模型 数学推理 思维链 GPT-4 微调
下载PDF
融合思维链和低秩自适应微调的方面情感三元组抽取
6
作者 曾碧卿 陈鹏飞 姚勇涛 《计算机工程》 CAS CSCD 北大核心 2024年第7期53-62,共10页
方面情感三元组抽取(ASTE)任务是方面级情感分析的重要子任务之一,传统的监督学习方法在该任务上取得了SOTA或接近SOTA的效果。然而,随着深度神经网络的发展,生成式大型语言模型(LLM)为该任务带来了更多的可能性。目前大多数工作都是直... 方面情感三元组抽取(ASTE)任务是方面级情感分析的重要子任务之一,传统的监督学习方法在该任务上取得了SOTA或接近SOTA的效果。然而,随着深度神经网络的发展,生成式大型语言模型(LLM)为该任务带来了更多的可能性。目前大多数工作都是直接对LLM进行微调,但是忽略了LLM的幻觉现象,导致性能下降。提出一种融合思维链技术和LLM低秩自适应(Lo RA)微调LFC方法,实现生成式的ASTE新范式,以提升任务性能。在LFC中,首先基于思维链技术,通过人工构造少量推理样本,并利用LLM生成具有推理结构的增强数据集。将增强数据集用于微调Chat GLM3-6B模型的学习。在微调过程中,采用Lo RA微调技术提高在低资源环境下适配ASTE任务的效果。实验结果表明,LFC方法相比于最优的基线模型在Res14、Lap14、Res15和Res164个数据集上的F1值分别提升8.37、12.31、11.07和8.43个百分点,该方法不仅能够准确地识别三元组,而且在一定程度上优化了LLM的幻觉现象。 展开更多
关键词 方面情感三元组抽取 大型语言模型 低秩自适应微调 思维链 提示学习
下载PDF
基于三幕结构思维链和语义自洽的事件驱动故事生成方法
7
作者 黄于欣 赵源 +2 位作者 余正涛 吴磊 马九顺 《模式识别与人工智能》 EI CSCD 北大核心 2024年第7期571-583,共13页
事件驱动故事生成旨在根据有限的故事背景和事件信息生成连贯且符合事件内容的故事.然而,现有方法常因对复杂的事件关系推理不足,导致生成的故事存在语义不连贯、情节冲突等问题.为此,文中提出基于三幕结构思维链和语义自洽的事件驱动... 事件驱动故事生成旨在根据有限的故事背景和事件信息生成连贯且符合事件内容的故事.然而,现有方法常因对复杂的事件关系推理不足,导致生成的故事存在语义不连贯、情节冲突等问题.为此,文中提出基于三幕结构思维链和语义自洽的事件驱动故事生成方法,在生成故事前选择类型多样的故事示例,学习不同类型故事的写作方式.生成故事时,按照故事的开端、冲突和结局三幕结构设计思维链,引导方法合理规划故事内容,避免故事情节前后矛盾.生成故事后,引入语义自洽,模拟作家的推敲过程,从生成的多个故事中选择语义一致、连贯性和相关性较高的故事.实验表明,相比提示学习方法,文中方法的BLEU-4和BERTScore指标值有所提升,并且在人工评估中也占有一定的优势. 展开更多
关键词 事件驱动故事生成 大规模语言模型 语义自恰 三幕结构思维链
下载PDF
基于思维链的大语言模型知识蒸馏
8
作者 李荣涵 浦荣成 +2 位作者 沈佳楠 李栋栋 苗启广 《数据采集与处理》 CSCD 北大核心 2024年第3期547-558,共12页
思维链(Chain of thought,CoT)提示使大语言模型能够按照具体推理步骤处理复杂的任务,让大语言模型在常识推理、数学逻辑推理和可解释性等方面表现出更强的能力。然而,CoT方法的主要缺点在于其对庞大语言模型的依赖,这些模型通常拥有数... 思维链(Chain of thought,CoT)提示使大语言模型能够按照具体推理步骤处理复杂的任务,让大语言模型在常识推理、数学逻辑推理和可解释性等方面表现出更强的能力。然而,CoT方法的主要缺点在于其对庞大语言模型的依赖,这些模型通常拥有数百亿的参数,在大规模部署方面面临挑战。为此,本文提出一种基于思维链的大模型知识蒸馏方法,主要目标在于充分利用大型语言模型的思维推理能力,通过知识蒸馏技术,引导小模型解决复杂任务。以大型模型为教师模型,小型模型为学生模型,通过获取教师模型的推理数据来微调学生模型。通过更改数据生成方式、基于聚类的问答示例采样、示例启发式纠错以及答案的自适应生成等一系列精心设计的方法,使教师模型的生成过程更高效,生成的推理数据质量更高、数量更多,从而更好地微调学生模型,使其获得强大的推理能力,实现高效的知识蒸馏。这一研究框架旨在建立一个有效的知识传递机制,使得大模型的深度思考能够有效指导小模型,为解决复杂任务提供更为智能且高效的解决方案。通过这种方式,希望能够克服大模型部署的挑战,并促进语言模型在现实世界中的应用和进步。 展开更多
关键词 思维链 逻辑推理 知识蒸馏 微调
下载PDF
窥探机器之窍:机器心理学视角下的大模型教育应用 被引量:1
9
作者 潘香霖 褚乐阳 陈向东 《远程教育杂志》 北大核心 2023年第6期52-61,共10页
大模型所呈现的“类人”行为以及潜在风险引发了研究者广泛的兴趣,越来越多的心理学家开始深入探索其背后的原因,以更清楚地划定大模型的能力边界,而机器心理学则成为了理解大模型行为背后机制的重要工具。从探索大模型的智能特征和推... 大模型所呈现的“类人”行为以及潜在风险引发了研究者广泛的兴趣,越来越多的心理学家开始深入探索其背后的原因,以更清楚地划定大模型的能力边界,而机器心理学则成为了理解大模型行为背后机制的重要工具。从探索大模型的智能特征和推动教育研究的发展两方面分析机器心理学对于大模型教育应用的重要性,从智力测试、人格特征、心理理论的适用性和心理学实验的复现等角度分析机器心理学的研究视角,在此基础上,以思维链为例,通过对比人类的思考方式与不同思维链的形成,从机器心理学视角分析思维链的产生与发展过程,探索大模型性能优化的途径。最后,基于此探讨了机器心理学实验的争议以及未来新的发展。现有研究表明,通过深入挖掘模型的认知机制,机器心理学既有助于更准确地判断大模型在教育领域的适用性及潜在风险,也有助于更好地理解和模拟人类心理过程,为大模型教育领域的应用提供新的可能性。 展开更多
关键词 机器心理学 大语言模型 思维链 人工智能 教育应用
下载PDF
试析引入供应链管理思想实现军事物流跨越式发展 被引量:1
10
作者 陈政帆 刘永军 《物流工程与管理》 2017年第4期108-109,146,共3页
物流管理中的供应链管理是其未来的发展趋向,也是极具一体化的物理管理方式,它是一种较为新式的管理模式和理论,供应链管理的优势逐渐的被其他行业所关注,而军事物流行业就是典型的例子,将供应链管理理念应用到军事物流管理中,可以切实... 物流管理中的供应链管理是其未来的发展趋向,也是极具一体化的物理管理方式,它是一种较为新式的管理模式和理论,供应链管理的优势逐渐的被其他行业所关注,而军事物流行业就是典型的例子,将供应链管理理念应用到军事物流管理中,可以切实的保证军方的实际利益,也会极大的推动我国军事事业的发展,供应链的引入为军事物流跨越式的发展带来了新的发展契机,文中将供应链管理思想的应用作为探究的依据,分别从其实际内涵以及应用供应链的重要性进行了具体的分析。 展开更多
关键词 供应链管理思想 军事物流 跨越式发展
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部