期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
论事实:美丽、谎言与ChatGPT 被引量:9
1
作者 胡泳 《新闻大学》 北大核心 2023年第4期38-58,121,共22页
事实概念的建构是一个复杂而引人入胜的过程。从16世纪开始,事实一步步变成知识的一般基础和解决争论的最终方法。这带来了新的证据原则和新的调查方式,并导致了历史学家芭芭拉•夏皮罗所说的“事实文化”:事实不断扩张自己的领域,从法... 事实概念的建构是一个复杂而引人入胜的过程。从16世纪开始,事实一步步变成知识的一般基础和解决争论的最终方法。这带来了新的证据原则和新的调查方式,并导致了历史学家芭芭拉•夏皮罗所说的“事实文化”:事实不断扩张自己的领域,从法律到科学,从历史到新闻,重塑了整个知识的格局。然而,直到互联网的普及才真正侵蚀了知识生产和传播的垂直结构,伴随着人工智能的兴起,曾经由“事实”占据的位置正在被“数据”取代。这意味着我们需要重新思考知识的性质和用途,甚至重新思考作为能够了解自己世界的生物,我们到底是谁。 展开更多
关键词 事实 知识 大型语言模型 ChatGPT
原文传递
“人机互生”时代可供性理论的契机与危机——基于“提示词”现象的考察 被引量:7
2
作者 陈秋心 邱泽奇 《苏州大学学报(哲学社会科学版)》 北大核心 2023年第5期172-182,共11页
本研究旨在从“提示词”这一具体、微小但关键的人机交互中介入手,借助可供性理论透视当下以ChatGPT为代表的人工智能技术革命的意义与影响,同时也利用最新的社会现实来测试可供性理论的稳健性,指出其发展可能与潜在危机。基于理论梳理... 本研究旨在从“提示词”这一具体、微小但关键的人机交互中介入手,借助可供性理论透视当下以ChatGPT为代表的人工智能技术革命的意义与影响,同时也利用最新的社会现实来测试可供性理论的稳健性,指出其发展可能与潜在危机。基于理论梳理、交互实践和用户、社群、社交媒体观察,研究者发现提示词是大语言模型可供性的“诱出机制”,为人们习得可供性提供场所、降低门槛,并且促成认知超越,但同时也可能带来“想象力焦虑”。进一步地,提出人机互生时代催生了一种复杂多元的可供性生成机制,其中人机互动、人与人的互动、机器之间的互动都发挥了重要作用,而可供性的社会性和想象力因此变得更加重要。此外研究者还提出了“预设的可供性(Presupposed Affordances)”概念,并指出可供性理论面临着一个深层危机:人、物二元性的模糊。 展开更多
关键词 提示词 可供性 ChatGPT 大语言模型 人机互生
下载PDF
基于大语言模型的低碳电力市场发展应用前景 被引量:2
3
作者 曹祎 张莉 +4 位作者 郭静 李楠 齐剑川 陈皓轩 赵润彤 《智慧电力》 北大核心 2024年第2期8-16,共9页
随着全球环境问题加剧,低碳电力市场备受关注。深入探讨了低碳电力市场的发展现状及其面临的挑战,并特别聚焦于基于大语言模型(LLMs)的方法在推动低碳电力市场发展中的应用潜力。通过微调、提示语设计、语义嵌入等手段,LLMs能有效适应... 随着全球环境问题加剧,低碳电力市场备受关注。深入探讨了低碳电力市场的发展现状及其面临的挑战,并特别聚焦于基于大语言模型(LLMs)的方法在推动低碳电力市场发展中的应用潜力。通过微调、提示语设计、语义嵌入等手段,LLMs能有效适应电力领域的专业化应用,尤其是在电源结构调整、电力需求预测和风险预警等领域展现出潜力。此外,基于LLMs的智能体和思维链的方法可解决复杂问题,助力低碳电力市场建设。随着LLMs技术的发展和电力行业改革的深入,这些方法将支持中国电力系统的低碳转型和实现“双碳”目标。但也需关注LLMs应用局限性,采取措施预防潜在风险,确保其在低碳市场的安全、有序发展。 展开更多
关键词 低碳电力市场 大语言模型 llms 电力系统
下载PDF
Security Vulnerability Analyses of Large Language Models (LLMs) through Extension of the Common Vulnerability Scoring System (CVSS) Framework
4
作者 Alicia Biju Vishnupriya Ramesh Vijay K. Madisetti 《Journal of Software Engineering and Applications》 2024年第5期340-358,共19页
Large Language Models (LLMs) have revolutionized Generative Artificial Intelligence (GenAI) tasks, becoming an integral part of various applications in society, including text generation, translation, summarization, a... Large Language Models (LLMs) have revolutionized Generative Artificial Intelligence (GenAI) tasks, becoming an integral part of various applications in society, including text generation, translation, summarization, and more. However, their widespread usage emphasizes the critical need to enhance their security posture to ensure the integrity and reliability of their outputs and minimize harmful effects. Prompt injections and training data poisoning attacks are two of the most prominent vulnerabilities in LLMs, which could potentially lead to unpredictable and undesirable behaviors, such as biased outputs, misinformation propagation, and even malicious content generation. The Common Vulnerability Scoring System (CVSS) framework provides a standardized approach to capturing the principal characteristics of vulnerabilities, facilitating a deeper understanding of their severity within the security and AI communities. By extending the current CVSS framework, we generate scores for these vulnerabilities such that organizations can prioritize mitigation efforts, allocate resources effectively, and implement targeted security measures to defend against potential risks. 展开更多
关键词 Common Vulnerability Scoring System (CVSS) Large Language Models (llms) DALL-E Prompt Injections Training Data Poisoning CVSS Metrics
下载PDF
Impact of Artificial Intelligence on Corporate Leadership
5
作者 Daniel Schilling Weiss Nguyen Mudassir Mohiddin Shaik 《Journal of Computer and Communications》 2024年第4期40-48,共9页
Artificial Intelligence (AI) is transforming organizational dynamics, and revolutionizing corporate leadership practices. This research paper delves into the question of how AI influences corporate leadership, examini... Artificial Intelligence (AI) is transforming organizational dynamics, and revolutionizing corporate leadership practices. This research paper delves into the question of how AI influences corporate leadership, examining both its advantages and disadvantages. Positive impacts of AI are evident in communication, feedback systems, tracking mechanisms, and decision-making processes within organizations. AI-powered communication tools, as exemplified by Slack, facilitate seamless collaboration, transcending geographical barriers. Feedback systems, like Adobe’s Performance Management System, employ AI algorithms to provide personalized development opportunities, enhancing employee growth. AI-based tracking systems optimize resource allocation, as exemplified by studies like “AI-Based Tracking Systems: Enhancing Efficiency and Accountability.” Additionally, AI-powered decision support, demonstrated during the COVID-19 pandemic, showcases the capability to navigate complex challenges and maintain resilience. However, AI adoption poses challenges in human resources, potentially leading to job displacement and necessitating upskilling efforts. Managing AI errors becomes crucial, as illustrated by instances like Amazon’s biased recruiting tool. Data privacy concerns also arise, emphasizing the need for robust security measures. The proposed solution suggests leveraging Local Machine Learning Models (LLMs) to address data privacy issues. Approaches such as federated learning, on-device learning, differential privacy, and homomorphic encryption offer promising strategies. By exploring the evolving dynamics of AI and leadership, this research advocates for responsible AI adoption and proposes LLMs as a potential solution, fostering a balanced integration of AI benefits while mitigating associated risks in corporate settings. 展开更多
关键词 Artificial Intelligence (AI) Corporate Leadership Communication Feedback Systems Tracking Mechanisms DECISION-MAKING Local Machine Learning Models (llms) Federated Learning On-Device Learning Differential Privacy Homomorphic Encryption
下载PDF
Smaller & Smarter: Score-Driven Network Chaining of Smaller Language Models
6
作者 Gunika Dhingra Siddansh Chawla +1 位作者 Vijay K. Madisetti Arshdeep Bahga 《Journal of Software Engineering and Applications》 2024年第1期23-42,共20页
With the continuous evolution and expanding applications of Large Language Models (LLMs), there has been a noticeable surge in the size of the emerging models. It is not solely the growth in model size, primarily meas... With the continuous evolution and expanding applications of Large Language Models (LLMs), there has been a noticeable surge in the size of the emerging models. It is not solely the growth in model size, primarily measured by the number of parameters, but also the subsequent escalation in computational demands, hardware and software prerequisites for training, all culminating in a substantial financial investment as well. In this paper, we present novel techniques like supervision, parallelization, and scoring functions to get better results out of chains of smaller language models, rather than relying solely on scaling up model size. Firstly, we propose an approach to quantify the performance of a Smaller Language Models (SLM) by introducing a corresponding supervisor model that incrementally corrects the encountered errors. Secondly, we propose an approach to utilize two smaller language models (in a network) performing the same task and retrieving the best relevant output from the two, ensuring peak performance for a specific task. Experimental evaluations establish the quantitative accuracy improvements on financial reasoning and arithmetic calculation tasks from utilizing techniques like supervisor models (in a network of model scenario), threshold scoring and parallel processing over a baseline study. 展开更多
关键词 Large Language Models (llms) Smaller Language Models (SLMs) FINANCE NETWORKING Supervisor Model Scoring Function
下载PDF
GUARDIAN: A Multi-Tiered Defense Architecture for Thwarting Prompt Injection Attacks on LLMs
7
作者 Parijat Rai Saumil Sood +1 位作者 Vijay K. Madisetti Arshdeep Bahga 《Journal of Software Engineering and Applications》 2024年第1期43-68,共26页
This paper introduces a novel multi-tiered defense architecture to protect language models from adversarial prompt attacks. We construct adversarial prompts using strategies like role emulation and manipulative assist... This paper introduces a novel multi-tiered defense architecture to protect language models from adversarial prompt attacks. We construct adversarial prompts using strategies like role emulation and manipulative assistance to simulate real threats. We introduce a comprehensive, multi-tiered defense framework named GUARDIAN (Guardrails for Upholding Ethics in Language Models) comprising a system prompt filter, pre-processing filter leveraging a toxic classifier and ethical prompt generator, and pre-display filter using the model itself for output screening. Extensive testing on Meta’s Llama-2 model demonstrates the capability to block 100% of attack prompts. The approach also auto-suggests safer prompt alternatives, thereby bolstering language model security. Quantitatively evaluated defense layers and an ethical substitution mechanism represent key innovations to counter sophisticated attacks. The integrated methodology not only fortifies smaller LLMs against emerging cyber threats but also guides the broader application of LLMs in a secure and ethical manner. 展开更多
关键词 Large Language Models (llms) Adversarial Attack Prompt Injection Filter Defense Artificial Intelligence Machine Learning CYBERSECURITY
下载PDF
政务大模型的技术应用路径及发展建议
8
作者 李帅峥 钱正 +1 位作者 董正浩 史翔 《信息通信技术与政策》 2024年第6期76-82,共7页
当前,大模型技术和应用进入高速发展期。大模型技术在语义理解与内容生成等方面的能力,使其在政务领域具有广阔的应用前景。从技术、产业链、应用场景的角度总结了政务大模型的发展现状,提出政务大模型要素架构、关键技术及实现路径,并... 当前,大模型技术和应用进入高速发展期。大模型技术在语义理解与内容生成等方面的能力,使其在政务领域具有广阔的应用前景。从技术、产业链、应用场景的角度总结了政务大模型的发展现状,提出政务大模型要素架构、关键技术及实现路径,并阐述限制政务大模型进一步发展的问题,最后提出针对性发展建议。 展开更多
关键词 大模型 政务大模型 数字政府
下载PDF
大模型的角色期望:基于X(推特)和微博语境的比较分析 被引量:1
9
作者 任吴炯 张洪忠 燕东祺 《新闻界》 北大核心 2024年第5期58-67,共10页
大模型是人工智能技术的一项革命性突破,在极短时间内获得了海内外广泛关注。本文分析了X和微博两个平台对大模型的角色期望,比较了英文语境和中文语境对前沿技术的认知差异。总体上,微博平台的期望倾向于实用性的产业发展与应用,而X平... 大模型是人工智能技术的一项革命性突破,在极短时间内获得了海内外广泛关注。本文分析了X和微博两个平台对大模型的角色期望,比较了英文语境和中文语境对前沿技术的认知差异。总体上,微博平台的期望倾向于实用性的产业发展与应用,而X平台的期望倾向于信息传播技术的发展。具体来看,在技术角色期望方面,X平台的英文语境更多地关注大模型在不同领域的应用场景,以及前沿技术的交叉融合;中文语境更多地关注大模型与互联网产业发展的关联。在人类角色期望方面,微博的最大人类角色期望是创意者,也就是期望大模型在艺术、设计等领域通过思维和技能创造新事物;而X的最大人类角色期望是传播者,可视之为一个信息的交流和传播的媒介。最后提出了新技术发展如何理性面对社会角色期望的两点建议。 展开更多
关键词 大模型 社会期望 技术角色 人类角色 舆论关注 技术认知
原文传递
大型语言模型(LLMs)介入教育生态对高校思政教育带来的机遇、挑战及应对策略
10
作者 廖一任 《新丝路》 2024年第9期130-132,共3页
当前,大型语言模型(? LLMs)?崭露头角,并在介入教育生态后引起广泛讨论。文章系统梳理了大型语言模型(? LLMs)?对高校思政教育带来的机遇和挑战,并在此背景下提出相应的对策,即提高学生独立思辨能力,强化学术道德和原创性观念,重新定位... 当前,大型语言模型(? LLMs)?崭露头角,并在介入教育生态后引起广泛讨论。文章系统梳理了大型语言模型(? LLMs)?对高校思政教育带来的机遇和挑战,并在此背景下提出相应的对策,即提高学生独立思辨能力,强化学术道德和原创性观念,重新定位思政教育者角色,落实全面育人、育全面人的目标,科学合理使用工具,推动教育生态良性发展。 展开更多
关键词 llms 思政教育 人才培养
下载PDF
农业垂直领域大语言模型构建流程和技术展望
11
作者 张宇芹 朱景全 +2 位作者 董薇 李富忠 郭雷风 《农业大数据学报》 2024年第3期412-423,共12页
随着互联网的普及,农业知识和信息的获取变得更加便捷,但信息大多固定且通用,无法针对具体情况提供定制化的解决方案。在此背景下,大语言模型(Large Language Models,LLMs)作为一种高效的人工智能工具,逐渐在农业领域中获得关注和应用... 随着互联网的普及,农业知识和信息的获取变得更加便捷,但信息大多固定且通用,无法针对具体情况提供定制化的解决方案。在此背景下,大语言模型(Large Language Models,LLMs)作为一种高效的人工智能工具,逐渐在农业领域中获得关注和应用。目前,LLMs技术在农业领域大模型的相关综述中只是简单描述,并没有系统地介绍LLMs构建流程。本文重点介绍了农业垂直领域大语言模型构建流程,包括数据采集和预处理、选择适当的LLMs基模型、微调训练、检索增强生成(Retrieval Augmented Generation,RAG)技术、评估过程。以及介绍了LangChain框架在农业问答系统中的构建。最后,总结出当前构建农业垂直领域大语言模型的一些挑战,包括数据安全挑战、模型遗忘挑战和模型幻觉挑战,以及提出了未来农业垂直领域大语言的发展方向,包括多模态数据融合、强时效数据更新、多语言知识表达和微调成本优化,以进一步提高农业生产的智能化和现代化水平。 展开更多
关键词 大语言模型 检索增强生成 LangChain 农业问答系统
下载PDF
大模型在智慧医院的应用研究综述
12
作者 白培发 黄宗浩 王奕 《计算机应用与软件》 北大核心 2024年第7期1-5,19,共6页
随着人工智能的快速发展,大模型正成为引领产业变革的关键力量。大模型在智慧医院中具有非常广阔的应用前景。对大模型技术进行简单介绍;通过分析现有文献和案例研究,梳理归纳目前大模型在智慧医院中的潜在应用研究,并总结大模型在医院... 随着人工智能的快速发展,大模型正成为引领产业变革的关键力量。大模型在智慧医院中具有非常广阔的应用前景。对大模型技术进行简单介绍;通过分析现有文献和案例研究,梳理归纳目前大模型在智慧医院中的潜在应用研究,并总结大模型在医院应用将面临的主要问题;从技术和应用角度对大模型在智慧医院的发展趋势进行展望,以期为未来智慧医院的创新建设提供参考。 展开更多
关键词 大模型 大语言模型 生成式人工智能 通用人工智能 智慧医院
下载PDF
基于大型语言模型微调技术的反诈骗信息识别方法研究
13
作者 彭成智 谢园园 吕光旭 《邮电设计技术》 2024年第8期53-57,共5页
针对反诈骗信息识别,对大型语言模型(LLMs)的微调技术进行了深入的实验研究。选取了3种不同规模的LLMs基础模型,并采用了LoRA和p-tuningv22种先进的微调技术,以适应特定的反诈骗信息识别任务。通过多个维度的实验评估,微调策略不仅能够... 针对反诈骗信息识别,对大型语言模型(LLMs)的微调技术进行了深入的实验研究。选取了3种不同规模的LLMs基础模型,并采用了LoRA和p-tuningv22种先进的微调技术,以适应特定的反诈骗信息识别任务。通过多个维度的实验评估,微调策略不仅能够显著提升模型在反诈骗信息识别上的性能,还能够在一定程度上保持模型的通用性。此外,探讨了LLMs在少样本情况下的学习能力,并分析了不同微调策略下的资源消耗情况。 展开更多
关键词 大型语言模型 微调技术 反诈骗信息识别 LoRA p-tuningv2 少样本学习
下载PDF
Improve Chinese Aspect Sentiment Quadruplet Prediction via Instruction Learning Based on Large Generate Models
14
作者 Zhaoliang Wu Yuewei Wu +2 位作者 Xiaoli Feng Jiajun Zou Fulian Yin 《Computers, Materials & Continua》 SCIE EI 2024年第3期3391-3412,共22页
Aspect-Based Sentiment Analysis(ABSA)is a fundamental area of research in Natural Language Processing(NLP).Within ABSA,Aspect Sentiment Quad Prediction(ASQP)aims to accurately identify sentiment quadruplets in target ... Aspect-Based Sentiment Analysis(ABSA)is a fundamental area of research in Natural Language Processing(NLP).Within ABSA,Aspect Sentiment Quad Prediction(ASQP)aims to accurately identify sentiment quadruplets in target sentences,including aspect terms,aspect categories,corresponding opinion terms,and sentiment polarity.However,most existing research has focused on English datasets.Consequently,while ASQP has seen significant progress in English,the Chinese ASQP task has remained relatively stagnant.Drawing inspiration from methods applied to English ASQP,we propose Chinese generation templates and employ prompt-based instruction learning to enhance the model’s understanding of the task,ultimately improving ASQP performance in the Chinese context.Ultimately,under the same pre-training model configuration,our approach achieved a 5.79%improvement in the F1 score compared to the previously leading method.Furthermore,when utilizing a larger model with reduced training parameters,the F1 score demonstrated an 8.14%enhancement.Additionally,we suggest a novel evaluation metric based on the characteristics of generative models,better-reflecting model generalization.Experimental results validate the effectiveness of our approach. 展开更多
关键词 ABSA ASQP llms sentiment analysis Chinese comments
下载PDF
技术扩散基础上的整体性对齐:大模型的开源与闭源之争
15
作者 高奇琦 张皓淼 《上海大学学报(社会科学版)》 北大核心 2024年第5期84-97,共14页
大模型的开闭源是目前一个重要的争论点,这种争论主要集中在效率问题、安全问题以及平等化与民主化问题上。促使大模型开源的动力主要来源于两个方面:一是开源大模型在市场上的独特优势所带来的经济利益;二是带有一定理想主义色彩的开... 大模型的开闭源是目前一个重要的争论点,这种争论主要集中在效率问题、安全问题以及平等化与民主化问题上。促使大模型开源的动力主要来源于两个方面:一是开源大模型在市场上的独特优势所带来的经济利益;二是带有一定理想主义色彩的开发者对技术平等和技术民主的追求。大模型开源亦面临一些挑战,包括经济效益挑战、社会加速挑战和社会安全挑战。后两种挑战需要人类社会进行应对,包括两种方式,一是通过适当的闭源来缓冲技术扩散的速度,二是通过对齐技术来对大模型进行人类社会规则约束。大模型对齐应当是整体性的,包括阶梯性的对齐、人与大模型的双重对齐和大模型生产全过程对齐三个基本方面,而其实现机制包括透明性机制和协商机制。 展开更多
关键词 大模型 开源 技术扩散 整体性对齐 GPT
下载PDF
提速、扩容与权力让渡——试论大语言模型的时间性及其风险
16
作者 刘煜 《编辑之友》 北大核心 2024年第3期66-71,共6页
大语言模型凭借提速和扩容的速度属性打造出与之匹配的时间节律,并以占有和瓦解连续性工作时间的方式对个体施加潜在影响。这同时也说明,大语言模型以时间的方式影响社会生产生活的过程,实质上就是大语言模型基础设施化的过程。如何防... 大语言模型凭借提速和扩容的速度属性打造出与之匹配的时间节律,并以占有和瓦解连续性工作时间的方式对个体施加潜在影响。这同时也说明,大语言模型以时间的方式影响社会生产生活的过程,实质上就是大语言模型基础设施化的过程。如何防止由此导致的人的主体性失位风险,将是日后与大语言模型互动时的要点所在。 展开更多
关键词 大语言模型 社会时间 社会加速 时间暴力 人工智能
下载PDF
面向网络安全领域的大语言模型技术综述
17
作者 张长琳 仝鑫 +1 位作者 佟晖 杨莹 《信息网络安全》 CSCD 北大核心 2024年第5期778-793,共16页
近年来,随着大语言模型技术的迅速发展,其在医疗、法律等众多领域已经显现出应用潜力,同时为网络安全领域的发展提供了新的方向。文章首先综述了大语言模型的设计原理、训练机制及核心特性等基础理论,为读者提供了必要的背景知识。然后... 近年来,随着大语言模型技术的迅速发展,其在医疗、法律等众多领域已经显现出应用潜力,同时为网络安全领域的发展提供了新的方向。文章首先综述了大语言模型的设计原理、训练机制及核心特性等基础理论,为读者提供了必要的背景知识。然后,深入探讨了大语言模型在识别和处置日益增长的网络威胁方面的作用,详细阐述了其在渗透测试、代码安全审查、社会工程学攻击以及网络安全专业知识评估方面的研究进展。最后,分析了该技术在安全性、成本和可解释性等方面的挑战并展望了未来的发展方向。 展开更多
关键词 大语言模型 ChatGPT 网络安全
下载PDF
析滑坡远程监测系统 被引量:1
18
作者 余明 丁辰 过静珺 《福建工程学院学报》 CAS 2005年第1期33-37,共5页
滑坡远程监测系统大致可分为"野外信号采集及发送系统","北斗双星系统"和"地质灾害监控管理中心"3大部分。其工作流程是:由野外信号采集系统采集野外的特征地质数据,经发送系统发送至北斗卫星,应用北斗... 滑坡远程监测系统大致可分为"野外信号采集及发送系统","北斗双星系统"和"地质灾害监控管理中心"3大部分。其工作流程是:由野外信号采集系统采集野外的特征地质数据,经发送系统发送至北斗卫星,应用北斗卫星导航系统的通信功能将数据发送至地质灾害监控管理中心,由监控中心对数据进行分析处理,并通过北斗系统向野外系统发送反馈信息及控制指令。其中"北斗卫星导航定位系统"为我国自行开发研制的第一代卫星定位系统,在监测系统中承担传输数据的任务。 展开更多
关键词 北斗卫星导航系统 滑坡远程监测系统 试验和研究
下载PDF
大语言模型研究现状与趋势 被引量:1
19
作者 王耀祖 李擎 +1 位作者 戴张杰 徐越 《工程科学学报》 EI CSCD 北大核心 2024年第8期1411-1425,共15页
在过去20年中,语言建模(Language models,LM)已经成为一种主要方法,用于语言理解和生成,同时作为自然语言处理(Natural language processing,NLP)领域下游的关键技术受到广泛关注.近年来,大语言模型(Large language models,LLMs),例如Ch... 在过去20年中,语言建模(Language models,LM)已经成为一种主要方法,用于语言理解和生成,同时作为自然语言处理(Natural language processing,NLP)领域下游的关键技术受到广泛关注.近年来,大语言模型(Large language models,LLMs),例如ChatGPT等技术,取得了显著进展,对人工智能乃至其他领域的变革和发展产生了深远的影响.鉴于LLMs迅猛的发展,本文首先对LLMs相关技术架构和模型规模等方面的演进历程进行了全面综述,总结了模型训练方法、优化技术以及评估手段.随后,分析了LLMs在教育、医疗、金融、工业等领域的应用现状,同时讨论了它们的优势和局限性.此外,还探讨了大语言模型针对社会伦理、隐私和安全等方面引发的安全性与一致性问题及技术措施.最后,展望了大语言模型未来的研究趋势,包括模型的规模与效能、多模态处理、社会影响等方面的发展方向.本文通过全面分析当前研究状况和未来走向,旨在为研究者提供关于大语言模型的深刻见解和启发,以推动该领域的进一步发展. 展开更多
关键词 大语言模型(llms) 自然语言处理 深度学习 人工智能 ChatGPT
下载PDF
以ChatGPT为代表的大语言模型打开了经济学和其他社会科学研究范式的巨大新空间 被引量:5
20
作者 程兵 《计量经济学报》 CSCD 2023年第3期589-614,共26页
自从OpenAI在2022年11月推出其生成式人工智能(AIGC,artificial intelligence generative content,也有人使用generative AI)产品——ChatGPT后,整个世界都为之颠覆.生成式人工智能主要有两个主流:大型语言模型(LLM,large language mod... 自从OpenAI在2022年11月推出其生成式人工智能(AIGC,artificial intelligence generative content,也有人使用generative AI)产品——ChatGPT后,整个世界都为之颠覆.生成式人工智能主要有两个主流:大型语言模型(LLM,large language model)和扩散模型(diffusion model),新的应用和研究每天都在加速发表.在本文中,我们首先对大型语言模型表现出来的智能水平提出了一个严肃的问题:它是否真的拥有像普通人的智能能力一样的通用人工智能(AGI,artificial general intelligence)能力?在本文中,我首先提出了一个重要的假说:作为一个封闭的系统,通过一个大型的语言模型被设计成表示和存储人类的巨大知识和智能的能力和行为,并配备了最高的价值标准,即模型必须符合人类的价值,但大型语言模型内部结构和性质并没有显示其拥有通用人工智能能力.然而,作为一个开放的系统,一旦我们输入一些隐含人类知识和智能的格式化文本,我们就会突然发现,大型语言模型的输出显示出某些人类智能和行为的特征.其中格式化的输入文本被称为提示(prompt),提示的智能程度越高,模型的智能输出就越好.换句话说,大型语言模型拥有某种以prompt提示为条件的通用人工智能AGI能力.经济学研究和其他社会科学研究如政治、历史、语言学等包括了最复杂的社会形态和人类最深刻的思想,因此本文试图通过总结其他研究者最新的研究成果来探讨大语言模型的通用人工智能是事实还是错觉?以及大语言模型其他经济功能和效用,对于这个模型的类通用人工智能的能力,我们总结这些研究学者的最新研究成果,包括大语言模型的智商水平,生成式人工智能的产业经济学,生成式人工智能下的计算社会科学研究,大语言模型的商业决策制定,经济学和其他社会科学,以及虛拟生成式人工智能经济学家的范式研究等问题. 展开更多
关键词 通用人工智能 生成式人工智能 大语言模型 计量经济
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部