-
题名AI就绪的科技情报数据资源建设模式研究
- 1
-
-
作者
钱力
刘志博
胡懋地
常志军
-
机构
中国科学院文献情报中心
中国科学院大学经济与管理学院信息资源管理系
国家新闻出版署学术期刊新型出版与知识服务重点实验室
-
出处
《农业图书情报学报》
2024年第3期32-45,共14页
-
基金
国家重点研发计划项目“科技文献内容深度挖掘及智能分析关键技术和软件”(2022YFF0711902)
国家社科基金重大项目“大数据驱动的科技文献语义评价体系研究”(21&ZD329)。
-
文摘
[目的/意义]AI就绪建设是连接当前先进AI技术与应用场景之间发展间隔的重要举措,本研究旨在探讨和设计科技情报领域的AI就绪的科技情报数据资源建设方法,为情报领域的AI就绪建设提供参考。[方法/过程]本研究基于国内外各界AI就绪发展现状的调研结果,对AI就绪建设进行了初步定义,并从含义范畴、建设角度、建设对象、建设原则、控制维度和模式类型六大方面对科技情报领域的AI就绪建设模式进行系统地探讨和设计。[结果/结论]当前全球AI发展迅速,科技情报领域作为科学研究与先进技术应用的前沿观察与战略指导性学科,应当建立AI就绪的科技情报数据资源体系。研究提出了AI就绪的科技情报数据资源建设的总模式,并结合现有建设实践探讨并呈现科技情报数据资源AI就绪化建设的具体实践路径。
-
关键词
AI就绪
科技情报
数据资源建设
科技文献大模型
GPT-4o
-
Keywords
AI-ready
scientific and technological information
data resource construction
LLMs for scientific and technological literature
GPT-4o
-
分类号
G25
[文化科学—图书馆学]
TP271
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于大语言模型的问答技术研究进展综述
- 2
-
-
作者
文森
钱力
胡懋地
常志军
-
机构
中国科学院文献情报中心
中国科学院大学经济与管理学院信息资源管理系
国家新闻出版署学术期刊新型出版与知识服务重点实验室
-
出处
《数据分析与知识发现》
EI
CSCD
北大核心
2024年第6期16-29,共14页
-
基金
国家重点研发计划(项目编号:2022YFF0711902)
国家社科基金重大项目(项目编号:21&ZD329)的研究成果之一。
-
文摘
【目的】全面回顾和概述基于大语言模型的问答技术发展现状、机制原理以及应用趋势。【文献范围】选取与基于大语言模型的问答技术相关的73篇文献。【方法】系统梳理大语言模型的发展现状、参数高效微调策略,分别从面向简单问题的检索增强生成问答推理以及面向复杂问题的提示工程问题推理两方面,深入解析各技术的原理机制、应用价值与存在问题。通过定性分析,全面概述基于大语言模型的问答技术研究进展,并提出未来研究方向。【结果】开源预训练大语言模型不断涌现,高效微调策略可显著提升模型垂直领域适配性。借助文本嵌入与近似最近邻检索技术,检索增强生成技术可有效提升问答可解释性与可信度。借助精心构造的提示工程,可大幅拓展大语言模型的复杂问题推理能力。【局限】大语言模型相关研究发展迅速,调研工作未全面覆盖。【结论】基于大语言模型的问答技术在语义表示、复杂推理等多个方面均取得显著进展,融合外部知识的检索增强生成技术与提示工程技术是当前大语言模型领域的主要研究热点,未来研究工作可在生成内容可控、可信等方面展开深入探索。
-
关键词
大语言模型
问答技术
向量检索
提示工程
-
Keywords
Large Language Models
Q&A Technology
Vector Retrieval
Prompt Engineering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
G350
[自动化与计算机技术—计算机科学与技术]
-