摘要
【目的】借鉴文献综合(Synthesis)的思想,利用人工智能技术构建科技文献结构化自动综合工具,以结构化的形式自动梳理文献集的研究脉络与研究骨架,揭示文献集的要点与看点。【方法】提出了一种基于语步识别的科技文献结构化自动综合工具的建设思路,即通过语步识别与研究问题、研究方法、研究进展短语抽取,自动揭示单篇文献中的关键知识内容;通过层次聚类与类簇标签生成,实现多篇文献的知识整理归纳;通过设计树形综合结构,指导结构化综合结果输出。【结果】研发了结构化自动综合工具,能够自动综合文献集内容,并按照“研究问题-研究方法-研究进展”的树形结构揭示文献集的研究脉络与骨架。【局限】由于聚类技术的限制,目前还存在聚类准确率不足、聚类簇个数难以确定等问题,影响了自动综合效果。【结论】基于语步识别技术,构建面向实际应用的结构化自动综合工具,支持文献检索、自动综合、结果循证等功能,验证了基于语步识别实现结构化自动综合思路的可行性和有效性。
[Objective]This paper utilizes AI technology to construct an automatic structured synthesis tool,which organizes the sci-tech research frameworks structurally and reveals their main points.[Methods]The new tool was developed based on move recognition.First,we identified the research questions,methodology,and progress keywords to extract the most important knowledge points from each literature.Then,we employed hierarchical clustering and cluster label generation methods to synthesize the knowledge.Third,we designed a tree structure for the synthesis outputs.[Results]The proposed tool could automatically synthesize the literature contents and reveal their framework with a“research question,methodology,and progress”tree structure.[Limitations]Insufficient clustering accuracy and difficulty determining cluster numbers reduce our model’s synthesis performance.[Conclusions]The synthesis tool based on move recognition could automatically retrieve structured literature contents.
作者
刘熠
张智雄
王宇飞
李雪思
Liu Yi;Zhang Zhixiong;Wang Yufei;Li Xuesi(National Science Library,Chinese Academy of Sciences,Beijing 10090,China;Department of Information Resources Management,School of Economic and Management,University of Chinese Academy of Sciences,Beijing 10090,China)
出处
《数据分析与知识发现》
EI
CSSCI
CSCD
北大核心
2024年第2期65-73,共9页
Data Analysis and Knowledge Discovery
基金
中国科学院特别研究助理资助项目(项目编号:E1290905)
国家科技图书文献中心(NSTL)专项(项目编号:2022XM28)的研究成果之一。
关键词
科技文献
语步识别
结构化自动综合
短语抽取
层次聚类
类簇标签生成
Scientific and Technological Literature
Move Recognition
Automatic Structured Synthesis
Phrase Extraction
Hierarchical Clustering
Label Generation