期刊文献+

基于多源信息融合的学位论文自动分类标引 被引量:1

Automatic Classification and Indexing of Dissertations Based on MultisourceInformation Fusion
下载PDF
导出
摘要 [目的/意义]学位论文是图书馆的特色馆藏文献,实现学位论文的自动分类标引对智慧图书馆建设具有积极意义。[方法/过程]首先基于BERT分别获取题名和摘要的词向量表示,然后将二者进行加权代数和计算得到融合向量,最后将其输入到基于Pytorch框架构建的Softmax经典分类器进行学位论文的自动分类标引实践探讨。[局限]在数据信息源和学科内容的多样性方面尚需进一步加强。[结果/结论]模型分类F1值达到了79.55%,优于基于单一信息的题名或摘要的分类效果,能较好满足实际应用要求。 [Objective/Significance]Dissertation is the distinguishing collection of the library,and it is of positive significance to realize the automatic classification and indexing of dissertations for the construction of a Smart Library.[Methods/Processes]Firstly,based on BERT,the word vector representations of the title and abstract are obtained,and then the weighted algebraic sum of them is calculated to obtain the fusion vector.Finally,it is inputted into the Softmax classic classifier constructed based on the Python framework for practical exploration of automatic classification and indexing of dissertations.[Limitations]Further exploration is needed in diversity of data information sources and subject content.[Results/Conclusions]The results show that the F1 value of this model reaches 79.55%,which is better than that of title or abstract based on single information,and can fairly meet the requirements of practical application.
作者 谢庆恒 XIE Qingheng(National Library of China,Beijing 100081,China)
机构地区 国家图书馆
出处 《情报工程》 2023年第3期70-80,共11页 Technology Intelligence Engineering
基金 中国图书馆学会青年项目“智慧图书馆中学位论文自动分类标引研究”(2022LSCKYXM-ZZ-QN003)。
关键词 学位论文 自动分类 信息融合 BERT Dissertation automatic classification information fusion BERT
  • 相关文献

参考文献16

二级参考文献134

共引文献277

同被引文献11

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部