-
题名面向学术全文本的南海维权证据知识元自动识别研究
被引量:3
- 1
-
-
作者
程为
郑轩昂
郑德俊
杨海平
王燕红
-
机构
南京农业大学信息管理学院
华东师范大学数据科学与工程学院
南京大学信息管理学院
-
出处
《情报杂志》
北大核心
2023年第9期141-148,共8页
-
基金
国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链构建研究”(编号:19ZDA347)。
-
文摘
[研究目的]自动识别出潜藏在非结构化南海维权学术全文本中的证据知识元,是完整、全面、多角度地重组织证据知识元并构建证据链、厘清我国南海维权历史过程的基础。[研究方法]根据证据的内涵及知识元语义描述模型理论,提出证据知识元的概念;分析证据知识元的描述需求,以结构化的形式定义了面向南海维权学术全文本的证据知识元表示模型,并在此基础上提出证据知识元自动识别方法;以南海维权证据知识元自动识别的实证研究验证了该方法的可行性。[研究结论]证据知识元表示模型在面向南海维权学术全文本时具有适用性,结合证据知识元识别规则与深度学习方法达到较好的自动识别效果,其中BERT模型和ERNIE模型表现最佳,在南海维权证据知识元自动识别的对比实验中,微观F1值分别达到了96.75%和96.64%,明显领先其他模型,可以满足南海维权证据知识元自动识别的要求。
-
关键词
学术全文本
知识元
南海维权
证据知识元
深度学习
文本分类
-
Keywords
full academic texts
knowledge element
South China Sea rights protection
evidence knowledge element
deep learning
text classification
-
分类号
G353.1
[文化科学—情报学]
TP391.1
[自动化与计算机技术—计算机应用技术]
-