期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
科技文献研究问题句识别方法研究 被引量:3
1
作者 李雪思 张智雄 +1 位作者 刘熠 王宇飞 《图书情报工作》 北大核心 2023年第9期132-140,共9页
[目的/意义]科技文献是记录科学问题提出和求解过程的重要载体,其中的研究问题句对于揭示科学问题具体内容、把握文章的研究主题具有重要作用。自动识别科技文献研究问题句是科技文本挖掘中一个重要的任务。[方法/过程]针对研究问题句... [目的/意义]科技文献是记录科学问题提出和求解过程的重要载体,其中的研究问题句对于揭示科学问题具体内容、把握文章的研究主题具有重要作用。自动识别科技文献研究问题句是科技文本挖掘中一个重要的任务。[方法/过程]针对研究问题句自动识别,首先提出一种基于迭代的半自动标注策略,结合模型预判的置信度进行人工校对,对研究问题句数据进行标注。在此基础上,采用BERT-CNN的架构设计句子分类模型,该模型引入BERT生成文本向量,并使用CNN提取文本特征,然后通过实验与基准模型进行对比验证了模型的有效性。[结果/结论]基于提出的标注策略构建了大规模规范可用的数据集,经过人工检验准确率达到95%;并在此基础上设计了基于BERT-CNN架构的识别模型,在研究问题句识别任务中F1值达到94.8%。本文的研究为科技文献研究问题的挖掘与分析提供了高质量的数据支持和有效的模型方法。 展开更多
关键词 研究问题句 自动识别 预训练语言模型 深度学习 文本挖掘
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部