期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
科学数据引用识别方法研究 被引量:1
1
作者 周佳茵 钱庆 +1 位作者 唐明坤 吴思竹 《数据分析与知识发现》 CSCD 北大核心 2023年第6期38-49,共12页
【目的】分析现有数据引用实践中的引用特征,归纳数据引用识别方法,总结数据引用识别的研究现状和未来发展方向。【方法】将现有数据引用识别方法归为基于规则识别、有监督机器学习算法和半监督机器学习算法三类,并对各方法的原理、特... 【目的】分析现有数据引用实践中的引用特征,归纳数据引用识别方法,总结数据引用识别的研究现状和未来发展方向。【方法】将现有数据引用识别方法归为基于规则识别、有监督机器学习算法和半监督机器学习算法三类,并对各方法的原理、特点、现存问题、性能效果、适用范围等方面进行概括分析。【结果】目前相关技术集中在有监督机器学习算法,结合数据引用行为识别和数据引用元素抽取的识别方法是未来的研究方向。【局限】主要从整体上归纳数据引用特征以及现有的数据引用识别算法,未深入阐述具体算法的技术细节。【结论】目前数据引用识别研究仍存在领域局限、方法单一、未充分考虑数据引用特征等问题,有待进一步优化。 展开更多
关键词 科学数据 数据引用 数据共享 引用识别
原文传递
基于特征知识元的专利语义引用识别方法研究——以量子计算领域为例 被引量:1
2
作者 唐晓波 吴海婷 吴佳琳 《情报理论与实践》 北大核心 2023年第10期86-95,共10页
[目的/意义]专利引文分析是专利分析研究的重要内容。传统专利引文分析仅分析专利文献中明确标示的物理引用专利数据,不能够准确真实反映专利之间的引用关系,难以准确揭示专利之间的技术相似度。专利语义引用识别有利于准确真实揭示专... [目的/意义]专利引文分析是专利分析研究的重要内容。传统专利引文分析仅分析专利文献中明确标示的物理引用专利数据,不能够准确真实反映专利之间的引用关系,难以准确揭示专利之间的技术相似度。专利语义引用识别有利于准确真实揭示专利间的潜在语义联系,为专利的继承与创新评价提供参考,有助于专利授权前的专利审核和专利授权后的专利评价。[方法/过程]首先,基于规则和句法分析抽取了专利的特征知识元;其次,利用Sentence-BERT和Word2Vec对专利特征知识元及专利标题摘要文本进行向量化表示;再次,根据余弦相似度计算专利的特征相似度和整体相似度,结合专利申请日期的先后顺序得到专利的语义引用专利集;最后,采用量子计算领域专利数据进行了实验研究。[结果/结论]该专利语义引用识别方法能够实现语义引用专利的有效识别,有利于评价专利的技术新颖性、创造性和实用性,为专利审核和专利价值评估工作提供支持。 展开更多
关键词 语义引用识别 特征知识元 语义相似度 Sentence-BERT Word2Vec
原文传递
基于特征字符串动态引用频率的库引用识别
3
作者 蔡建章 魏强 史建忠 《计算机工程与应用》 CSCD 2014年第18期109-112,151,共5页
提出基于特征字符串动态引用频率的程序胎记,分析了其应对编译优化、压缩混淆的能力,设计了其提取算法;通过对库引用问题的分析,提出了其相似性函数,通过实例验证了上述动态程序胎记和相似性函数在分析库引用问题上的有效性。
关键词 程序胎记 引用识别 相似性函数 动态二进制插桩
下载PDF
基于特征融合的术语型引用对象自动识别方法研究 被引量:8
4
作者 马娜 张智雄 吴朋民 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第1期89-98,共10页
【目的】设计特征融合和伪标签降噪策略,探索科技论文术语型引用对象自动识别方法。【方法】将术语型引用对象识别转换为序列标注问题,在BiLSTM-CNN-CRF输入层融合术语型引用对象的语言学和启发式两大类特征,增强引用对象的特征表示,设... 【目的】设计特征融合和伪标签降噪策略,探索科技论文术语型引用对象自动识别方法。【方法】将术语型引用对象识别转换为序列标注问题,在BiLSTM-CNN-CRF输入层融合术语型引用对象的语言学和启发式两大类特征,增强引用对象的特征表示,设计伪标签学习降噪机制,采用半监督学习方法探究不同特征组合对识别效果的影响。【结果】本方法在术语型引用对象识别任务中最优F1值达到0.6018,比BERT模型实验结果提升8%。【局限】实验数据仅涉及计算机领域,在其他领域的可移植性有待考证。【结论】基于特征融合的深度学习方法在术语型引用对象的识别中有较好性能,伪标签学习方法解决了引用对象标注数据不足的问题,两者结合有效地探索了术语型引用对象自动化识别方法。 展开更多
关键词 引用对象识别 特征融合 伪标签学习 BiLSTM-CNN-CRF
原文传递
无监督引用文本自动识别与分析 被引量:5
5
作者 金贤日 欧石燕 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第1期66-77,共12页
【目的】探索施引文献中引用文本自动识别方法,并比较不同类型引用句在内容上的差别。【方法】提出一种无监督引用文本识别方法,通过比较候选句与施引文献和被引文献的文本相似度确定隐性引用句。为了精确计算文本相似度,提出向量空间... 【目的】探索施引文献中引用文本自动识别方法,并比较不同类型引用句在内容上的差别。【方法】提出一种无监督引用文本识别方法,通过比较候选句与施引文献和被引文献的文本相似度确定隐性引用句。为了精确计算文本相似度,提出向量空间模型与词嵌入模型相结合的两种文档向量模型。【结果】分别对两篇高被引论文约200篇施引文献中的隐性引用句进行了识别,本文方法的F值均达到92%以上。通过对显性引用句和隐性引用句的内容进行比较,发现两者在引用功能和情感上有明显区别:表达研究背景和技术基础的隐性引用句比例要高于显性引用句,而表达研究基础和研究比较的隐性引用句比例要低于显性引用句;45.3%的显性引用句为正面引用,而78.8%的隐性引用句为中性引用。【局限】仅对句子层面的引用文本进行识别,在短语层面的引用文本识别还有待于进一步探索。【结论】在识别引用文本时有必要识别隐性引用句,本文提出的引用文本识别方法性能较高。 展开更多
关键词 引用文本识别 隐性引用 引用内容分析
原文传递
科技论文引用对象研究综述 被引量:3
6
作者 马娜 张智雄 于改红 《图书情报工作》 CSSCI 北大核心 2019年第23期139-145,共7页
[目的/意义]为更好地提升基于内容的引文分析效果,对国内外引用对象相关研究进行调研总结,为引用内容分析研究提供借鉴。[方法/过程]通过调研国内外引用对象相关研究,梳理引用对象的概念定义、分类体系、应用领域和自动化识别等方面研... [目的/意义]为更好地提升基于内容的引文分析效果,对国内外引用对象相关研究进行调研总结,为引用内容分析研究提供借鉴。[方法/过程]通过调研国内外引用对象相关研究,梳理引用对象的概念定义、分类体系、应用领域和自动化识别等方面研究进展,总结当前引用对象研究不足并提出未来发展方向。[结果/结论]引用对象从语义层面评价文献学术研究的贡献和利用价值,为引文分析方法增加了重要维度。引用对象研究需要从理论、技术和应用三个方向进行深化:理论上,加强多维度引用对象特征的研究和分析;技术上,探索基于大规模语料的自动化识别方法;应用上,尝试基于引用对象的科研评价服务。 展开更多
关键词 引用对象 引用对象识别 引用内容分析 科研评价
原文传递
基于深度学习的Linux内核引用计数字段识别方法 被引量:1
7
作者 谈心 杨悉瑜 +1 位作者 曹家俊 张源 《软件学报》 EI CSCD 北大核心 2022年第6期2030-2046,共17页
引用计数机制是现代软件中一种常见的内存管理技术.引用计数错误往往会导致内存泄露、释放后使用(useafterfree)等严重的安全问题.现有致力于提高引用计数安全性的工作都依赖于对引用计数的字段进行识别.然而,由于类似于Linux等软件系... 引用计数机制是现代软件中一种常见的内存管理技术.引用计数错误往往会导致内存泄露、释放后使用(useafterfree)等严重的安全问题.现有致力于提高引用计数安全性的工作都依赖于对引用计数的字段进行识别.然而,由于类似于Linux等软件系统的代码十分复杂,在代码中识别出引用计数字段是一项十分困难的工作.传统的基于代码模式匹配的引用计数字段识别方法一方面存在需要专家经验总结规则,人工开销大的问题;另一方面存在总结的模式无法覆盖所有情况,召回率较低等局限.针对这些问题,发现与字段有关的代码行为以及字段的名称可以用来表征这个字段的特征,帮助识别引用计数字段.基于这两个层面的特征,设计了一种基于多模态深度学习的引用计数字段识别方法,并面向Linux内核实现原型系统.测试数据表明:该原型系统的精确率、召回率分别为96.98%和93.54%,而传统的基于代码模式匹配的方法没有识别出任何引用计数字段.此外,在Linux内核上发现61个引用计数字段使用不安全的数据类型,并对其中21个向Linux内核社区提交数据类型转换补丁以提高引用计数字段的安全性,其中6个已经被合并到Linux内核代码主分支. 展开更多
关键词 引用计数识别 静态程序分析 多模态深度学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部