[目的/意义]探讨影响altmetrics覆盖率的因素,为ahmetrics在学术评价中的合理使用奠定基础..[方法/过程]基于Web of Science、Altmetric.com以及Mendeley,以5个学科1996—2015年间发表的所有期刊论文为分析对象,探讨学科领域、...[目的/意义]探讨影响altmetrics覆盖率的因素,为ahmetrics在学术评价中的合理使用奠定基础..[方法/过程]基于Web of Science、Altmetric.com以及Mendeley,以5个学科1996—2015年间发表的所有期刊论文为分析对象,探讨学科领域、出版年份、来源期刊、国别、语种5个因素对altmetrics覆盖率的影响。[结果/结论]不同altmetlics指标的覆盖率不同,Mendeley覆盖率最高,Twitter其次,而大多数指标覆盖率很低;在将ahmetrics应用于期刊评价时,有必要合理鉴别和排除期刊推广策略导致的高覆盖率现象;以上5个因素均会导致期刊论文的altmetrics覆盖率差异,因此在应用altmetrics时,需要考虑到被评价对象的属性特征,必要时考虑altmetrics在这些影响因素上的标准化。展开更多
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对...命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。展开更多
文摘[目的/意义]探讨影响altmetrics覆盖率的因素,为ahmetrics在学术评价中的合理使用奠定基础..[方法/过程]基于Web of Science、Altmetric.com以及Mendeley,以5个学科1996—2015年间发表的所有期刊论文为分析对象,探讨学科领域、出版年份、来源期刊、国别、语种5个因素对altmetrics覆盖率的影响。[结果/结论]不同altmetlics指标的覆盖率不同,Mendeley覆盖率最高,Twitter其次,而大多数指标覆盖率很低;在将ahmetrics应用于期刊评价时,有必要合理鉴别和排除期刊推广策略导致的高覆盖率现象;以上5个因素均会导致期刊论文的altmetrics覆盖率差异,因此在应用altmetrics时,需要考虑到被评价对象的属性特征,必要时考虑altmetrics在这些影响因素上的标准化。
文摘命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。