以Web of Science数据库中论文为例,探讨国际学术期刊撤稿论文的分布和变化情况。分析该数据库截至2018年被撤稿论文的各年度数量分布、所属学科、权威期刊撤稿量、作者国籍及中国作者论文被撤稿情况。研究发现,国际被撤稿论文数量总体...以Web of Science数据库中论文为例,探讨国际学术期刊撤稿论文的分布和变化情况。分析该数据库截至2018年被撤稿论文的各年度数量分布、所属学科、权威期刊撤稿量、作者国籍及中国作者论文被撤稿情况。研究发现,国际被撤稿论文数量总体呈逐年上升趋势,生物医学领域撤稿论文数量占总数的39.57%;撤稿较多的期刊其影响因子普遍较高;中国作者论文的撤稿时滞为1.73年,短于世界平均值2.88年;中国针对学术不端行为发布的政策实施效果初显。建议期刊编辑部和学术管理部门应共同努力,采取相应措施防范撤稿事件发生。展开更多
[目的]本文对国内外已经发表的自然语言处理领域有关文本嵌入的研究进行较深入的分析和对比,详细描述文本嵌入的知识结构和发展脉络,以及针对不同领域、不同数据集的模型改进方法,讨论流行的嵌入模型,比较每个模型在文本嵌入中的优缺点...[目的]本文对国内外已经发表的自然语言处理领域有关文本嵌入的研究进行较深入的分析和对比,详细描述文本嵌入的知识结构和发展脉络,以及针对不同领域、不同数据集的模型改进方法,讨论流行的嵌入模型,比较每个模型在文本嵌入中的优缺点,同时指出文本嵌入所面临的挑战,提出可能的解决方案。[方法]检索Web of Science数据库、CNKI数据库和万方数据,获取国内外文本嵌入研究的相关文献,运用内容分析法对文献做系统梳理分析,对这些文献中利用的文本嵌入技术以及改进方案、建模思想、生成过程等方面进行对比与分析。[结果]经过去重和合并,保留内容最相关的61篇文献。文本嵌入方法可以归纳为三类:基于频率的文本嵌入、基于神经网络的文本嵌入和基于主题建模的文本嵌入。针对语料库的规模大小、多义词嵌入、通用嵌入的域适应等文本嵌入所面临的挑战,从被调查的研究文章中提出了可能的解决方案。展开更多
文摘以Web of Science数据库中论文为例,探讨国际学术期刊撤稿论文的分布和变化情况。分析该数据库截至2018年被撤稿论文的各年度数量分布、所属学科、权威期刊撤稿量、作者国籍及中国作者论文被撤稿情况。研究发现,国际被撤稿论文数量总体呈逐年上升趋势,生物医学领域撤稿论文数量占总数的39.57%;撤稿较多的期刊其影响因子普遍较高;中国作者论文的撤稿时滞为1.73年,短于世界平均值2.88年;中国针对学术不端行为发布的政策实施效果初显。建议期刊编辑部和学术管理部门应共同努力,采取相应措施防范撤稿事件发生。
文摘[目的]本文对国内外已经发表的自然语言处理领域有关文本嵌入的研究进行较深入的分析和对比,详细描述文本嵌入的知识结构和发展脉络,以及针对不同领域、不同数据集的模型改进方法,讨论流行的嵌入模型,比较每个模型在文本嵌入中的优缺点,同时指出文本嵌入所面临的挑战,提出可能的解决方案。[方法]检索Web of Science数据库、CNKI数据库和万方数据,获取国内外文本嵌入研究的相关文献,运用内容分析法对文献做系统梳理分析,对这些文献中利用的文本嵌入技术以及改进方案、建模思想、生成过程等方面进行对比与分析。[结果]经过去重和合并,保留内容最相关的61篇文献。文本嵌入方法可以归纳为三类:基于频率的文本嵌入、基于神经网络的文本嵌入和基于主题建模的文本嵌入。针对语料库的规模大小、多义词嵌入、通用嵌入的域适应等文本嵌入所面临的挑战,从被调查的研究文章中提出了可能的解决方案。