【目的/意义】揭示并对比国内外数据挖掘领域研究热点主题的演化过程。【方法/过程】收集1998-2018年CNKI及Web of Science收录的数据挖掘领域核心期刊论文,通过LDA主题模型抽取研究主题,并基于主题生命周期识别热点主题,结合时间片构...【目的/意义】揭示并对比国内外数据挖掘领域研究热点主题的演化过程。【方法/过程】收集1998-2018年CNKI及Web of Science收录的数据挖掘领域核心期刊论文,通过LDA主题模型抽取研究主题,并基于主题生命周期识别热点主题,结合时间片构建主题的演化路径,从数据挖掘研究的理论维度和应用维度来对比分析国内外数据挖掘领域热点主题演化的区别与联系。【结果/结论】数据挖掘领域在理论维度上,国内的研究内容滞后于国外;在应用维度上,国内偏向于在社会科学上的应用,国外偏向于在自然科学上的应用;数据挖掘领域整体研究重心由理论研究逐渐转向应用研究,且结合大数据技术有许多新兴发展。【创新/局限】本文为可视化和比较国内外数据挖掘领域热点问题的演化过程提供了一种新的思路,局限在于还未对国内外数据挖掘领域的滞后性和影响因素进行定量分析。展开更多
[目的/意义]识别新兴研究主题并预测其发展趋势,对科技创新和科研决策具有重要意义。[方法/过程]提出基于主题模型和曲线拟合的新兴主题趋势预测方法。该方法应用LDA主题模型进行科技文献主题划分,然后将主题新颖性、增长性、影响力等...[目的/意义]识别新兴研究主题并预测其发展趋势,对科技创新和科研决策具有重要意义。[方法/过程]提出基于主题模型和曲线拟合的新兴主题趋势预测方法。该方法应用LDA主题模型进行科技文献主题划分,然后将主题新颖性、增长性、影响力等特征指标依次赋权叠加构建主题新兴指标,利用多维尺度绘制主题分布矩阵以识别和探测新兴主题。最后基于主题新兴指标时序特征进行曲线拟合,预测新兴主题未来发展趋势。[结果/结论]利用Web of Science数据库中1997—2017年燃料电池领域的94661篇文献,进行实证研究。结果表明该方法能够有效识别燃料电池领域新兴研究主题,相对于时间序列自回归预测方法,曲线拟合预测方法具有较高准确率。展开更多
文摘【目的/意义】揭示并对比国内外数据挖掘领域研究热点主题的演化过程。【方法/过程】收集1998-2018年CNKI及Web of Science收录的数据挖掘领域核心期刊论文,通过LDA主题模型抽取研究主题,并基于主题生命周期识别热点主题,结合时间片构建主题的演化路径,从数据挖掘研究的理论维度和应用维度来对比分析国内外数据挖掘领域热点主题演化的区别与联系。【结果/结论】数据挖掘领域在理论维度上,国内的研究内容滞后于国外;在应用维度上,国内偏向于在社会科学上的应用,国外偏向于在自然科学上的应用;数据挖掘领域整体研究重心由理论研究逐渐转向应用研究,且结合大数据技术有许多新兴发展。【创新/局限】本文为可视化和比较国内外数据挖掘领域热点问题的演化过程提供了一种新的思路,局限在于还未对国内外数据挖掘领域的滞后性和影响因素进行定量分析。
文摘[目的/意义]识别新兴研究主题并预测其发展趋势,对科技创新和科研决策具有重要意义。[方法/过程]提出基于主题模型和曲线拟合的新兴主题趋势预测方法。该方法应用LDA主题模型进行科技文献主题划分,然后将主题新颖性、增长性、影响力等特征指标依次赋权叠加构建主题新兴指标,利用多维尺度绘制主题分布矩阵以识别和探测新兴主题。最后基于主题新兴指标时序特征进行曲线拟合,预测新兴主题未来发展趋势。[结果/结论]利用Web of Science数据库中1997—2017年燃料电池领域的94661篇文献,进行实证研究。结果表明该方法能够有效识别燃料电池领域新兴研究主题,相对于时间序列自回归预测方法,曲线拟合预测方法具有较高准确率。