【目的/意义】揭示并对比国内外数据挖掘领域研究热点主题的演化过程。【方法/过程】收集1998-2018年CNKI及Web of Science收录的数据挖掘领域核心期刊论文,通过LDA主题模型抽取研究主题,并基于主题生命周期识别热点主题,结合时间片构...【目的/意义】揭示并对比国内外数据挖掘领域研究热点主题的演化过程。【方法/过程】收集1998-2018年CNKI及Web of Science收录的数据挖掘领域核心期刊论文,通过LDA主题模型抽取研究主题,并基于主题生命周期识别热点主题,结合时间片构建主题的演化路径,从数据挖掘研究的理论维度和应用维度来对比分析国内外数据挖掘领域热点主题演化的区别与联系。【结果/结论】数据挖掘领域在理论维度上,国内的研究内容滞后于国外;在应用维度上,国内偏向于在社会科学上的应用,国外偏向于在自然科学上的应用;数据挖掘领域整体研究重心由理论研究逐渐转向应用研究,且结合大数据技术有许多新兴发展。【创新/局限】本文为可视化和比较国内外数据挖掘领域热点问题的演化过程提供了一种新的思路,局限在于还未对国内外数据挖掘领域的滞后性和影响因素进行定量分析。展开更多
[目的/意义]识别新兴研究主题并预测其发展趋势,对科技创新和科研决策具有重要意义。[方法/过程]提出基于主题模型和曲线拟合的新兴主题趋势预测方法。该方法应用LDA主题模型进行科技文献主题划分,然后将主题新颖性、增长性、影响力等...[目的/意义]识别新兴研究主题并预测其发展趋势,对科技创新和科研决策具有重要意义。[方法/过程]提出基于主题模型和曲线拟合的新兴主题趋势预测方法。该方法应用LDA主题模型进行科技文献主题划分,然后将主题新颖性、增长性、影响力等特征指标依次赋权叠加构建主题新兴指标,利用多维尺度绘制主题分布矩阵以识别和探测新兴主题。最后基于主题新兴指标时序特征进行曲线拟合,预测新兴主题未来发展趋势。[结果/结论]利用Web of Science数据库中1997—2017年燃料电池领域的94661篇文献,进行实证研究。结果表明该方法能够有效识别燃料电池领域新兴研究主题,相对于时间序列自回归预测方法,曲线拟合预测方法具有较高准确率。展开更多
[研究目的]人工智能前沿技术正在快速融入医疗。识别“人工智能+医疗”新兴技术,有助于跟踪技术最新发展动态,促进科技成果的转化应用和产业化,具有较高的理论借鉴价值。[研究方法]采用Web of Science论文数据库和Derwent Innovation专...[研究目的]人工智能前沿技术正在快速融入医疗。识别“人工智能+医疗”新兴技术,有助于跟踪技术最新发展动态,促进科技成果的转化应用和产业化,具有较高的理论借鉴价值。[研究方法]采用Web of Science论文数据库和Derwent Innovation专利数据库,通过高频关键词共词聚类分析,对比科技论文和专利的研究技术主题,识别技术主题。再基于论文专利摘要特征提取法(TF-IDF),采用主题建模算法(LDA)和专家咨询法,提取其语义关键词及其相关的高频词组,识别语义热点主题;最后,找到基于高频关键词和语义关键词双重分析的技术领域关键核心技术。引入论文专利引用率,识别关键核心技术可能的新兴模式,结合专家意见,判定该领域的新兴技术。[研究结论]以医疗机器人作为实证研究对象,成功识别出医疗机器人新兴技术,并将识别结果进行有效性验证。展开更多
文摘【目的/意义】揭示并对比国内外数据挖掘领域研究热点主题的演化过程。【方法/过程】收集1998-2018年CNKI及Web of Science收录的数据挖掘领域核心期刊论文,通过LDA主题模型抽取研究主题,并基于主题生命周期识别热点主题,结合时间片构建主题的演化路径,从数据挖掘研究的理论维度和应用维度来对比分析国内外数据挖掘领域热点主题演化的区别与联系。【结果/结论】数据挖掘领域在理论维度上,国内的研究内容滞后于国外;在应用维度上,国内偏向于在社会科学上的应用,国外偏向于在自然科学上的应用;数据挖掘领域整体研究重心由理论研究逐渐转向应用研究,且结合大数据技术有许多新兴发展。【创新/局限】本文为可视化和比较国内外数据挖掘领域热点问题的演化过程提供了一种新的思路,局限在于还未对国内外数据挖掘领域的滞后性和影响因素进行定量分析。
文摘[目的/意义]识别新兴研究主题并预测其发展趋势,对科技创新和科研决策具有重要意义。[方法/过程]提出基于主题模型和曲线拟合的新兴主题趋势预测方法。该方法应用LDA主题模型进行科技文献主题划分,然后将主题新颖性、增长性、影响力等特征指标依次赋权叠加构建主题新兴指标,利用多维尺度绘制主题分布矩阵以识别和探测新兴主题。最后基于主题新兴指标时序特征进行曲线拟合,预测新兴主题未来发展趋势。[结果/结论]利用Web of Science数据库中1997—2017年燃料电池领域的94661篇文献,进行实证研究。结果表明该方法能够有效识别燃料电池领域新兴研究主题,相对于时间序列自回归预测方法,曲线拟合预测方法具有较高准确率。
文摘[研究目的]人工智能前沿技术正在快速融入医疗。识别“人工智能+医疗”新兴技术,有助于跟踪技术最新发展动态,促进科技成果的转化应用和产业化,具有较高的理论借鉴价值。[研究方法]采用Web of Science论文数据库和Derwent Innovation专利数据库,通过高频关键词共词聚类分析,对比科技论文和专利的研究技术主题,识别技术主题。再基于论文专利摘要特征提取法(TF-IDF),采用主题建模算法(LDA)和专家咨询法,提取其语义关键词及其相关的高频词组,识别语义热点主题;最后,找到基于高频关键词和语义关键词双重分析的技术领域关键核心技术。引入论文专利引用率,识别关键核心技术可能的新兴模式,结合专家意见,判定该领域的新兴技术。[研究结论]以医疗机器人作为实证研究对象,成功识别出医疗机器人新兴技术,并将识别结果进行有效性验证。