基于文献数据帮助技术预见研究提高其信度和效度,逐渐受到国内外预见方法学的关注。但是,传统文献计量学无法高通量的处理数据,分析时未能考虑文献的语义信息,同时,无法有效的嵌入技术专家领域知识与判断,使得适用性和有效性受到限制。...基于文献数据帮助技术预见研究提高其信度和效度,逐渐受到国内外预见方法学的关注。但是,传统文献计量学无法高通量的处理数据,分析时未能考虑文献的语义信息,同时,无法有效的嵌入技术专家领域知识与判断,使得适用性和有效性受到限制。因此,本文提出一种基于机器学习主题模型的新兴技术识别预见方法,通过对技术领域全样本的论文与专利数据的高通量融合处理,挖掘论文与专利的语义信息,从而提高技术识别的全面性与颗粒度一致性;在此基础上,将预见专家组的领域知识与判断,融入机器学习过程中,从而提高机器学习的准确度与识别新兴技术的能力,同时,使用论文与专利每年引用率作为指标,分析技术领域下细分技术的潜在新兴模式。本研究以机器人技术为例,提取Web of Science(Wo S)论文数据库和Thomson Innovation(TI)专利数据库的十余万全领域海量数据,识别出机器人领域的新兴技术簇群,并进一步甄别全新技术颠覆和跨领域技术融合驱动等两种新兴技术出现模式,为新兴技术发展轨迹预见工作提供有益的支持。展开更多
文摘基于文献数据帮助技术预见研究提高其信度和效度,逐渐受到国内外预见方法学的关注。但是,传统文献计量学无法高通量的处理数据,分析时未能考虑文献的语义信息,同时,无法有效的嵌入技术专家领域知识与判断,使得适用性和有效性受到限制。因此,本文提出一种基于机器学习主题模型的新兴技术识别预见方法,通过对技术领域全样本的论文与专利数据的高通量融合处理,挖掘论文与专利的语义信息,从而提高技术识别的全面性与颗粒度一致性;在此基础上,将预见专家组的领域知识与判断,融入机器学习过程中,从而提高机器学习的准确度与识别新兴技术的能力,同时,使用论文与专利每年引用率作为指标,分析技术领域下细分技术的潜在新兴模式。本研究以机器人技术为例,提取Web of Science(Wo S)论文数据库和Thomson Innovation(TI)专利数据库的十余万全领域海量数据,识别出机器人领域的新兴技术簇群,并进一步甄别全新技术颠覆和跨领域技术融合驱动等两种新兴技术出现模式,为新兴技术发展轨迹预见工作提供有益的支持。