期刊文献+
共找到301篇文章
< 1 2 16 >
每页显示 20 50 100
ChatGPT对教育的挑战(笔谈) 被引量:108
1
作者 钟秉林 尚俊杰 +4 位作者 王建华 韩云波 刘进 邹红军 王争录 《重庆高教研究》 北大核心 2023年第3期3-25,共23页
识变与应变:ChatGPT热潮下的高校教育教学改革作为OpenAI公司开发的人工智能工具,ChatGPT(Chat Generative Pretrained Transformer,即预训练生成模型,简称ChatGPT)使用一种名为“Transformer”的人工神经网络,通过海量文本数据的预训练... 识变与应变:ChatGPT热潮下的高校教育教学改革作为OpenAI公司开发的人工智能工具,ChatGPT(Chat Generative Pretrained Transformer,即预训练生成模型,简称ChatGPT)使用一种名为“Transformer”的人工神经网络,通过海量文本数据的预训练,具备了强大的自然语言理解和生成能力,可以理解和回答各种形式的语言输入,是目前最先进的对话系统之一。 展开更多
关键词 自然语言理解 人工智能 人工神经网络 GPT 本数 高校教育教学改革 生成能力 CHAT
下载PDF
电力文本数据挖掘现状及挑战 被引量:33
2
作者 王慧芳 曹靖 罗麟 《浙江电力》 2019年第3期1-7,共7页
文本数据是电力大数据的重要组成部分,对其进行有效挖掘是智能电网深入、全面发展的需要。在目前已有研究成果的基础上,对电力领域文本数据挖掘的现状及挑战进行了深入剖析。首先分析了文本挖掘技术的发展过程及存在难题;接着重点分析... 文本数据是电力大数据的重要组成部分,对其进行有效挖掘是智能电网深入、全面发展的需要。在目前已有研究成果的基础上,对电力领域文本数据挖掘的现状及挑战进行了深入剖析。首先分析了文本挖掘技术的发展过程及存在难题;接着重点分析了电力文本数据挖掘的关键技术及其研究现状,包括文本预处理技术、文本表示方法以及数据挖掘方法;然后以电力设备缺陷文本为对象,介绍了文本挖掘技术在电力领域的应用,包括缺陷文本质量的提升与保证、缺陷文本严重程度自动分类、缺陷发生部件及程度的自动提取、缺陷文本检索、基于缺陷文本的电力设备健康状态评价等,可为其他类型电力文本的挖掘提供参考;最后,探讨了电力文本挖掘面临的挑战以及未来发展方向。 展开更多
关键词 电力大数 本数 挖掘 自然语言处理 电力设备 缺陷
下载PDF
文本数据的数据挖掘算法 被引量:12
3
作者 陈玉泉 朱锡钧 陆汝占 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期936-938,共3页
针对目前大量存在的文本数据 ,以已有的结构化数据挖掘技术为基础 ,提出了非结构化数据的知识发现方法——树形分层数据库方法 .对文本数据进行分析 ,将非结构化数据准结构化 ,存放入树形分层数据库中 ,利用已有的数据库技术以及树形分... 针对目前大量存在的文本数据 ,以已有的结构化数据挖掘技术为基础 ,提出了非结构化数据的知识发现方法——树形分层数据库方法 .对文本数据进行分析 ,将非结构化数据准结构化 ,存放入树形分层数据库中 ,利用已有的数据库技术以及树形分层数据库特有的一些操作 ,实现在知识发现过程中对数据的抽取与控制 。 展开更多
关键词 挖掘 树形分层数 本数 知识发现
下载PDF
基于深度学习的文本分类综述 被引量:18
4
作者 贾澎涛 孙炜 《计算机与现代化》 2021年第7期29-37,共9页
随着互联网的不断发展,网络上的文本数据日益增多,如果能对这些数据进行有效分类,那么更有利于从中挖掘出有价值的信息,因此文本数据的管理和整合显得十分重要。文本分类是自然语言处理任务中的一项基础性工作,主要应用于舆情检测及新... 随着互联网的不断发展,网络上的文本数据日益增多,如果能对这些数据进行有效分类,那么更有利于从中挖掘出有价值的信息,因此文本数据的管理和整合显得十分重要。文本分类是自然语言处理任务中的一项基础性工作,主要应用于舆情检测及新闻文本分类等领域,目的是对文本资源进行整理和归类。基于深度学习的文本分类,在对文本数据处理中,表现出较好的分类效果。本文对用于文本分类的深度学习算法进行详细阐述,按照深度学习的不同算法进行分类,并分析各种算法的特点,最后对深度学习算法在文本分类领域的未来研究方向进行总结。 展开更多
关键词 本数 本分类 自然语言 深度学习
下载PDF
信息可视化在信息管理中的新进展 被引量:17
5
作者 周宁 《现代图书情报技术》 CSSCI 北大核心 2003年第4期4-4,7,共2页
信息可视化技术是现代信息管理技术的新成果之一。科学数据的可视化起步较早 ,文本数据的可视化也发展很快。为促使人们加速开发和利用可视化技术 ,把信息管理推向了一个新阶段 。
关键词 信息可视化 信息管理 科学数 本数 可视化技术
下载PDF
量化文本分析法在国内外工商管理领域的应用对比与评述 被引量:14
6
作者 宋铁波 陈玉娇 朱子君 《管理学报》 CSSCI 北大核心 2021年第4期624-632,共9页
基于1980~2019年的国外281篇和国内73篇相关文献,使用编码方法,对量化文本分析法在工商管理领域的应用总体情况、应用主题分布、具体方法的应用情况分别进行国内外对比,探索量化文本分析法在国内外应用的差异性以及国内应用的局限性。然... 基于1980~2019年的国外281篇和国内73篇相关文献,使用编码方法,对量化文本分析法在工商管理领域的应用总体情况、应用主题分布、具体方法的应用情况分别进行国内外对比,探索量化文本分析法在国内外应用的差异性以及国内应用的局限性。然后,总结量化文本分析法应用于工商管理领域可解决的问题类型、方法的优势、面临的挑战及对策。研究发现,量化文本分析法可有效解决主题量化、主体对比、未知主题提炼三大类问题。并从量化文本分析法的研究主题拓展、研究方法优化两个方面,展望了中国工商管理领域研究中的量化文本分析法的应用前景。 展开更多
关键词 本数 量化本分析法 国内外对比 主题拓展 方法优化
下载PDF
大数据时代传播研究中语料库分析方法的价值 被引量:12
7
作者 喻国明 李慧娟 《传媒》 CSSCI 北大核心 2014年第2期64-66,共3页
大数据时代的研究逻辑,对传播学研究形成了新的冲击,传统的文本分析方法,已经不能满足对样本数量的宏阔和数据挖掘深度上的双重要求。语料库的研究方法在数据新闻、舆情监测和学术研究等领域都可以得到广泛的应用。通过语料库这种结构... 大数据时代的研究逻辑,对传播学研究形成了新的冲击,传统的文本分析方法,已经不能满足对样本数量的宏阔和数据挖掘深度上的双重要求。语料库的研究方法在数据新闻、舆情监测和学术研究等领域都可以得到广泛的应用。通过语料库这种结构化的文本数据来开展的量化研究,在国内外新闻传播学界都属新鲜待开发的领域。 展开更多
关键词 大数 语料库 本数 语义挖掘 定量研究
下载PDF
基于Q-LDA主题模型的网络健康社区主题挖掘研究 被引量:12
8
作者 杨磊 王子润 侯贵生 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第11期52-59,共8页
【目的】信息质量是主题发现的重要影响因素,通过构建Q-LDA模型进行网络健康社区主题挖掘,弥补LDA主题模型在网络信息质量方面的不足,并增强模型的主题表示能力。【方法】研究网络健康信息质量评价体系,并对网络健康信息进行质量加权,在... 【目的】信息质量是主题发现的重要影响因素,通过构建Q-LDA模型进行网络健康社区主题挖掘,弥补LDA主题模型在网络信息质量方面的不足,并增强模型的主题表示能力。【方法】研究网络健康信息质量评价体系,并对网络健康信息进行质量加权,在LDA主题模型的基础上建立Q-LDA主题挖掘模型,利用实际数据对模型进行验证。【结果】Q-LDA模型的结果可解释性和主题表达能力优于传统的LDA主题模型,其主题挖掘效率提高16%,能够更有效地挖掘网络健康社区信息所隐藏的主题。【局限】只选取网络健康社区内某一种疾病版块的文本数据,其代表性可能存在不足。【结论】在考虑网络健康信息质量的情况下进行主题挖掘,其结果能更好地满足网络健康社区用户的需求。 展开更多
关键词 本数 在线健康社区 知识发现 主题挖掘
原文传递
基于图形数据与文本数据一体化的产品图纸文档管理系统 被引量:4
9
作者 伊国栋 谭建荣 《工程图学学报》 CSCD 2000年第1期47-53,共7页
开发了一套产品图纸文档管理系统,实现了在 AutoCAD环境下以产品图纸的标题栏、明细栏为核心的产品图纸和技术文档的计算机一体化管理。
关键词 图形数 本数 产品图纸档管理 一体化
下载PDF
智能化矿山通信接口与协议技术规范研究 被引量:7
10
作者 丁震 孙继平 +17 位作者 张帆 王鹏 胡而已 邓文革 高静 郑耀涛 王波 高秋秋 李系民 钱海军 柳建华 乔少利 鲍震 杨永生 杨振宇 李玉雪 李昱翰 邵光耀 《工矿自动化》 CSCD 北大核心 2023年第2期6-13,共8页
目前矿山智能化建设存在接口协议不统一、易形成新的“信息孤岛”等问题,导致矿山数据融合共享难度大,难以实现智能化矿山高质量发展。分析指出矿山智能化建设的关键问题在于缺乏规范统一的数据采集、传输与共享标准;按照核心规范、应... 目前矿山智能化建设存在接口协议不统一、易形成新的“信息孤岛”等问题,导致矿山数据融合共享难度大,难以实现智能化矿山高质量发展。分析指出矿山智能化建设的关键问题在于缺乏规范统一的数据采集、传输与共享标准;按照核心规范、应用规范、运维规范,设计了智能化矿山通信接口与协议技术体系;提出了智能化矿山通信接口与协议模型,定义了该模型的感知层、传输层、应用层;构建了智能化矿山设备模型,对通信接口进行形式化描述;将智能化矿山数据分为感知数据、文本数据和音视频数据,定义了3种数据的报文结构;根据目前矿山设备、技术应用情况和发展方向,将智能矿山数据采集方式分为设备直接采集、协议转换采集、系统中转采集,给出了3种数据采集方式的适用场景,并描述了感知数据、文本数据、音视频数据的采集和传输过程。智能化矿山通信接口与协议技术规范全域覆盖矿山数据融合通信的整个过程,旨在为智能化矿山数据采集、传输、融合、共享提供统一的接口方式和通信协议规范,实现矿山各系统之间的互联互通。 展开更多
关键词 智能化矿山 通信接口 通信协议 融合共享 感知数 本数 音视频数
下载PDF
基于改进Hadoop云平台的海量文本数据挖掘 被引量:11
11
作者 陈炎龙 段红玉 《湖南师范大学自然科学学报》 CAS 北大核心 2016年第3期84-88,共5页
针对常用的文本数据挖掘系统在处理海量文本数据时时间效率较低的问题,论文提出了一种基于改进Hadoop云平台的海量文本数据挖掘方法.该方法首先将传统Hadoop云平台进行改进以适应海量文本数据挖掘的需要,然后将海量文本数据集和挖掘任... 针对常用的文本数据挖掘系统在处理海量文本数据时时间效率较低的问题,论文提出了一种基于改进Hadoop云平台的海量文本数据挖掘方法.该方法首先将传统Hadoop云平台进行改进以适应海量文本数据挖掘的需要,然后将海量文本数据集和挖掘任务分解到该改进平台上的多台计算机上并行处理,从而实现了一个基于改进Hadoop云平台的海量文本数据挖掘平台,并通过对10 000篇新闻材料组成的实验数据集进行挖掘验证了该平台的有效性和高效性. 展开更多
关键词 本挖掘 HADOOP 云计算 本数
下载PDF
基于数据挖掘的化工生产事故致因主题抽取 被引量:10
12
作者 牛毅 樊运晓 高远 《中国安全生产科学技术》 CAS CSCD 北大核心 2019年第10期165-170,共6页
为充分挖掘化工生产事故数据中的有效信息和潜在规律,提高对化工事故认知水平,针对某化工集团2010—2016年共1578起事故数据,利用社会网络分析等方法揭示事故要素间的关联关系;运用潜在狄利克雷分配(LDA)模型进行事故聚类,并抽取到5个... 为充分挖掘化工生产事故数据中的有效信息和潜在规律,提高对化工事故认知水平,针对某化工集团2010—2016年共1578起事故数据,利用社会网络分析等方法揭示事故要素间的关联关系;运用潜在狄利克雷分配(LDA)模型进行事故聚类,并抽取到5个事故致因主题。研究结果表明:LDA主题模型等数据挖掘技术能有效挖掘大量事故数据中的潜在信息;5个事故致因主题中,4个涉及到人因或组织层面的缺陷;员工注意力不集中和现场风险管理不足这2个致因主题间具有较强相关性;员工注意力不集中、现场风险管理不足以及设备问题是导致事故发生的主要原因。 展开更多
关键词 化工事故 本数 挖掘 潜在狄利克雷分配(LDA) 事故致因
下载PDF
面向文本数据的正则化交叉验证方法 被引量:10
13
作者 王瑞波 王钰 李济洪 《中文信息学报》 CSCD 北大核心 2019年第5期54-65,共12页
面向文本数据建模时,交叉验证方法是特征选择及模型比较任务中的常用方法。许多研究表明,文本数据模型的性能估计对交叉验证的数据切分方式较为敏感,不合理的切分方式可能会导致不稳定的性能估计值,使得实验结果可复现性差。该文试图论... 面向文本数据建模时,交叉验证方法是特征选择及模型比较任务中的常用方法。许多研究表明,文本数据模型的性能估计对交叉验证的数据切分方式较为敏感,不合理的切分方式可能会导致不稳定的性能估计值,使得实验结果可复现性差。该文试图论证基于多次重复(m次)的2折交叉验证,通过引入对训练集、验证集分布差异的约束,所构造的正则化m×2交叉验证方法(简记为m×2BCV)可以改善模型的性能指标的估计,适宜于模型比较。该文首先针对文本数据引入训练集与验证集分布差异的卡方度量,基于该度量构建数据切分的正则化条件,以最大化模型性能指标的信噪比为目标,给出了满足正则化条件的m×2BCV的数据切分优化算法。最后,以自然语言处理中汉语框架语义角色标注任务为例,验证了基于m×2BCV方法的有效性。 展开更多
关键词 本数 正则化 交叉验证 信噪比
下载PDF
政府与市场心理因素的经济影响及其测度 被引量:6
14
作者 洪永淼 刘俸奇 薛涧坡 《管理世界》 北大核心 2023年第3期30-48,共19页
政府与市场关系是经济学的世界性难题,也是中国特色社会主义市场经济的核心问题。在政府政策制定与实施过程中,经济主体会基于自己掌握的信息和认知能力,学习、解读政策含义,形成对政策影响的预期,并基于自身利益最大化原则做出最优决策... 政府与市场关系是经济学的世界性难题,也是中国特色社会主义市场经济的核心问题。在政府政策制定与实施过程中,经济主体会基于自己掌握的信息和认知能力,学习、解读政策含义,形成对政策影响的预期,并基于自身利益最大化原则做出最优决策,从而影响宏观经济运行。因此,研究政府政策背景下各类经济主体的预期等心理因素的产生原因与形成过程,以及经济主体心理因素对经济运行与政策效应的影响机制,是深刻认识政府与市场关系的一个重要视角。本文提出利用人工智能特别是机器学习方法,从海量非结构化大数据提取政府政策变化与各类经济主体对政策变化的反应等信息,从理论和实证两个层面分析经济政策与经济主体的互动关系,以及经济主体心理因素如何影响经济运行与政策效应,并探讨发展非结构化大数据计量经济学,推动形成分析经济政策背景下经济主体心理因素及其影响的实证研究范式,以深入研究政府与市场关系。 展开更多
关键词 政府与市场关系 心理因素 本数 非结构化大数 政策传导机制
原文传递
虚拟健康社区文本数据知识发现策略与模型 被引量:9
15
作者 牟冬梅 琚沅红 +1 位作者 戴文浩 黄丽丽 《图书情报工作》 CSSCI 北大核心 2018年第5期125-131,共7页
[目的/意义]分析并提出虚拟健康社区文本数据的知识发现策略,构建虚拟健康社区文本数据知识发现模型。[方法/过程]通过总结分析虚拟健康社区文本数据特点,针对其特点带来的数据挖掘困难制定相应的知识发现策略,并在DIKW体系指导下... [目的/意义]分析并提出虚拟健康社区文本数据的知识发现策略,构建虚拟健康社区文本数据知识发现模型。[方法/过程]通过总结分析虚拟健康社区文本数据特点,针对其特点带来的数据挖掘困难制定相应的知识发现策略,并在DIKW体系指导下,依据提出的知识发现策略构建虚拟健康社区文本数据知识发现模型。通过应用计算机编码、自然语言处理技术、句法分析、制定推理规则等方法实现从自由文本数据到药物不良反应智慧的数据价值升华过程。[结果/结论]通过实证研究验证提出的知识发现策略和知识发现模型的有效性和可操作性,为后续虚拟健康社区文本数据知识发现的相关理论与实证研究提供参考。 展开更多
关键词 虚拟健康社区 本数 知识发现 知识发现策略 知识发现模型
原文传递
数据挖掘技术及其在BBS管理中的应用 被引量:4
16
作者 薛冰冰 普杰信 王峰 《现代电子技术》 2004年第2期55-56,64,共3页
Internet的发展及 BBS的应用 ,为广大网络用户提供了一个自由交流的空间 ,但随之而来的是对网络用户言论的管理问题。文章将数据挖掘技术引入 BBS的安全管理中 ,详细分析了 BBS的功能和分类 ,并给出了在
关键词 挖掘 互联网 公告板 本数
下载PDF
基于MD&A文本和深度学习模型的财务报告舞弊识别 被引量:7
17
作者 赵纳晖 张天洋 《会计之友》 北大核心 2022年第8期140-149,共10页
财务报告舞弊是企业舞弊的手段之一,不仅会导致会计信息失真,而且会危害经济的健康发展,因此,如何克服传统的人工检测和基于数值指标的浅层模型识别等方法的弊端,找到一种更为高效的智能化识别方法具有重要的现实意义。选取2015—2019... 财务报告舞弊是企业舞弊的手段之一,不仅会导致会计信息失真,而且会危害经济的健康发展,因此,如何克服传统的人工检测和基于数值指标的浅层模型识别等方法的弊端,找到一种更为高效的智能化识别方法具有重要的现实意义。选取2015—2019年间存在舞弊行为的A股上市公司定期报告,以其中的管理层讨论与分析章节(Management Discussion and Analysis,MD&A)为样本,同时确定了规模相同的控制样本,通过实证研究对比了深度学习模型和以往常用的浅层模型在检测财务报告舞弊时的性能。结果表明,在规模对等的舞弊和非舞弊类财务报告组成的文本数据集上,深度学习模型表现出明显优于基准模型的分类性能。研究结果为利用MD&A文本数据和深度学习方法识别企业财务报告舞弊的有效性提供了直接的证据。 展开更多
关键词 财务报告舞弊识别 管理层讨论与分析 本数 深度学习 卷积神经网络
下载PDF
电力企业文本数据挖掘技术研究 被引量:8
18
作者 吕旭明 雷振江 +1 位作者 赵永彬 由广浩 《电力信息与通信技术》 2016年第1期7-10,共4页
在国家电网公司信息化工程的建设过程中,积累了大量的文本数据。如何挖掘文本数据中蕴含的有价值信息将成为电力企业大数据挖掘方向研究的重点对象。文章结合电力行业目前的数据现状,使用文本挖掘的方法对电力设备检修资金投入工作效能... 在国家电网公司信息化工程的建设过程中,积累了大量的文本数据。如何挖掘文本数据中蕴含的有价值信息将成为电力企业大数据挖掘方向研究的重点对象。文章结合电力行业目前的数据现状,使用文本挖掘的方法对电力设备检修资金投入工作效能场景进行挖掘,对生产信息管理系统中报缺单数据进行文本聚类,实现对缺陷的细分。实践表明,该方法可以得出各类别的缺陷特征,从而证明了文本挖掘在电力行业的可用性。 展开更多
关键词 电力设备检修 本数 本挖掘 大数挖掘
下载PDF
基于互联网数据城市快速路地点安全分析方法 被引量:8
19
作者 张兴强 刘雪 +3 位作者 朱艺焱 宋勇刚 王欣 王学媛 《交通运输系统工程与信息》 EI CSCD 北大核心 2018年第5期53-59,共7页
现有的城市交通安全分析主要考虑人财物的直接损失,却忽略了事故产生的交通延误等间接损失,同时也较少利用互联网海量数据进行分析.本文建立了基于互联网文本数据的城市交通事故属性模型,采用模糊系统聚类法划分事故交通影响等级,构建... 现有的城市交通安全分析主要考虑人财物的直接损失,却忽略了事故产生的交通延误等间接损失,同时也较少利用互联网海量数据进行分析.本文建立了基于互联网文本数据的城市交通事故属性模型,采用模糊系统聚类法划分事故交通影响等级,构建了基于绝对事故次数、损害后果和交通影响的等效事故次数模型,并将其应用于累积频率曲线和K-means聚类的城市快速路地点安全组合评价方法中.北京市快速路地点安全评价结果表明,本文所提出的方法可有效地将互联网安全文本数据应用于城市交通安全分析中,分析结果可为城市交通安全管理提供有益的借鉴. 展开更多
关键词 城市交通 本数 事故属性 聚类 交通影响等级 等效事故数 组合评价
下载PDF
基于深度强化学习的文本实体关系抽取方法 被引量:6
20
作者 罗欣 陈艳阳 +2 位作者 耿昊天 许文波 张民 《电子科技大学学报》 EI CAS CSCD 北大核心 2022年第1期91-99,共9页
从文本大数据中快速准确地抽取文本的实体关系信息是构建知识图谱的关键。针对目前主流的远程监督关系抽取方法常常忽略实体对的类型信息和句子语法信息的问题,该文提出了一种基于深度强化学习的文本实体关系抽取方法。首先,利用结合实... 从文本大数据中快速准确地抽取文本的实体关系信息是构建知识图谱的关键。针对目前主流的远程监督关系抽取方法常常忽略实体对的类型信息和句子语法信息的问题,该文提出了一种基于深度强化学习的文本实体关系抽取方法。首先,利用结合实体周围词注意力机制的双向长短期记忆网络作为句子编码的第一个模块;然后,在此基础上加入实体类型嵌入模块,利用实体类型来丰富句子编码信息;最后,将一个依存句法分析模块纳入模型,共同组成了关系抽取器。同时,为实现标签级别的降噪,该文结合强化学习方法,设计了一个标签学习器来学习句子的软标签,以纠正错误标签。设计的标签学习器与关系抽取器结合,构成了基于深度强化学习的文本关系抽取框架。在公开数据集ACE2005、Chinese-Literature-NER-RE-Dataset和自建的数据集上进行实验,结果表明本文提出的方法在精度和召回率上都优于目前几种主流的模型。 展开更多
关键词 深度学习 实体关系抽取 强化学习 远程监督 本数
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部