期刊文献+
共找到153篇文章
< 1 2 8 >
每页显示 20 50 100
多层次关联规则的有效挖掘算法 被引量:42
1
作者 程继华 施鹏飞 《软件学报》 EI CSCD 北大核心 1998年第12期937-941,共5页
数据挖掘(DataMining)被认为是解决“数据爆炸”和“数据丰富,信息贫乏(DataRichandInforma-tionPoor)”的一种有效方法.关联规则(AssociationRules)是数据挖掘的重要研... 数据挖掘(DataMining)被认为是解决“数据爆炸”和“数据丰富,信息贫乏(DataRichandInforma-tionPoor)”的一种有效方法.关联规则(AssociationRules)是数据挖掘的重要研究内容.提出了多层次关联规则的挖掘算法——AR_SET,利用集合“或”、“与”运算求解频繁模式(FrequentItemset),提高了挖掘的效率和速度.实验结果表明,算法AR_SET是有效的,并对AR_SET算法的几个变种进行了讨论. 展开更多
关键词 数据挖掘 关联规则 数据库 知识发现
下载PDF
支持多约束的K-匿名化方法 被引量:60
2
作者 杨晓春 刘向宇 +1 位作者 王斌 于戈 《软件学报》 EI CSCD 北大核心 2006年第5期1222-1231,共10页
K-匿名化(K-anonymization)是数据发布环境下保护数据隐私的一种重要方法.目前,K-匿名化方法主要针对单一约束条件进行处理,而实际应用中涉及到大量的多约束条件,使K-匿名化问题更加复杂.如果简单地将单一约束K-匿名化方法应用到多约束... K-匿名化(K-anonymization)是数据发布环境下保护数据隐私的一种重要方法.目前,K-匿名化方法主要针对单一约束条件进行处理,而实际应用中涉及到大量的多约束条件,使K-匿名化问题更加复杂.如果简单地将单一约束K-匿名化方法应用到多约束情况,会造成大量的信息损失及过低的处理效率.根据多约束之间的关系,通过继承Classfly算法的元组概括过滤思想,提出多约束K-匿名化方法Classfly+及相应的3种算法,包括朴素算法、完全IndepCSet算法和部分IndepCSet的Classfly+算法.实验结果显示,Classfly+能够很好地降低多约束K-匿名化的信息损失,改善匿名化处理的效率. 展开更多
关键词 K-匿名化 数据隐私 概括 多约束 信息损失
下载PDF
隐私保护数据发布中身份保持的匿名方法 被引量:45
3
作者 童云海 陶有东 +1 位作者 唐世渭 杨冬青 《软件学报》 EI CSCD 北大核心 2010年第4期771-781,共11页
在隐私保护的数据发布研究中,目前的方法通常都是先删除身份标识属性,然后对准标识属性进行匿名处理.分析了单一个体对应多个记录的情况,提出了一种保持身份标识属性的匿名方法,它在保持隐私的同时进一步提高了信息有效性.采用概化和有... 在隐私保护的数据发布研究中,目前的方法通常都是先删除身份标识属性,然后对准标识属性进行匿名处理.分析了单一个体对应多个记录的情况,提出了一种保持身份标识属性的匿名方法,它在保持隐私的同时进一步提高了信息有效性.采用概化和有损连接两种实现方式.实验结果表明,该方法提高了信息有效性,具有很好的实用性. 展开更多
关键词 隐私保护 数据发布 匿名 身份保持 有损连接 概化
下载PDF
数字环境下制图综合概念和方法的拓展 被引量:21
4
作者 王光霞 《测绘学院学报》 北大核心 2005年第3期207-211,共5页
制图综合是地图学的一个核心和难点问题。随着GIS应用领域的拓展和地理空间信息栅格的提出,需要研究多尺度、多分辨率或不同详细程度的空间地理数据的自动生成问题,以满足GIS多层次应用与决策的需求,而这正是制图综合在数字环境下所要... 制图综合是地图学的一个核心和难点问题。随着GIS应用领域的拓展和地理空间信息栅格的提出,需要研究多尺度、多分辨率或不同详细程度的空间地理数据的自动生成问题,以满足GIS多层次应用与决策的需求,而这正是制图综合在数字环境下所要面对的新问题。因此,数字环境下制图综合不应该再仅仅局限于图形综合的概念,而且还应该包括基于地图数据库的数据集成、数据表达、数据分析和数据库派生的数据综合,更侧重于GIS环境下空间数据的多尺度表达以及数字信息处理的问题。 展开更多
关键词 数字环境 制图综合 数据综合 地图比例尺
下载PDF
空间数据的多尺度特征与自动综合 被引量:18
5
作者 王家耀 成毅 《海洋测绘》 2004年第4期1-3,共3页
尺度是地理现象、地理数据所共有的重要特征之一。就地理现象的多尺度描述和数据的多尺度特征进行了简要的分析,介绍了GIS中空间数据多尺度特征的表示方法,并对空间数据自动综合的理论、方法问题进行了探讨。
关键词 地理信息系统 空间数据 尺度 多尺度表示 自动综合
下载PDF
一种多比例尺GIS方案及其数据模型 被引量:18
6
作者 王晏民 李德仁 龚健雅 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2003年第4期458-462,共5页
提出了一种分层分级分区式多比例尺GIS方案 ,在提出的空间数据模型基础上 ,按照地图综合方法 ,发展了适合本文方案的多比例尺GIS空间数据模型 ,并通过试验说明了新方案及其模型的正确性和可行性 。
关键词 GIS 多比例尺 数据模型 地图综合 分层分级分区方案
下载PDF
一种基于粗糙集的多层次、逐步求精的发掘算法 被引量:17
7
作者 刘发升 杨炳儒 《计算机工程与应用》 CSCD 北大核心 1999年第5期11-12,17,共3页
数据量的巨大和高维、用户交互与先验知识的利用等等是KDD(数据库中知识发现与数据发掘)面对的问题和难点,该文针对这些问题提出了一种基于概念普遍化和粗糙集的多层次、逐步求精的发掘算法CRCG。该算法利用概念普遍化和粗糙集对数... 数据量的巨大和高维、用户交互与先验知识的利用等等是KDD(数据库中知识发现与数据发掘)面对的问题和难点,该文针对这些问题提出了一种基于概念普遍化和粗糙集的多层次、逐步求精的发掘算法CRCG。该算法利用概念普遍化和粗糙集对数据进行压缩和维数精简的特长,达到高效发掘感兴趣模式的目的。 展开更多
关键词 数据发掘 数据库 粗糙集 概念普遍化 算法
下载PDF
数据驱动故障诊断方法泛化性能的经验性分析 被引量:19
8
作者 郑怀亮 王日新 +2 位作者 杨远涛 尹建程 徐敏强 《机械工程学报》 EI CAS CSCD 北大核心 2020年第9期102-117,共16页
近年来数据驱动的故障诊断方法被广泛研究,但是这些方法有效的一个前提条件是训练诊断模型的数据与待测试数据应需采集自相同的设备和运行环境,然而这个前提条件在实际的诊断情形中很难得到满足,实际能够用来训练诊断模型的通常是采集... 近年来数据驱动的故障诊断方法被广泛研究,但是这些方法有效的一个前提条件是训练诊断模型的数据与待测试数据应需采集自相同的设备和运行环境,然而这个前提条件在实际的诊断情形中很难得到满足,实际能够用来训练诊断模型的通常是采集自同类型设备或不同工况的历史数据。对于实际诊断情形下存在潜在差异的数据集,数据驱动故障诊断方法是否有效的问题鲜有讨论。首先讨论了影响诊断方法泛化性能的可能因素,然后构建了多个跨数据集诊断任务,在此基础上对几个数据驱动诊断方法的泛化性能进行了经验性的分析,分析发现相较于模型复杂度数据集间的分布差异是影响跨域诊断泛化性能的主要因素;并进一步从信号特性分析的角度解释了设备型号差异和工况差异对跨域诊断性能影响的深层次原因。这些讨论有益于启发面向实际诊断情形的数据驱动诊断方法的研究。 展开更多
关键词 故障诊断 数据驱动 泛化性能 经验性分析
原文传递
多种数据泛化策略融合的神经机器翻译系统 被引量:17
9
作者 刘俊鹏 宋鼎新 +1 位作者 张一鸣 黄德根 《江西师范大学学报(自然科学版)》 CAS 北大核心 2020年第1期39-45,共7页
在Transformer模型的基础上,该文从数据泛化、多样化解码策略和后处理方法3个方面进行改进.多种数据泛化策略融合方法对不同种类的稀疏词语进行识别、泛化和翻译,减少错译现象.利用检查点平均和模型集成等多样化解码策略进一步提升翻译... 在Transformer模型的基础上,该文从数据泛化、多样化解码策略和后处理方法3个方面进行改进.多种数据泛化策略融合方法对不同种类的稀疏词语进行识别、泛化和翻译,减少错译现象.利用检查点平均和模型集成等多样化解码策略进一步提升翻译效果.在CCMT 2019中英新闻领域翻译任务上的实验结果显示,改进后的方法在基线系统上的BLEU-SBP值提升了约1.85%. 展开更多
关键词 神经机器翻译 自注意力机制 数据泛化 中英翻译
下载PDF
一种考虑属性权重的隐私保护数据发布方法 被引量:17
10
作者 徐勇 秦小麟 +2 位作者 杨一涛 杨种学 黄灿 《计算机研究与发展》 EI CSCD 北大核心 2012年第5期913-924,共12页
k-匿名模型是数据发布领域用于对原始待发布数据集进行匿名处理以阻止链接攻击的有效方法之一,但已有的k-匿名及其改进模型没有考虑不同应用领域对匿名发布表数据质量需求不同的问题.在特定应用领域不同准码属性对基于匿名发布表的数据... k-匿名模型是数据发布领域用于对原始待发布数据集进行匿名处理以阻止链接攻击的有效方法之一,但已有的k-匿名及其改进模型没有考虑不同应用领域对匿名发布表数据质量需求不同的问题.在特定应用领域不同准码属性对基于匿名发布表的数据分析任务效用的贡献程度是不同的,若没有根据发布表用途的差异区别处理各准码属性的泛化过程,将会导致泛化后匿名发布表数据效用较差、无法满足具体数据分析任务的需要.在分析不同应用领域数据分析任务特点的基础上,首先通过修正基本ODP目录系统建立适用于特定问题领域的概念泛化结构;然后在泛化过程中为不同准码属性的泛化路径设置权重以反映具体数据分析任务对各准码属性的不同要求;最后设计一种考虑属性权重的数据匿名发布算法WAK(QI weight-aware k-anonymity),这是一种灵活地保持匿名发布表数据效用的隐私保护问题解决方案.示例分析和实验结果表明,利用该方案求解的泛化匿名发布表在达到指定隐私保护目标的同时,能够保持较高的数据效用,满足具体应用领域特定数据分析任务对数据质量的要求. 展开更多
关键词 数据发布 隐私保护 权重 K-匿名 泛化
下载PDF
数据挖掘技术 被引量:4
11
作者 俞金寿 《石油化工自动化》 CAS 2000年第6期38-42,共5页
:数据挖掘技术作为一个新兴的技术在许多领域都取得了成功的应用。介绍了数据挖掘技术的基本情况 ,讨论了主要的数据挖掘问题如数据分类、关联规则挖掘、数据汇总和路径遍历模式识别等。
关键词 数据挖掘 知识发现 数据分类 关联规则 数据汇总
下载PDF
知识图谱研究综述 被引量:11
12
作者 郭琳 陈晓慧 肖梅 《信息记录材料》 2023年第6期17-19,23,共4页
人工智能的发展需要依赖底层数据与技术,面对浩如烟海的结构化、半结构化、非结构化数据,如何将其高效存储并在不同场景下复现以精确支撑用户的使用需求,逐渐成为亟待解决的难题。为帮助用户从搜索意图出发,更加高效地达成搜索目标,满... 人工智能的发展需要依赖底层数据与技术,面对浩如烟海的结构化、半结构化、非结构化数据,如何将其高效存储并在不同场景下复现以精确支撑用户的使用需求,逐渐成为亟待解决的难题。为帮助用户从搜索意图出发,更加高效地达成搜索目标,满足信息多样化环境下不同形式数据泛化与知识的立体呈现。本文运用文献与实证研究方法,对知识图谱的定义、分类与架构进行整合,综述了知识图谱构建过程所涉及的关键技术,提出了知识图谱的5大全新应用场景,并对知识图谱未来发展的方向与趋势进行展望,为大数据时代知识的条理化组织与智能化应用提供借鉴。 展开更多
关键词 知识图谱 图谱构建 数据存储 数据泛化 人工智能
下载PDF
隐私保护的数据发布研究 被引量:16
13
作者 杨高明 杨静 张健沛 《计算机科学》 CSCD 北大核心 2011年第9期11-17,共7页
随着信息技术的发展,个人隐私泄露成为日益严重的问题,因此迫切需要研究防止数据发布中个人隐私的泄露。为此,许多研究者提出不同的方法用以实现隐私保护的数据发布。为总结前人工作,介绍了隐私保护数据发布技术的研究意义和发展历程,... 随着信息技术的发展,个人隐私泄露成为日益严重的问题,因此迫切需要研究防止数据发布中个人隐私的泄露。为此,许多研究者提出不同的方法用以实现隐私保护的数据发布。为总结前人工作,介绍了隐私保护数据发布技术的研究意义和发展历程,阐述了本领域研究过程中的背景攻击模型和隐私模型,深入分析了用已有的概化/隐匿方法和聚类方法实现匿名数据发布技术,总结了匿名质量有关的信息度量标准,同时探讨了数据更新引起的增量数据发布方法和高维数据、移动数据的发布,最后归纳了目前研究中的问题并展望了本领域进一步的研究趋势。 展开更多
关键词 隐私保护 数据发布 K-匿名 概化 信息度量
下载PDF
数字高程模型精度标准、质量理论和科学观念讨论 被引量:15
14
作者 胡海 吴艳兰 胡鹏 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2011年第6期713-716,共4页
分析了数字高程模型(DEM)的国家精度标准,及其与一些实际数据间的逻辑矛盾,并运用GIS数据质量理论,从分辨率、逻辑一致性、完整性的角度,分析了DEM误差、高程的序同构原理和必须综合生成原理。提出"DEM不应是间距dx上的取样点高程... 分析了数字高程模型(DEM)的国家精度标准,及其与一些实际数据间的逻辑矛盾,并运用GIS数据质量理论,从分辨率、逻辑一致性、完整性的角度,分析了DEM误差、高程的序同构原理和必须综合生成原理。提出"DEM不应是间距dx上的取样点高程,而应是间距dx×dx上颗粒度的代表高程",突出了综合在DEM中的关键作用。 展开更多
关键词 数字高程模型精度标准 数据质量 分辨率 逻辑一致性 数字综合
原文传递
声振信号联合1D-CNN的大型电机故障诊断方法 被引量:14
15
作者 赵书涛 王二旭 +2 位作者 陈秀新 王科登 李小双 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2020年第9期116-122,共7页
针对复杂运行环境下大功率电动机故障诊断准确率不高、算法泛化能力差的问题,提出一种声振信号联合一维卷积神经网络(1D-CNN)故障诊断方法.首先对采集到的声信号采用背景噪声库联合稀疏表示去除噪声,然后将声音信号进行带通滤波(7~20 kH... 针对复杂运行环境下大功率电动机故障诊断准确率不高、算法泛化能力差的问题,提出一种声振信号联合一维卷积神经网络(1D-CNN)故障诊断方法.首先对采集到的声信号采用背景噪声库联合稀疏表示去除噪声,然后将声音信号进行带通滤波(7~20 kHz),叠加低频振动信号(7 kHz内)形成频带更完整的电动机状态表征信息.再对经过滤波提纯处理后的信息进行重叠式数据扩容,获取1D-CNN训练所需大量数据.最后将数据样本输入1D-CNN进行学习训练,采用局部均值归一化(local response normalization,LRN)和核函数去相关性改进1D-CNN模型结构,降低抽油机正负半周工况波动对电动机诊断准确性的影响.诊断结果表明:声振信号联合分析的卷积神经网络故障诊断总体诊断准确率达到了97.75%,泛化能力好,与传统的电动机故障诊断方法相比优势明显. 展开更多
关键词 电动机 声振联合 1D-CNN 稀疏表示 数据扩容 故障诊断 泛化能力
下载PDF
An Overview of Data Mining and Knowledge Discovery 被引量:8
16
作者 范建华 李德毅 《Journal of Computer Science & Technology》 SCIE EI CSCD 1998年第4期348-368,共21页
With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data ... With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data mining and knowledge discovery in databases. Several emerging applications in information providing services, such as data warehousing and on-line services over the Internet, also call for various data mining and knowledge discovery techniques to understand user behavior better, to improve the service provided, and to increase the business opportunities. In response to such a demand, this article is to provide a comprehensive survey on the data mining and knowledge discovery techniques developed recently, and introduce some real application systems as well. In conclusion, this article also lists some problems and challenges for further research. 展开更多
关键词 Knowledge discovery in databases data mining machine learning association rule CLASSIFICATION data clustering data generalization pattern searching
原文传递
基于等效磁化曲线智能识别的变压器保护原理 被引量:11
17
作者 李宗博 焦在滨 何安阳 《电工技术学报》 EI CSCD 北大核心 2020年第7期1464-1475,共12页
提出一种基于等效磁化曲线智能识别的变压器保护原理。铁心的动态行为能够从本质上反应变压器的运行状态,磁化曲线的几何特征是变压器铁心动态行为的外在表现。首先,在研究磁化曲线几何特性的基础上,构建基于励磁支路电压-差动电流(U-I... 提出一种基于等效磁化曲线智能识别的变压器保护原理。铁心的动态行为能够从本质上反应变压器的运行状态,磁化曲线的几何特征是变压器铁心动态行为的外在表现。首先,在研究磁化曲线几何特性的基础上,构建基于励磁支路电压-差动电流(U-I)的等效磁化曲线,并分析等效磁化曲线与变压器运行状态的对应关系;其次,构建以等效磁化曲线倾斜角度、椭圆率以及长轴数值为输入,以变压器运行状态为输出的BP神经网络模型,生成基于BP神经网络的变压器内部故障识别算法;最后,利用大量数字仿真和动模实验数据对所提算法进行验证,结果表明,保护方案从铁心动态行为出发,利用少量数据并结合传统的监督学习算法即可准确地判断变压器运行状态,仿真及动模实验数据的正确动作率均达到了100%。特别地,该方法具有良好的泛化能力,对CT饱和等场景具有良好的适应性,可以直接作为由铁磁材料构成的电力变压器的主保护,具有良好的应用前景。 展开更多
关键词 变压器保护 等效磁化曲线 BP神经网络 数据融合 泛化能力
下载PDF
基于频繁模式树的普遍化关联规则挖掘 被引量:4
18
作者 李乃乾 沈钧毅 宋擒豹 《小型微型计算机系统》 CSCD 北大核心 2002年第12期1469-1471,共3页
提出了基于频繁模式树的普遍化关联规则挖掘算法 MGAR- FP,充分利用频繁模式树的性质 ,避免大量候选模式的生成和频繁模式匹配 ,提高了挖掘的效率和速度 .实验表明 ,算法是有效的 ,比传统的普遍化关联规则挖掘算法Cum
关键词 频繁模式树 普遍化关联规则 知识发现 数据挖掘 数据库
下载PDF
FME在二调数据缩编图斑融合中的应用 被引量:9
19
作者 薄伟伟 丁俊杰 《北京测绘》 2011年第2期43-45,42,共4页
图斑融合是二调数据缩编中工作量很大的一部分,本文介绍了利用FME对图斑融合的方法及融合效果。实践证明,利用FME对图斑融合能够大大减轻人工工作量,提高工作效率。
关键词 数据缩编 图斑融合 FME
下载PDF
GIS的空间数据多比例尺表达与处理概念框架 被引量:10
20
作者 李爱勤 李德仁 +1 位作者 龚健雅 邓轶 《地球信息科学》 CSCD 北大核心 2009年第5期645-651,共7页
概念框架是制图综合研究中的一个非常重要的内容,但少有关注。GIS中空间数据的多比例尺表达和处理的概念与制图综合既有联系,又有区别。本文旨在研究满足GIS应用目的空间数据多比例尺变换问题,基于大量文献对空间比例尺、人工制图综合... 概念框架是制图综合研究中的一个非常重要的内容,但少有关注。GIS中空间数据的多比例尺表达和处理的概念与制图综合既有联系,又有区别。本文旨在研究满足GIS应用目的空间数据多比例尺变换问题,基于大量文献对空间比例尺、人工制图综合、数字制图综合、地理数据库、地图数据库以及概念框架的相互关系进行了研究和探讨,设计出一种GIS环境下的空间数据多比例尺表达与处理的概念框架,并通过实例进行了验证。 展开更多
关键词 地理信息系统 空间数据 多比例尺 地图综合 概念框架
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部