期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
LKJ基础数据中信号机公里标与距离不一致问题分析 被引量:4
1
作者 彭继新 《铁道通信信号》 2020年第2期21-22,26,共3页
列车运行监控装置(LKJ)基础数据中,信号机公里标与信号机间距离是控制列车安全运行的基础,当提报的LKJ基础数据中信号机公里标与距离不一致时,会出现LKJ临时限速控制异常的情况。本文针对此类情况进行原因分析,并提出解决方法。
关键词 列车运行监控装置 信号机公里标 信号机间距离 数据不一致.
下载PDF
高速飞行器多站红外辐射测量数据不一致性分析及解决方案 被引量:1
2
作者 禄晓飞 谌廷政 《红外技术》 CSCD 北大核心 2015年第5期435-440,共6页
高速飞行器在大气层内长时间飞行,与空气摩擦生成几千度高温,研究其红外辐射及热防护效果是当前的热点。然而用多台地基红外辐射测量设备测量飞行目标时,各红外辐射测量设备多波段的结果有着较大差异。首先分析了高速飞行目标红外辐射... 高速飞行器在大气层内长时间飞行,与空气摩擦生成几千度高温,研究其红外辐射及热防护效果是当前的热点。然而用多台地基红外辐射测量设备测量飞行目标时,各红外辐射测量设备多波段的结果有着较大差异。首先分析了高速飞行目标红外辐射成像的特点,指出测量结果存在不一致性的原因,主要有飞行目标的方向效应、红外设备本身的滤波效应。然后提出了解决同设备不同波段处理结果不一致的方案,包括标定数据处理、坏像元剔除、杂散能量和反射的星体辐射能量抵消。最后又提出了多站红外辐射测量设备处理结果不一致性分析方案,以及外场试验方案。 展开更多
关键词 红外测量 数据不一致性 高速飞行器
下载PDF
支持有效时间的时态RDF数据的不一致性分析
3
作者 张燕超 《计算技术与自动化》 2018年第3期170-174,共5页
资源描述框架(RDF)是一个元数据模型,是由W3C建立的基础设施,使得Web上的数据机器可读。近年来,语义网的快速发展和RDF的普遍应用,产生了大量的含有时态信息的RDF数据,并涉及到各个方面领域的关键数据。时态RDF数据的一致性能提高时态RD... 资源描述框架(RDF)是一个元数据模型,是由W3C建立的基础设施,使得Web上的数据机器可读。近年来,语义网的快速发展和RDF的普遍应用,产生了大量的含有时态信息的RDF数据,并涉及到各个方面领域的关键数据。时态RDF数据的一致性能提高时态RDF数据的准确性,时态数据的一致性检测和恢复也有助于提高数据库系统的可靠性和高效性,对于时态信息处理也能提供可靠的保证,也能提高时态信息处理的效率。研究了对传统RDF引入时间信息的建模方式,通过添加有效时间的时间标签的方式构建了支持有效时间的时态RDF模型,在此基础上对时态RDF数据存在的不一致性情况进行了分析和研究,并提出了相关的检测和修复的算法。 展开更多
关键词 时态数据模型 有效时间 时态数据的不一致性
下载PDF
时态RDF数据的不一致性修复和预处理
4
作者 张燕超 《计算技术与自动化》 2018年第4期133-138,共6页
资源描述框架(RDF)是由W3C提出的开放型数据模型,对语义Web中信息资源的语义表达和描述标准化。语义网的快速发展和RDF的普遍应用,产生大量的时态RDF数据。时态RDF数据的一致性能提高时态RDF数据的准确性,也有助于提高数据库系统的可靠... 资源描述框架(RDF)是由W3C提出的开放型数据模型,对语义Web中信息资源的语义表达和描述标准化。语义网的快速发展和RDF的普遍应用,产生大量的时态RDF数据。时态RDF数据的一致性能提高时态RDF数据的准确性,也有助于提高数据库系统的可靠性和高效性,对于时态信息处理也能提供可靠的保证。针对支持有效时间的时态RDF数据存在的不一致性情况,提出了相关的修复算法,对于时态RDF数据实时更新,分析变化操作产生的不一致性并进行了预处理,实验验证了可行性。 展开更多
关键词 时态数据模型 有效时间 时态数据的不一致性 变化操作
下载PDF
基于一阶逻辑的非一致性关系数据管理
5
作者 谢东 伍锦群 刘罗仁 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第7期2034-2041,共8页
对于给定的约束,数据库可能是非一致的。为了获得一致性结果,基于一阶逻辑,提出非一致性关系数据管理框架,研究多种合取查询类型对应的连接图及其连接的充分性,分析一致性查询应答的计算复杂度。在查询连接类型是键-键、非键-键或不充... 对于给定的约束,数据库可能是非一致的。为了获得一致性结果,基于一阶逻辑,提出非一致性关系数据管理框架,研究多种合取查询类型对应的连接图及其连接的充分性,分析一致性查询应答的计算复杂度。在查询连接类型是键-键、非键-键或不充分的键-键,且查询对应的连接图是非环的情况下,一致性查询应答的计算在多项式时间内是可解的。针对大量实际的易处理合取查询,给出查询重写算法获得可重写的查询。算法首先判断初始查询是否为可重写,再基于连接图进行递归计算构造一致性识别语句,然后,与初始查询合取产生一个新的一阶重写查询,用于计算一致性结果。对于非环的自连接查询,由于递归重写算法不能剔除非一致性元组,因此,采用初始查询获取了用于剔除违反键约束的非一致性元组的语句。 展开更多
关键词 关系数据库 非一致性关系数据 一阶逻辑 查询重写
下载PDF
一种基于统计优化的客户关系管理
6
作者 李畅 李仁发 周铁军 《计算机工程与科学》 CSCD 2005年第8期109-111,共3页
本文提出了一种基于确定性因子的统计算法来实现客户分类,利用粗糙集和统计知识的互补来处理不确定知识,挖掘潜在客户。实验结果表明,该算法提高了客户分类时的查全率和查准率。
关键词 数据挖掘 分类 统计学 粗糙集 矛盾数据
下载PDF
基于Rough集的决策树算法 被引量:9
7
作者 乔梅 韩文秀 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2005年第9期842-846,共5页
 针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法.采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画...  针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法.采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式, 以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理.对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当.算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集. 展开更多
关键词 ROUGH集 决策树 属性分类粗糙度 预剪枝 不相容数据
下载PDF
基于数据依赖的数据修复研究进展 被引量:9
8
作者 胡艳丽 张维明 +2 位作者 罗旭辉 肖卫东 汤大权 《计算机科学》 CSCD 北大核心 2009年第10期11-15,共5页
介绍了数据依赖理论及如何基于数据依赖修复不一致数据,提高数据质量。首先介绍了数据依赖理论;给出了数据修复的语义假设及对应的修复操作;总结了基于数据依赖修复不一致数据的方法;最后讨论了基于数据依赖修复不一致数据的未来发展方向。
关键词 数据依赖 不一致数据 修复 数据清洗 数据质量
下载PDF
大规模异构的政府统计报表信息抽取与集成融合研究 被引量:7
9
作者 赵洪 王芳 《情报学报》 CSSCI CSCD 北大核心 2020年第9期938-948,共11页
政府统计数据作为国家的"战略金矿",充分挖掘其内在价值,使之更好地服务于政府及公众,已成为当前智慧政务和新型智库发展中大数据系统建设的必然要求。但政府统计报表的半结构化和大规模异构特点,使得统计数据之间无法直接关... 政府统计数据作为国家的"战略金矿",充分挖掘其内在价值,使之更好地服务于政府及公众,已成为当前智慧政务和新型智库发展中大数据系统建设的必然要求。但政府统计报表的半结构化和大规模异构特点,使得统计数据之间无法直接关联及聚合,影响了统计数据资源的深度挖掘与开发。鉴于此,本文针对已有研究的不足,在分析政府统计报表语义构成要素的基础上,结合其信息抽取与集成融合的应用目标,将处理任务分解为表格语义结构解析、表头语义关系识别、数值信息抽取表示、指标术语消冗转换及不一致统计数据消歧等五个逻辑过程,并定义了各过程的作用与主要任务,且研究构建了面向该任务的总体技术框架及其处理流程。大规模真实数据集上的应用结果表明,本研究方法能够较为有效地实现异构型政府统计报表的抽取与集成融合,具备较好的实际价值,同时也为其他基于半结构化表格的大数据建设与应用研究提供参考借鉴。 展开更多
关键词 政府统计报表 异构资源 信息抽取 集成融合 不一致数据消歧
下载PDF
基于统计推理的不一致数据清洗方法 被引量:2
10
作者 张安珍 胡生吉 夏秀峰 《计算机应用研究》 CSCD 北大核心 2024年第10期2987-2992,共6页
不一致数据修复是数据清洗领域的一个重要研究方向,现有方法大多是基于完整性约束规则的,采用最小代价原则进行修复,然而,代价最小的修复方案通常是不正确的,导致现有修复方法的准确率较低。针对现有方法准确率较低的问题,提出了一种基... 不一致数据修复是数据清洗领域的一个重要研究方向,现有方法大多是基于完整性约束规则的,采用最小代价原则进行修复,然而,代价最小的修复方案通常是不正确的,导致现有修复方法的准确率较低。针对现有方法准确率较低的问题,提出了一种基于统计推理的不一致数据清洗方法BayesOUR,兼顾修复的代价与质量,提高修复准确性。BayesOUR主要分为三个阶段:首先根据完整性约束规则进行错误检测;然后利用贝叶斯网络推理所有可能的一致性修复方案概率;最后选择概率最大的修复方案进行数据清洗。真实数据上的实验结果表明,该方法与目前领先的方法相比,能够显著提高不一致数据修复的准确性。 展开更多
关键词 不一致数据 贝叶斯网络 统计推理
下载PDF
不一致数据上精确决策树生成算法 被引量:5
11
作者 王鹤澎 王宏志 +1 位作者 李建中 高宏 《软件学报》 EI CSCD 北大核心 2017年第11期2814-2824,共11页
近年来,随着现实生活中数据量的不断增大,不一致数据的出现也越发频繁,这使得人工修正不一致数据变得更加耗时.而且,人工修正数据方法本身也存在着不可避免的人为操作错误,因此,这种修正方法不再可行.如何不提前修复不一致数据,直接在... 近年来,随着现实生活中数据量的不断增大,不一致数据的出现也越发频繁,这使得人工修正不一致数据变得更加耗时.而且,人工修正数据方法本身也存在着不可避免的人为操作错误,因此,这种修正方法不再可行.如何不提前修复不一致数据,直接在不一致数据上进行分类,是该文的核心研究内容.对决策树生成算法的目标函数进行改进,使其能够直接对不一致数据进行分类,并得到较好的分类结果.对约束条件中的特征对分类结果的影响进行了多方面衡量,从而调整该特征的影响因子,使得决策树的节点分割更加精确,分类效果更优. 展开更多
关键词 不一致数据 决策树 分类 海量数据
下载PDF
规则与概率相结合的不一致数据子集修复方法 被引量:1
12
作者 张安珍 司佳宇 +2 位作者 梁天宇 朱睿 邱涛 《软件学报》 EI CSCD 北大核心 2024年第9期4448-4468,共21页
不一致数据子集修复问题是数据清洗领域的重要研究问题,现有方法大多是基于完整性约束规则的,采用最小删除元组数量原则进行子集修复.然而,这种方法没有考虑删除元组的质量,导致修复准确性较低.为此,提出规则与概率相结合的子集修复方法... 不一致数据子集修复问题是数据清洗领域的重要研究问题,现有方法大多是基于完整性约束规则的,采用最小删除元组数量原则进行子集修复.然而,这种方法没有考虑删除元组的质量,导致修复准确性较低.为此,提出规则与概率相结合的子集修复方法,建模不一致元组概率使得正确元组的平均概率大于错误元组的平均概率,求解删除元组概率和最小的子集修复方案.此外,为了减小不一致元组概率计算的时间开销,提出一种高效的错误检测方法,减小不一致元组规模.真实数据和合成数据上的实验结果验证所提方法的准确性优于现有最好方法. 展开更多
关键词 不一致数据 函数依赖 子集修复 概率图网络
下载PDF
具有非一致性数据预处理的粗糙集特征选择算法 被引量:1
13
作者 袁赣 张巍 蔡庆生 《计算机科学》 CSCD 北大核心 2004年第10期200-202,共3页
大多数特征选择算法面临着对非一致性数据缺乏有效的处理的问题。本文提出了一种处理非一致性数据的方法,采用阈值将非一致性数据做归类处理,当某一类非一致性数据的某个取值比例超过了该阈值,则该类数据都取该值,并只保留一条记录。在... 大多数特征选择算法面临着对非一致性数据缺乏有效的处理的问题。本文提出了一种处理非一致性数据的方法,采用阈值将非一致性数据做归类处理,当某一类非一致性数据的某个取值比例超过了该阈值,则该类数据都取该值,并只保留一条记录。在此基础上,本文提出了一种改进的基于粗糙集理论的特征选择算法。 展开更多
关键词 特征选择 算法 数据预处理 粗糙集理论 阈值 记录 归类 非一致性 问题 比例
下载PDF
针对非独立同分布的安全联邦学习算法 被引量:1
14
作者 陈乃瑞 陈志雨 《长春工业大学学报》 2023年第5期454-460,共7页
重点研究了数据分布不均衡引起的联邦学习性能问题,并对此进行了研究。实验发现,在数据分布不一致的情况下,经典的联邦学习算法存在降低收敛速度、降低模型精度等问题。通过深入分析,发现这些问题的主要原因是参与者的数据分布不一致,... 重点研究了数据分布不均衡引起的联邦学习性能问题,并对此进行了研究。实验发现,在数据分布不一致的情况下,经典的联邦学习算法存在降低收敛速度、降低模型精度等问题。通过深入分析,发现这些问题的主要原因是参与者的数据分布不一致,训练过程中发生参与者模型差异的累积。为了减少训练过程中参与者模式差异的累积,提出针对模型参数的惩罚机制方法FedWD。将提出的方法与经典的联邦学习算法相结合,使参与者在模型训练过程中受到制约,从而避免参与者模型的过度发散。这可以加快算法的收敛速度,提高模型在数据分布不一致情况下的准确性。对提出的算法优化方法在Mnist数据集进行实验对比及分析,实验验证文中提出方法的有效性,特别在数据分布不一致场景下,文中方法的提升效果更加明显。 展开更多
关键词 联邦学习 深度学习 非独立同分布
下载PDF
Truth Discovery on Inconsistent Relational Data
15
作者 Jizhou Sun Jianzhong Li +1 位作者 Hong Gao Hongzhi Wang 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2018年第3期288-302,共15页
In this era of big data, data are often collected from multiple sources that have different reliabilities, and there is inevitable conflict with respect to the various information obtained when it relates to the the s... In this era of big data, data are often collected from multiple sources that have different reliabilities, and there is inevitable conflict with respect to the various information obtained when it relates to the the same object.One important task is to identify the most trustworthy value out of all the conflicting claims, and this is known as truth discovery. Existing truth discovery methods simultaneously identify the most trustworthy information and source reliability degrees and are based on the idea that more reliable sources often provide more trustworthy information,and vice versa. However, there are often semantic constrains defined upon relational database, which can be violated by a single data source. To remove violations, an important task is to repair data to satisfy the constrains,and this is known as data cleaning. The two problems above may coexist, but considering them together can provide some benefits, and to the authors knowledge, this has not yet been the focus of any research. In this paper, therefore, a schema-decomposing based method is proposed to simultaneously discover the truth and to clean the data, with the aim of improving accuracy. Experimental results using real world data sets of notebooks and mobile phones, as well as simulated data sets, demonstrate the effectiveness and efficiency of our proposed method. 展开更多
关键词 inconsistent data truth discovery data cleaning
原文传递
Rough集在不一致决策树生成中的应用
16
作者 乔梅 韩文秀 《华北工学院学报》 EI 2005年第3期230-234,共5页
 现实世界中存在大量不相容数据.基于Rough集的有关理论,提出了一个在决策树生成过程中简单高效的识别、处理不相容数据,生成不一致决策叶节点的方法,并引入决策质量参数来刻画不一致叶节点,从而为利用决策树推理和决策提供更多有用信...  现实世界中存在大量不相容数据.基于Rough集的有关理论,提出了一个在决策树生成过程中简单高效的识别、处理不相容数据,生成不一致决策叶节点的方法,并引入决策质量参数来刻画不一致叶节点,从而为利用决策树推理和决策提供更多有用信息.将这些方法结合进ID3算法,使算法对相容和不相容数据均可进行有效地处理. 展开更多
关键词 ROUGH集 决策树 不相容数据 不一致决策树
下载PDF
IVSA模型在双来源自动站小时降水数据实时拼接中的应用 被引量:1
17
作者 刘一鸣 《气象》 CSCD 北大核心 2015年第11期1398-1407,共10页
利用2012年5月1日至7月31日全国自动气象站两种来源实时上传资料中的"非缺测不一致"小时降水数据,详查了问题的产生原因,为在实时拼接过程中高效判断数据正确性,提出较小尺度时间序列求证比对模型(IVSA):当同一时间同一台站... 利用2012年5月1日至7月31日全国自动气象站两种来源实时上传资料中的"非缺测不一致"小时降水数据,详查了问题的产生原因,为在实时拼接过程中高效判断数据正确性,提出较小尺度时间序列求证比对模型(IVSA):当同一时间同一台站的两种来源小时降水值发生不一致时,首先在较小时间尺度(分钟级)序列上使用内部一致性检查方法分别求证小时降水的正确性;当各自在较小时间尺度序列均无法证伪时,将单元出错概率引入两分钟降水序列的比对过程,并据此竞优遴选得出较为可靠的小时降水数据。指出:(1)产生非缺测不一致问题的原因主要有生成报文时观测数据不全、报文处理环节不一致、台站信息不正确三类。(2)使用2012年5月1360组实例形成IVSA模型参数后,模型在2012年6—7月的4017组非缺测不一致数据中取得了99.65%的判断准确率。通过IVSA模型,非缺测不一致的小时降水数据取舍问题可在分钟降水序列比对中找出答案。 展开更多
关键词 自动气象站 非缺测不一致 数据源拼接 求证比对模型 相关可信度 地面观测
下载PDF
基于标记的不一致数据查询处理框架
18
作者 吴爱华 《上海海事大学学报》 北大核心 2013年第1期84-89,共6页
为能在函数依赖范围内准确定位查询结果中的不一致数据,采用查询重写的方法建立基于标记的不一致数据查询处理框架.该框架是RDBMS与用户之间的一类中间件,以标记区分源数据和查询结果中的可信和不可信部分,可以避免信息丢失;能将任意传... 为能在函数依赖范围内准确定位查询结果中的不一致数据,采用查询重写的方法建立基于标记的不一致数据查询处理框架.该框架是RDBMS与用户之间的一类中间件,以标记区分源数据和查询结果中的可信和不可信部分,可以避免信息丢失;能将任意传统SQL查询翻译成能返回带信任标记的查询结果的SQL查询集,由已有的RDBMS响应.该系统能够内嵌到现有数据库应用系统中,且用户无须掌握新查询语言.实验表明,该系统不仅在信息保存上与相关工作相比有很大优势,而且时间性能与传统查询相比相差无几. 展开更多
关键词 不一致数据 数据质量 完整性约束 一致的查询回答 标记
下载PDF
基于Rough集的数据挖掘中知识变化的研究
19
作者 王希雷 马永军 苏静 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第S1期320-323,346,共5页
在对知识变化问题进行分析的基础上,针对知识本身发生变化的情况,提出一种可以获取变化后知识的方法.首先利用数据集中不一致数据的量是否发生了剧变猜测知识是否发生了变化;然后利用不一致数据的数量发生剧变的时间点来预测知识发生变... 在对知识变化问题进行分析的基础上,针对知识本身发生变化的情况,提出一种可以获取变化后知识的方法.首先利用数据集中不一致数据的量是否发生了剧变猜测知识是否发生了变化;然后利用不一致数据的数量发生剧变的时间点来预测知识发生变化的时间点;再利用没有发生剧变的不一致数据来预测变化后的知识;最后给出一个简单的实验方法获取变化后的知识,实验结果验证了该方法的有效性. 展开更多
关键词 数据挖掘 ROUGH集 知识变化 不一致数据 决策表
原文传递
最大依赖集在不一致数据检测中的应用
20
作者 戴超凡 李沛 王文倩 《计算机工程与应用》 CSCD 北大核心 2019年第15期89-95,共7页
针对条件函数依赖(CFDs)对不一致数据检测不完备问题,提出基于最大依赖集(MDS)的依赖提升算法(DLA),通过获取依赖中包含的隐性依赖(RCFDs)对数据集中的不一致数据进行检测。利用动态值域调整,设置数值变化的前移和后移指针,改进原算法... 针对条件函数依赖(CFDs)对不一致数据检测不完备问题,提出基于最大依赖集(MDS)的依赖提升算法(DLA),通过获取依赖中包含的隐性依赖(RCFDs)对数据集中的不一致数据进行检测。利用动态值域调整,设置数值变化的前移和后移指针,改进原算法的枚举过程,提高了算法对连续属性的适用性,给出动态值域调整和依赖提升算法的算法流程和伪代码,并对算法的收敛性和时间复杂度进行分析。最后通过对照实验,对比了依赖提升算法和基于CFDs的检测方法的检测精度和时间代价,验证了算法的有效性。 展开更多
关键词 条件函数依赖(CFDs) 不一致数据 最大依赖集(MDS) 动态值域调整
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部