期刊文献+
共找到501篇文章
< 1 2 26 >
每页显示 20 50 100
兴趣度——关联规则的又一个阈值 被引量:91
1
作者 周欣 沙朝锋 +1 位作者 朱扬勇 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2000年第5期627-633,共7页
关联规则的采掘是数据采掘研究的一个重要方面 .分析现有的关联规则采掘算法中所存在的问题 :首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响 ,因而导致知识表达功能的不够完善 ;其次是有可能一条规则即使可信度和支持... 关联规则的采掘是数据采掘研究的一个重要方面 .分析现有的关联规则采掘算法中所存在的问题 :首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响 ,因而导致知识表达功能的不够完善 ;其次是有可能一条规则即使可信度和支持度都很高 ,仍没有实际意义 ,甚至是误导性的 .因此对关联规则的形式定义作了修改 ,将运用差异思想引入的兴趣度阈值运用到关联规则中来 ,并给出其形式定义 .在分析了兴趣度的实际意义以后 ,讨论了兴趣度与概念层次的结合 . 展开更多
关键词 数据采掘 关联规则 兴趣度 概念层次 阈值 数据
下载PDF
基于Apriori的有效关联规则挖掘算法的研究 被引量:37
2
作者 张梅峰 张建伟 +1 位作者 张新敬 娄淑琴 《计算机工程与应用》 CSCD 北大核心 2003年第19期196-198,共3页
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则。鉴于此,该文给出了... 通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则。鉴于此,该文给出了关联规则的两个性质和引入兴趣度的第三个度量———相关支持度,设计了挖掘出有效关联规则算法,较好地解决了上述问题。 展开更多
关键词 数据挖掘 关联规则 APRIORI 兴趣度
下载PDF
村镇既有砌体结构民居建筑抗震性能现状分析 被引量:48
3
作者 王毅红 韩岗 +2 位作者 卜永红 李少荣 李丽 《建筑结构》 CSCD 北大核心 2010年第12期101-104,121,共5页
针对我国新农村建设和抗震救灾、农房重建加固改造工作中缺乏能够反映农村民居现状基础数据的问题,在全国19个省、市、自治区的68个行政村开展村镇建筑抗震性能的调研。根据调研资料,分析我国村镇既有砌体结构民居建筑抗震性能现状,给... 针对我国新农村建设和抗震救灾、农房重建加固改造工作中缺乏能够反映农村民居现状基础数据的问题,在全国19个省、市、自治区的68个行政村开展村镇建筑抗震性能的调研。根据调研资料,分析我国村镇既有砌体结构民居建筑抗震性能现状,给出一些统计数据,指出村镇砌体结构房屋在抗震设计、构造、施工中存在的问题,并剖析其原因,提出一些提高村镇砌体结构抗震性能的措施,为村镇民居建筑的建设、加固改造工作提供参考。 展开更多
关键词 村镇建筑 砌体结构 抗震性能 调研 统计数据 措施 建议
原文传递
基于新的距离度量的K-Modes聚类算法 被引量:46
4
作者 梁吉业 白亮 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2010年第10期1749-1755,共7页
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-... 传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-1匹配差异法的不足,既考虑了它们本身的异同,又考虑了其他相关分类属性对它们的区分性.并将提出的距离度量应用于传统K-Modes聚类算法中.通过与基于其他距离度量的K-Modes聚类算法进行实验比较,结果表明新的距离度量是更加有效的. 展开更多
关键词 聚类算法 分类属性数据 粗糙集 粗糙隶属度 距离度量
下载PDF
空间数据质量模型研究 被引量:35
5
作者 杜道生 王占宏 马聪丽 《中国图象图形学报(A辑)》 CSCD 2000年第7期559-562,共4页
空间数据对于地理信息系统就如同汽油对于汽车一样重要 .空间数据的质量更是地理信息系统分析结果是否准确和合理的重要因素 .因此根据质量评价方法的不同 ,提出了相应的空间数据质量模型 ,并进而提出空间数据质量的度量模型 ,这对科学... 空间数据对于地理信息系统就如同汽油对于汽车一样重要 .空间数据的质量更是地理信息系统分析结果是否准确和合理的重要因素 .因此根据质量评价方法的不同 ,提出了相应的空间数据质量模型 ,并进而提出空间数据质量的度量模型 ,这对科学、合理地进行数据质量评定及准确。 展开更多
关键词 空间数据 质量度量 地理信息系统 质量模型
下载PDF
GPS-RTK的技术方法探讨与对策 被引量:41
6
作者 杨文府 崔玉柱 《测绘工程》 CSCD 2008年第4期50-53,共4页
对GPS-RTK的测量原理、误差分析及参数转换等进行简要阐述,并介绍GPS-RTK高程测量的方法。通过高精度全站仪观测数据与GPS-RTK高程数据进行分析、比较,指出在GPS-RTK高程测量中应该注意的问题,并针对生产实践中存在的作业问题,找出提高G... 对GPS-RTK的测量原理、误差分析及参数转换等进行简要阐述,并介绍GPS-RTK高程测量的方法。通过高精度全站仪观测数据与GPS-RTK高程数据进行分析、比较,指出在GPS-RTK高程测量中应该注意的问题,并针对生产实践中存在的作业问题,找出提高GPS-RTK高程测量精度的有效措施,旨在增广GPS-RTK技术的应用前景,提高其测量成果的精度。 展开更多
关键词 GPS-RTK数据分析 高程精度 有效措施
下载PDF
一种基于信息熵的混合数据属性加权聚类算法 被引量:43
7
作者 赵兴旺 梁吉业 《计算机研究与发展》 EI CSCD 北大核心 2016年第5期1018-1028,共11页
同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首... 同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首先为了更加准确客观地度量对象与类之间的差异性,设计了针对混合数据的扩展欧氏距离;然后,在信息熵框架下利用类内信息熵和类间信息熵给出了聚类结果中类内抱团性及一个类与其余类分离度的统一度量机制,并基于此给出了一种属性重要性度量方法,进而设计了一种基于信息熵的属性加权混合数据聚类算法.在10个UCI数据集上的实验结果表明,提出的算法在4种聚类评价指标下优于传统的属性未加权聚类算法和已有的属性加权聚类算法,并通过统计显著性检验表明本文提出算法的聚类结果与已有算法聚类结果具有显著差异性. 展开更多
关键词 聚类分析 混合数据 属性加权 信息熵 相异性度量
下载PDF
包含度与粗糙集数据分析中的度量 被引量:23
8
作者 梁吉业 徐宗本 李月香 《计算机学报》 EI CSCD 北大核心 2001年第5期544-547,共4页
粗糙集理论是一种新的处理模糊和不确定知识的软计算工具 .粗糙集数据分析是粗糙集理论中的主要应用技术之一 ,它主要用来分析数据的性质、粗糙分类、分析属性的依赖性和属性的重要性、抽取决策规则等 ,在人工智能与认知科学领域有着重... 粗糙集理论是一种新的处理模糊和不确定知识的软计算工具 .粗糙集数据分析是粗糙集理论中的主要应用技术之一 ,它主要用来分析数据的性质、粗糙分类、分析属性的依赖性和属性的重要性、抽取决策规则等 ,在人工智能与认知科学领域有着重要的应用 .该文通过将包含度概念引入到粗糙集理论中 ,建立了包含度与粗糙集数据分析中的度量之间的关系 ,证实了粗糙集数据分析中的有关度量均可归结为包含度 .这些结论有助于人们深刻理解粗糙集数据分析的本质 。 展开更多
关键词 粗糙集 包含度 数据分析 度量 人工智能
下载PDF
基于形态的时间序列相似性度量研究 被引量:34
9
作者 董晓莉 顾成奎 王正欧 《电子与信息学报》 EI CSCD 北大核心 2007年第5期1228-1231,共4页
时间序列重新描述和相似性度量是时间序列数据挖掘的研究基础,对提高挖掘任务的效率和准确性至关重要。该文提出了一种新的基于形态的时间序列符号描述,并给出相应的距离公式,以度量时间序列的相似性。该方法直观简洁,对数据的平移、伸... 时间序列重新描述和相似性度量是时间序列数据挖掘的研究基础,对提高挖掘任务的效率和准确性至关重要。该文提出了一种新的基于形态的时间序列符号描述,并给出相应的距离公式,以度量时间序列的相似性。该方法直观简洁,对数据的平移、伸缩不敏感,能够反映序列趋势变化的程度、去除噪声的影响,满足时间多分辨率要求。仿真结果表明,该方法具有较好的聚类性能,可以在不同分辨率下有效度量时间序列的形态相似性。 展开更多
关键词 时间序列 数据挖掘 相似性度量 重新描述
下载PDF
基于样本数据处理和ADABOOST的小电流接地故障选线 被引量:37
10
作者 陈奎 韦晓广 +1 位作者 陈景波 牛俊萍 《中国电机工程学报》 EI CSCD 北大核心 2014年第34期6228-6237,共10页
针对零序暂态分量的特点以及现有的信息融合技术在小电流接地故障选线中具有样本数据不均衡、维数灾难和经验风险高的缺陷,分析选线样本的特性,提出基于样本数据处理和ADABOOST法的小电流接地故障选线的新方法。首先,通过经验模态分解... 针对零序暂态分量的特点以及现有的信息融合技术在小电流接地故障选线中具有样本数据不均衡、维数灾难和经验风险高的缺陷,分析选线样本的特性,提出基于样本数据处理和ADABOOST法的小电流接地故障选线的新方法。首先,通过经验模态分解和快速傅里叶变换对零序信号进行故障特征提取,然后利用故障特征建立线路故障测度和利用信息增益度建立方法故障测度,进一步通过主成分分析法对故障特征样本进行降维处理以及利用SMOTE采样法处理样本的不均衡性,最后将处理后的数据运用ADABOOST进行综合选线。通过系统模型仿真,验证了主成分分析法和SMOTE采样法对样本数据处理的合理性以及利用ADABOOST选线的有效性,结果表明所提方法应用于选线具有较高的准确率和灵敏度。 展开更多
关键词 小电流接地故障 样本数据 经验模态分解 故障测度 信息增益度 主成分分析法
下载PDF
一种改进的Apriori算法 被引量:35
11
作者 刘维晓 陈俊丽 +1 位作者 屈世富 万旺根 《计算机工程与应用》 CSCD 北大核心 2011年第11期149-151,159,共4页
针对Apriori算法对数据库的扫描次数过多、系统的I/O负载大和产生大量的无关中间项集等弊端,提出了一种改进的Apriori算法。该算法通过加入用户兴趣项,减少候选项集的产生;打破了传统的算法实现步骤减少了数据库的扫描次数,降低了系统I/... 针对Apriori算法对数据库的扫描次数过多、系统的I/O负载大和产生大量的无关中间项集等弊端,提出了一种改进的Apriori算法。该算法通过加入用户兴趣项,减少候选项集的产生;打破了传统的算法实现步骤减少了数据库的扫描次数,降低了系统I/O负载;构建了用户兴趣度模型增加了算法生成强关联规则的可读性,提高了算法的效率。实验表明,改进的Apriori算法能有效地提高运行速度和效率。 展开更多
关键词 数据挖掘 关联规则 兴趣项 兴趣度 模型
下载PDF
基于项目属性和云填充的协同过滤推荐算法 被引量:25
12
作者 孙金刚 艾丽蓉 《计算机应用》 CSCD 北大核心 2012年第3期658-660,668,共4页
传统协同过滤推荐算法中经常因用户评分矩阵极端稀疏而导致相似性度量方法不准,推荐质量不高,针对这一问题,提出一种基于项目属性和云填充的协同过滤推荐算法。利用云模型对用户评分矩阵进行填充,在填充矩阵基础上,利用传统的相似性计... 传统协同过滤推荐算法中经常因用户评分矩阵极端稀疏而导致相似性度量方法不准,推荐质量不高,针对这一问题,提出一种基于项目属性和云填充的协同过滤推荐算法。利用云模型对用户评分矩阵进行填充,在填充矩阵基础上,利用传统的相似性计算方法得到项目之间的评分相似性,同时结合项目属性,计算项目的属性相似性,通过加权因子得到项目的最终相似性,从而形成一种新的相似性度量方法。实验结果表明,提出的算法可有效解决传统方法中由于数据稀疏所导致的相似性度量不准确的问题,并显著地提高了算法的推荐精度。 展开更多
关键词 协同过滤 稀疏数据 云填充 评分相似性 属性相似性 相似性度量
下载PDF
利用相似性度量的不同比例尺地图数据网状要素匹配算法 被引量:25
13
作者 安晓亚 孙群 尉伯虎 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2012年第2期224-228,241,共6页
提出了一种基于相似性度量的不同比例尺地图数据网状要素匹配算法。首先进行结点、弧段的粗匹配,然后利用结点-弧段拓扑关系的相似性和离散Fréchet距离进行精确匹配,匹配过程将几何、语义、拓扑、结点和弧段匹配有效结合起来,最后... 提出了一种基于相似性度量的不同比例尺地图数据网状要素匹配算法。首先进行结点、弧段的粗匹配,然后利用结点-弧段拓扑关系的相似性和离散Fréchet距离进行精确匹配,匹配过程将几何、语义、拓扑、结点和弧段匹配有效结合起来,最后以可视化方式将不同匹配结果进行显示,以便人机交互。实验表明,该算法可有效地匹配各种复杂情况下的同名道路,并提高匹配的正确率和速度。 展开更多
关键词 数据集成 相似性度量 地图匹配 HAUSDORFF距离 离散Fréchet距离
原文传递
基于信噪比的多传感器数据融合方法 被引量:22
14
作者 万树平 《传感技术学报》 CAS CSCD 北大核心 2008年第1期178-181,共4页
针对多个传感器对某一特性指标进行多次测量实验的数据融合问题,提出了一种基于信噪比的多传感器数据融合方法。该方法首先视各传感器的测量值为模糊集合,利用模糊集合中的最大最小贴近度来度量不同传感器测量值之间的相近程度,其次给... 针对多个传感器对某一特性指标进行多次测量实验的数据融合问题,提出了一种基于信噪比的多传感器数据融合方法。该方法首先视各传感器的测量值为模糊集合,利用模糊集合中的最大最小贴近度来度量不同传感器测量值之间的相近程度,其次给出了不同时刻各传感器的一致性测度,然后基于信噪比定义了一致可靠性测度,最后利用一致可靠性测度得到传感器数据的融合公式。应用实例验证了该方法的有效性。同时,通过与平均值法和可靠性融合法的比较分析,表明该方法具有较好的稳健性。 展开更多
关键词 多传感器 数据融合 信噪比 可靠性测度
下载PDF
基于分布信息融合的直流锅炉燃料量信号重构 被引量:15
15
作者 于达仁 范轶 徐志强 《中国电机工程学报》 EI CSCD 北大核心 2004年第2期191-195,共5页
通过对超临界直流锅炉燃料量间接测量信号频谱特性的研究,指出了不同信号具有互补的频谱特性。基于广义观测器结构,利用分布信息的互补特性设计了分布信息融合算法。该文利用沿流程各汽温信号稳态精度高和给粉信号响应速度快的互补特性... 通过对超临界直流锅炉燃料量间接测量信号频谱特性的研究,指出了不同信号具有互补的频谱特性。基于广义观测器结构,利用分布信息的互补特性设计了分布信息融合算法。该文利用沿流程各汽温信号稳态精度高和给粉信号响应速度快的互补特性,经过信息融合,解决了给粉量测量的困难,提高了测量的快速性和准确性,从而有效地提高了直流锅炉机组燃水比调节系统的控制品质。通过对融合算法鲁棒性研究。 展开更多
关键词 超临界直流锅炉 燃料量 信号重构 信息融合 控制系统 分布参数特性
下载PDF
对标管理成功经验浅析 被引量:19
16
作者 曹建兵 厉剑梁 +1 位作者 赵作起 齐放 《华电技术》 CAS 2008年第12期1-5,17,共6页
根据华电包头发电有限公司2008年上半年与2007年同期大指标数据,从发电量、厂用电率、综合厂用电率、发电煤耗、供电煤耗、综合供电煤耗、利用小时、油耗等方面分析了各项指标变化的原因以及所采取的措施,对"对标管理年"中各... 根据华电包头发电有限公司2008年上半年与2007年同期大指标数据,从发电量、厂用电率、综合厂用电率、发电煤耗、供电煤耗、综合供电煤耗、利用小时、油耗等方面分析了各项指标变化的原因以及所采取的措施,对"对标管理年"中各项指标的落实情况进行了年中总结,利于在下半年更好地开展工作以完成年度指标,并在对照先进,查错纠弊,持续改进的过程中不断提高生产运营指标水平。 展开更多
关键词 对标管理 数据比较 有效措施 成功经验
下载PDF
微阵列数据癌症分类问题中的基因选择 被引量:19
17
作者 张丽娟 李舟军 《计算机研究与发展》 EI CSCD 北大核心 2009年第5期794-802,共9页
微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因、相对少量(往往不足一百)的样本.在这成千上万的基因中,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来... 微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因、相对少量(往往不足一百)的样本.在这成千上万的基因中,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来说,最重要的一个问题就是识别出对癌症分类最有贡献的基因.这一识别过程称为基因选择.基因选择在统计模式识别、机器学习和数据挖掘领域已得到广泛研究.介绍基因选择问题所涉及到的相关背景知识和基本概念;全面地回顾统计学、机器学习和数据挖掘领域对基因选择问题的解决方法;通过实验展示了几种典型算法在微阵列数据上的性能;指出当前存在的问题和未来的研究方向. 展开更多
关键词 基因选择 微阵列数据 癌症分类 属性相关性 相关性度量
下载PDF
对聚类算法普遍存在问题的解决办法 被引量:10
18
作者 姜园 张朝阳 +1 位作者 仇佩亮 戚玉鹏 《电路与系统学报》 CSCD 2004年第3期92-99,共8页
聚类广泛应用于统计、机器学习、模式识别、数据分析等领域并越来越受重视。本文研究了各种聚类算法共同面临的五个问题:聚类效果评估、类数目估计、数据预处理、样本间相似性测量、抗干扰性能,分析了对这些问题的有代表性的解决方法,... 聚类广泛应用于统计、机器学习、模式识别、数据分析等领域并越来越受重视。本文研究了各种聚类算法共同面临的五个问题:聚类效果评估、类数目估计、数据预处理、样本间相似性测量、抗干扰性能,分析了对这些问题的有代表性的解决方法,总结并预测了未来聚类算法在这五个方面的研究方向。 展开更多
关键词 聚类 效果评估 类数目估计 预处理 相似性测量 抗干扰性能
下载PDF
医院数据质量改进措施研究 被引量:17
19
作者 周彬 赵雪飞 +2 位作者 刘炜 李为 庄伟 《医学与社会》 北大核心 2020年第12期32-36,共5页
国家信息惠民便民等医改政策能否落地,基础在于数据利用。我国医院的各项业务均有信息系统支撑,但由于为业务所驱动,又缺乏顶层设计,卫生信息标准相对滞后,医院的数据条块割据、质量不高,致使医院在医疗质控、医保控费、医学研究及各类... 国家信息惠民便民等医改政策能否落地,基础在于数据利用。我国医院的各项业务均有信息系统支撑,但由于为业务所驱动,又缺乏顶层设计,卫生信息标准相对滞后,医院的数据条块割据、质量不高,致使医院在医疗质控、医保控费、医学研究及各类评级评价等工作中难以取得实效。医院在由数字化向智慧化转型过程中,应用管理资产的思想来管理数据,依照国家卫生信息标准,运用技术手段,结合行政规范,开展数据治理,改造信息系统,持续提高数据质量,使医院数据资产的应用价值最大化。 展开更多
关键词 医院 数据 数据质量 改进措施
下载PDF
大数据质量测度模型构建 被引量:17
20
作者 莫祖英 《情报理论与实践》 CSSCI 北大核心 2018年第3期11-15,共5页
文章将大数据质量分为原始质量、过程质量和结果质量,并根据不同的数据处理阶段分析其质量测度指标,通过专家打分计算各指标的权重值,从而构建大数据质量的测度模型。研究发现,大数据结果质量的重要性程度明显高于原始质量和过程质量,... 文章将大数据质量分为原始质量、过程质量和结果质量,并根据不同的数据处理阶段分析其质量测度指标,通过专家打分计算各指标的权重值,从而构建大数据质量的测度模型。研究发现,大数据结果质量的重要性程度明显高于原始质量和过程质量,说明大数据质量的重点在于面向应用的结果质量上,而结果质量的形成离不开原始质量和过程质量的保障。大数据质量测度是实施大数据质量管理与控制的重要基础。 展开更多
关键词 数据质量 信息测度 指标分析 大数据 模型
原文传递
上一页 1 2 26 下一页 到第
使用帮助 返回顶部