期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
人工神经网络在数据挖掘中的应用 被引量:14
1
作者 韩彦峰 段向前 《西安建筑科技大学学报(自然科学版)》 CSCD 北大核心 2005年第1期121-124,共4页
在分析了现行数据挖掘方法后,介绍一种基于数据库的挖掘方法—人工神经网络(ArtificialNeuralNetwork)方法,通过对数库据中数据样本的学习,自动发现隐含的大量知识,具体给出了神经网络方法的学习模型和算法.该方法丰富了数据挖掘工具,... 在分析了现行数据挖掘方法后,介绍一种基于数据库的挖掘方法—人工神经网络(ArtificialNeuralNetwork)方法,通过对数库据中数据样本的学习,自动发现隐含的大量知识,具体给出了神经网络方法的学习模型和算法.该方法丰富了数据挖掘工具,使定性变量和复杂、动态数据的科学处理成为现实. 展开更多
关键词 人工神经网络 样本 数据挖掘
下载PDF
Model of Combined Transport of Perishable Foodstuffs and Safety Inspection Based on Data Mining 被引量:5
2
作者 Tongjuan Liu Anqi Hu 《Food and Nutrition Sciences》 2017年第7期760-777,共18页
There is still no effective means to analyze in depth and utilize domestic mass data about agricultural product quality safety tests in china now. The neural network algorithm, the classification regression tree algor... There is still no effective means to analyze in depth and utilize domestic mass data about agricultural product quality safety tests in china now. The neural network algorithm, the classification regression tree algorithm, the Bayesian network algorithm were selected according to the principle of selecting combination model and were used to build models respectively and then combined, innovatively establishing a combination model which has relatively high precision, strong robustness and better explanatory to predict the results of perishable food transportation meta-morphism monitoring. The relative optimal prediction model of the perishable food transportation metamorphism monitoring system could be got. The relative perfect prediction model can guide the actual sampling work about food quality and safety by prognosticating the occurrence of unqualified food to select the typical and effective samples for test, thus improving the efficiency and effectiveness of sampling work effectively, so as to avoid deteriorated perishable food’s approaching the market to ensure the quality and safety of perishable food transportation. A solid protective wall was built in the protection of general perishable food consumers’ health. 展开更多
关键词 PERISHABLE FOODSTUFFS Transport Monitoring DADA mining sample Detection Neural NETWORK the Classification and Regression Tree Algorithm (CART) Bayesian NETWORK
下载PDF
面向密度分布不均数据的加权逆近邻密度峰值聚类算法
3
作者 吕莉 陈威 +2 位作者 肖人彬 韩龙哲 谭德坤 《智能系统学报》 CSCD 北大核心 2024年第1期165-175,共11页
针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首... 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。 展开更多
关键词 密度峰值聚类 密度分布不均 逆近邻 共享逆近邻 样本相似度 局部密度 分配策略 数据挖掘
下载PDF
面向流形数据的共享近邻密度峰值聚类算法 被引量:1
4
作者 赵嘉 马清 +2 位作者 肖人彬 潘正祥 韩龙哲 《智能系统学报》 CSCD 北大核心 2023年第4期719-730,共12页
流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(dens... 流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearest neighbor for manifold datasets,DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式,使得同一流形类簇样本间的相似度尽可能高;基于上述相似度定义局部密度,不忽略距类簇中心较远样本的密度贡献,能更好地区分出流形类簇的类簇中心与其他样本;根据样本的相似度分配剩余样本,避免了样本的连续误分配。DPC-SNN算法与DPC、FKNNDPC、FNDPC、DPCSA及IDPC-FA算法的对比实验结果表明,DPC-SNN算法能够有效发现流形数据的类簇中心并准确完成聚类,对真实以及人脸数据集也有不错的聚类效果。 展开更多
关键词 密度峰值 聚类分析 流形数据 K近邻 共享近邻 样本相似度 数据挖掘 图像处理
下载PDF
数据挖掘中采样技术的研究 被引量:5
5
作者 郑吉平 秦小麟 《系统工程与电子技术》 EI CSCD 北大核心 2005年第11期1946-1949,共4页
针对日益增长的海量数据和信息,通常采取有效的采样技术对大数据集进行采样,然后通过对样本的分析得到数据总体的相关模式。首先论述了关于样本的一些基本概念:利用采样技术对大数据集和海量数据进行分析处理,讨论了普通抽样技术与数据... 针对日益增长的海量数据和信息,通常采取有效的采样技术对大数据集进行采样,然后通过对样本的分析得到数据总体的相关模式。首先论述了关于样本的一些基本概念:利用采样技术对大数据集和海量数据进行分析处理,讨论了普通抽样技术与数据挖掘中的采样技术的异同。然后对目前普遍采用的采样技术进行了分类,重点研究了简单随机采样和分层随机采样,并对不同采样技术进行了比较。最后给出数据挖掘中利用采样技术的一个实现。 展开更多
关键词 样本 简单随机采样 分层随机采样 数据挖掘 模式
下载PDF
基于样本加权模糊聚类的土壤重金属污染溯源
6
作者 陈志奎 李丽方 林聃 《工业安全与环保》 2023年第6期95-99,共5页
由于土壤数据的复杂性,现有的方法难以对土壤重金属进行高效溯源,为了解决这个问题,基于样本加权的模糊聚类算法建立了一种新的重金属污染溯源模型,该模型使用一种新的相似度计算方法来构建模糊相似矩阵,将聚类结果与土壤重金属污染来... 由于土壤数据的复杂性,现有的方法难以对土壤重金属进行高效溯源,为了解决这个问题,基于样本加权的模糊聚类算法建立了一种新的重金属污染溯源模型,该模型使用一种新的相似度计算方法来构建模糊相似矩阵,将聚类结果与土壤重金属污染来源表相结合,可以快速确定土壤重金属的污染来源。通过与欧式距离、皮尔逊相关系数、余弦相似度等相似度计算方法在天津市武清区数据集上的对比实验验证了所提出方法的有效性与可用性,结果表明,该方法可用于土壤重金属污染源解析方面的工作。 展开更多
关键词 重金属污染溯源 模糊聚类 样本加权 数据挖掘
下载PDF
基于IADSA深度迁移网络的金属表面缺陷检测
7
作者 宿磊 王立建 +3 位作者 祁阳 张思雨 顾杰斐 李可 《机械工程学报》 EI CAS CSCD 北大核心 2023年第24期46-55,共10页
针对领域偏移环境下金属表面缺陷检测精度不高的问题,提出一种基于改进对抗性域分离与自适应(Improved adversarial domain separation and adaptation,IADSA)深度迁移网络的金属表面缺陷检测方法。首先,建立基于分类损失的IADSA模型性... 针对领域偏移环境下金属表面缺陷检测精度不高的问题,提出一种基于改进对抗性域分离与自适应(Improved adversarial domain separation and adaptation,IADSA)深度迁移网络的金属表面缺陷检测方法。首先,建立基于分类损失的IADSA模型性能评价机制,感知模型训练状态,利用空间线性插值方法自适应挖掘迁移空间隐藏的样本信息,以提升网络的特征提取能力;然后,将挖掘的新样本的分类结果作为衡量其对网络贡献性能的主要度量指标,并将贡献性能作为权重应用在分类损失上,旨在消除噪声样本对模型造成的影响;在对抗训练过程中,通过添加动态权重优化对抗损失、平滑网络参数,提高模型的判别性能;最后,融合原始样本与新样本的任务分类器、域分离鉴别器以及域适应鉴别器的损失,利用动态训练实现金属表面缺陷检测。试验结果表明,与其他无监督域自适应方法相比,所提方法实现了更高的金属表面缺陷检测精度。 展开更多
关键词 金属表面缺陷检测 无监督域自适应 域对抗迁移 样本挖掘 动态加权
原文传递
Multi-Scaling Sampling: An Adaptive Sampling Method for Discovering Approximate Association Rules 被引量:2
8
作者 Cai-YanJia Xie-PingGao 《Journal of Computer Science & Technology》 SCIE EI CSCD 2005年第3期309-318,共10页
One of the obstacles of the efficient association rule mining is theexplosive expansion of data sets since it is costly or impossible to scan large databases, esp., formultiple times. A popular solution to improve the... One of the obstacles of the efficient association rule mining is theexplosive expansion of data sets since it is costly or impossible to scan large databases, esp., formultiple times. A popular solution to improve the speed and scalability of the association rulemining is to do the algorithm on a random sample instead of the entire database. But how toeffectively define and efficiently estimate the degree of error with respect to the outcome of thealgorithm, and how to determine the sample size needed are entangling researches until now. In thispaper, an effective and efficient algorithm is given based on the PAC (Probably Approximate Correct)learning theory to measure and estimate sample error. Then, a new adaptive, on-line, fast samplingstrategy - multi-scaling sampling - is presented inspired by MRA (Multi-Resolution Analysis) andShannon sampling theorem, for quickly obtaining acceptably approximate association rules atappropriate sample size. Both theoretical analysis and empirical study have showed that the Samplingstrategy can achieve a very good speed-accuracy trade-off. 展开更多
关键词 data mining association rule frequent itemset sample error multi-scalingsampling
原文传递
检测数据和专家知识混合驱动的小样本飞机结构件装配粗差判定 被引量:3
9
作者 朱永国 邓斌 +1 位作者 霍正书 马国祥 《计算机集成制造系统》 EI CSCD 北大核心 2021年第12期3462-3474,共13页
航空航天产品铆接变形、多层级耦合装配等多因素影响导致其装配偏差不确定度大,装配粗差难以准确识别。为此,针对小批量飞机研制模式,引入测量信息论中的聚类分析法和基于不确定性理论的直觉模糊熵法,提出检测数据和专家知识混合驱动的... 航空航天产品铆接变形、多层级耦合装配等多因素影响导致其装配偏差不确定度大,装配粗差难以准确识别。为此,针对小批量飞机研制模式,引入测量信息论中的聚类分析法和基于不确定性理论的直觉模糊熵法,提出检测数据和专家知识混合驱动的小样本飞机结构件装配粗差判定方法。首先,利用系统聚类法建立装配偏差测量数据聚类分析数学模型,用欧式距离来量化装配质量检测数据之间的相似度,引入组平均连锁量化检测数据类之间的相似度,进行装配粗差的预筛选。其次,提出加权直觉模糊熵的装配偏差置信区间判定方法。用精确数量化专家之间判定信息的直觉模糊相似度,进行装配偏差置信区间的合理性评估。最后,对数据挖掘和专家知识进行融合,综合识别出装配粗差。通过装配应用案例验证了检测数据和知识混合驱动的飞机结构件装配粗差判定方法的准确性和计算可行性,与经典的格拉布斯粗差判定准则相比,粗差识别准确率提高了12.5%。 展开更多
关键词 飞机结构件 装配 小样本 粗差 知识 数据挖掘
下载PDF
面向非均衡数据类的朴素贝叶斯改进算法 被引量:3
10
作者 谭志 侯涛文 《现代电子技术》 北大核心 2019年第9期118-122,共5页
针对朴素贝叶斯分类器存在对非均衡样本分类时,易将少数类样本分到多数类的问题,利用感受性曲线的性质和深度特征加权的思想,提出一种面向非均衡数据类的朴素贝叶斯加权算法(DA-WNB)。为了验证该算法对不平衡数据分类的有效性,实验结果... 针对朴素贝叶斯分类器存在对非均衡样本分类时,易将少数类样本分到多数类的问题,利用感受性曲线的性质和深度特征加权的思想,提出一种面向非均衡数据类的朴素贝叶斯加权算法(DA-WNB)。为了验证该算法对不平衡数据分类的有效性,实验结果以AUC、真正类率、整体精度为指标,仿真结果表明,该算法能提高少数类分类准确率(最高达60%),且能保持较高的整体精度。 展开更多
关键词 朴素贝叶斯 监督学习 感受性曲线 非均衡样本 深度特征加权 数据挖掘
下载PDF
均匀设计在数据挖掘中的应用 被引量:1
11
作者 胡学钢 于海涛 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第3期292-295,共4页
KDD以及DM技术的广泛应用,使人们从大量数据中提取知识成为可能,可是随着处理的数据库规模的不断扩大,现有的挖掘方法就显得无能为力了。文章主要将试验设计中的均匀设计思想应用于数据挖掘问题中,利用均匀设计的选点方法在已有的数据... KDD以及DM技术的广泛应用,使人们从大量数据中提取知识成为可能,可是随着处理的数据库规模的不断扩大,现有的挖掘方法就显得无能为力了。文章主要将试验设计中的均匀设计思想应用于数据挖掘问题中,利用均匀设计的选点方法在已有的数据库中挑选出具有代表意义的数据组成新的决策表,再使用已有的挖掘算法对其进行处理,得出最终的挖掘结果。 展开更多
关键词 均匀设计 抽样试验 数据挖掘
下载PDF
库捷尔泰铀矿床室内渗透性样品采集及应用 被引量:2
12
作者 任满船 周勇 李晓红 《新疆地质》 CAS CSCD 北大核心 2010年第3期319-322,共4页
库捷尔泰矿床是典型的水成铀矿床,赋矿主岩为砂岩,矿体呈卷状,两翼矿石局部地段难以开采,因此开采评价时,必须区分矿体与围岩的渗透性,以确定开采有利地段,便于确定开采方法及布置开采工程.本文从该区A号勘探线含水层渗透性测试结果入手... 库捷尔泰矿床是典型的水成铀矿床,赋矿主岩为砂岩,矿体呈卷状,两翼矿石局部地段难以开采,因此开采评价时,必须区分矿体与围岩的渗透性,以确定开采有利地段,便于确定开采方法及布置开采工程.本文从该区A号勘探线含水层渗透性测试结果入手,对整个含水层各细层逐一解剖,划分出该勘探线开采有利地段,为地浸法开采铀矿资源提供了地质依据. 展开更多
关键词 室内测试 渗透性 地浸开采 易采段
下载PDF
基于数据挖掘的住院患者静脉采血差错预测模型构建 被引量:1
13
作者 梁世耀 许多 徐小群 《医院管理论坛》 2022年第7期31-35,共5页
目的分析静脉采血差错风险事件发生的危险因素,制定防范对策,确保患者安全。方法采用回顾性对照研究对静脉采血差错事件进行单因素及多因素Logistic回归,构建预测模型。结果护士职称、护龄,患者年龄,交接班时段、班次和科室是静脉采血... 目的分析静脉采血差错风险事件发生的危险因素,制定防范对策,确保患者安全。方法采用回顾性对照研究对静脉采血差错事件进行单因素及多因素Logistic回归,构建预测模型。结果护士职称、护龄,患者年龄,交接班时段、班次和科室是静脉采血差错事件的影响因素(p<0.05)。构建静脉采血差错事件风险预测模型,通过绘制计算ROC曲线下面积(AUC)验证模型的预测能力(AUC﹥0.7)。结论构建静脉采血差错事件预测模型可为临床静脉采血规避潜在护理风险,对提高护理安全具有一定的临床借鉴意义。 展开更多
关键词 静脉采血 标本差错 数据挖掘 预测模型
下载PDF
抽样技术在序列模式增量更新中的应用 被引量:2
14
作者 郭志勇 杨炳儒 王璐 《微计算机信息》 北大核心 2006年第08X期4-6,共3页
在这篇文章中,我们提出了一种应用抽样的技术于序列挖掘的算法。这个方法能在原始数据库和更新后的数据库之间评价序列模式的变化。评价了序列模式的变化我们能决定何时使用精确的挖掘算法或增量算法:如果变化达到一定程度,就使用精确... 在这篇文章中,我们提出了一种应用抽样的技术于序列挖掘的算法。这个方法能在原始数据库和更新后的数据库之间评价序列模式的变化。评价了序列模式的变化我们能决定何时使用精确的挖掘算法或增量算法:如果变化达到一定程度,就使用精确的方法以挖掘新的序列模式;如果变化比较小,则在一定的可信度情况下,就使用原来的模式,且误差能控制在一定的范围内。 展开更多
关键词 抽样 数据挖掘 序列 置信区间
下载PDF
大数据背景下数学建模教学改革的思考 被引量:2
15
作者 於遒 郭海兵 《江苏教育研究(职教)(C版)》 2018年第5期74-76,共3页
大数据的五V特征对数学建模教学产生新的冲击,这表现在课程目标、课程内容、教学手段等方面。面对样本数据收集的信息化、自动化、全样本和大数据化,课程应更加侧重于发现海量数据下各种关联细节的相关分析能力的培养;在教学内容上,应... 大数据的五V特征对数学建模教学产生新的冲击,这表现在课程目标、课程内容、教学手段等方面。面对样本数据收集的信息化、自动化、全样本和大数据化,课程应更加侧重于发现海量数据下各种关联细节的相关分析能力的培养;在教学内容上,应增加反映兼顾大数据和信息技术特点的数据挖掘内容和环节;在教学手段上,数学软件的应用及编程能力的强化应成为数学建模必不可少的手段之一。 展开更多
关键词 数学建模 大数据 全样本 数据挖掘 编程能力
下载PDF
Pushing Multiple Convertible Constrains into Frequent Itemsets Mining
16
作者 SONG Baoli QIN Zheng 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1120-1125,共6页
Constraint pushing techniques have been developed for mining frequent patterns and association rules. How ever, multiple constraints cannot be handled with existing techniques in frequent pattern mining. In this paper... Constraint pushing techniques have been developed for mining frequent patterns and association rules. How ever, multiple constraints cannot be handled with existing techniques in frequent pattern mining. In this paper, a new algorithm MCFMC (mining complete set of frequent itemsets with multiple constraints) is introduced. The algorithm takes advantage of the fact that a convertible constraint can be pushed into mining algorithm to reduce mining research spaces. By using a sample database, the algorithm develops techniques which select an optimal method based on a sample database to convert multiple constraints into multiple convert ible constraints, disjoined by conjunction and/or, and then partition these constraints into two parts. One part is pushed deep inside the mining process to reduce the research spaces for frequent itemsets, the other part that cannot be pushed in algorithm is used to filter the complete set of frequent itemsets and get the final result. Results from our detailed experi ment show the feasibility and effectiveness of the algorithm. 展开更多
关键词 convertible constraints data mining multiple constraints sample database
下载PDF
Study on Complete Analysis of LRE Test Samples Based on PCA 被引量:1
17
作者 王珉 胡茑庆 《Journal of Measurement Science and Instrumentation》 CAS 2011年第3期217-221,共5页
Incomplete data samples have a serious impact on the effectiveness of data mining.Aiming at the LRE historical test samples,based on correlation analysis of condition parameter,this paper introduced principle componen... Incomplete data samples have a serious impact on the effectiveness of data mining.Aiming at the LRE historical test samples,based on correlation analysis of condition parameter,this paper introduced principle component analysis(PCA)and proposed a complete analysis method based on PCA for incomplete samples.At first,the covariance matrix of complete data set was calculated;Then,according to corresponding eigenvalues which were in descending,a principle matrix composed of eigen-vectors of covariance matrix was made;Finally,the vacant data was estimated based on the principle matrix and the known data.Compared with traditional method validated the method proposed in this paper has a better effect on complete test samples.An application example shows that the method suggested in this paper can update the value in use of historical test data. 展开更多
关键词 test sample data mining correlation analysis PCA complete analysis
下载PDF
程序敏感的模糊测试样本生成方法 被引量:1
18
作者 许朴 舒辉 于颖超 《计算机工程与设计》 北大核心 2020年第12期3368-3375,共8页
为增加模糊测试工具对程序的感知能力,提高样本变异效率,有效提高代码覆盖率,在原有基于覆盖率反馈基础上,提出一种结合污点分析技术的混合模糊测试样本生成手段。利用污点分析感知程序中对魔数、哈希、类型数据字段的格式检验,辅助样... 为增加模糊测试工具对程序的感知能力,提高样本变异效率,有效提高代码覆盖率,在原有基于覆盖率反馈基础上,提出一种结合污点分析技术的混合模糊测试样本生成手段。利用污点分析感知程序中对魔数、哈希、类型数据字段的格式检验,辅助样本生成;采用共享生成样本的方式,与传统模糊测试工具相结合实现混合模糊测试;基于以上思路,实现混合模糊测试工具taint_fuzz,对现实使用的图像和音频解析程序(audiofile、exiv2、libav)进行测试,挖掘到多个漏洞,以此申请到5个CVE编号。测试结果表明,taint_fuzz能够有效减少对初始样本的依赖,提高代码覆盖率和漏洞触发数。 展开更多
关键词 污点分析 混合模糊测试 样本生成 格式检验 漏洞挖掘
下载PDF
矿井安全辅助决策系统的设计与实现 被引量:1
19
作者 董婷 《电子设计工程》 2013年第21期52-53,57,共3页
在研究矿井安全辅助决策系统的模型中,以矿井安全监测系统中的自然灾害信息为数据样本,采用数据挖掘中的关联规则算法,对已有的影响矿井安全生产状态的自然因素构建回归模型,对以后的矿井安全生产状态做出预测,并做出评估。
关键词 数据样本 数据挖掘 关联规则 回归模型
下载PDF
基于背景知识的关联规则挖掘算法研究
20
作者 赵旭俊 张继福 《通讯和计算机(中英文版)》 2005年第6期11-18,40,共9页
为了解决传统算法中存在的频繁模式集生成的瓶颈问题,本文将启发式背景知识和归纳背景知识同时运用在频繁模式的生成过程中,提出了一种基于背景知识的关联规则挖掘算法BasedBackground。该算法不仅通过启发式背景知识,有效降低了模... 为了解决传统算法中存在的频繁模式集生成的瓶颈问题,本文将启发式背景知识和归纳背景知识同时运用在频繁模式的生成过程中,提出了一种基于背景知识的关联规则挖掘算法BasedBackground。该算法不仅通过启发式背景知识,有效降低了模式的计数代价,而且通过由样本挖掘获取的归纳背景知识,有效地减少I/O代价,因此提高了挖掘的效串和质量。本文最後通过恒星光谱数据作为实验数据集,验证了该算法的有效性。 展开更多
关键词 数据挖掘 关联规则 背景知识 样本挖掘 恒星光谱数据
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部