期刊文献+
共找到134篇文章
< 1 2 7 >
每页显示 20 50 100
SMOTE过采样及其改进算法研究综述 被引量:62
1
作者 石洪波 陈雨文 陈鑫 《智能系统学报》 CSCD 北大核心 2019年第6期1073-1083,共11页
近年来不平衡分类问题受到广泛关注。SMOTE过采样通过添加生成的少数类样本改变不平衡数据集的数据分布,是改善不平衡数据分类模型性能的流行方法之一。本文首先阐述了SMOTE的原理、算法以及存在的问题,针对SMOTE存在的问题,分别介绍了... 近年来不平衡分类问题受到广泛关注。SMOTE过采样通过添加生成的少数类样本改变不平衡数据集的数据分布,是改善不平衡数据分类模型性能的流行方法之一。本文首先阐述了SMOTE的原理、算法以及存在的问题,针对SMOTE存在的问题,分别介绍了其4种扩展方法和3种应用的相关研究,最后分析了SMOTE应用于大数据、流数据、少量标签数据以及其他类型数据的现有研究和面临的问题,旨在为SMOTE的研究和应用提供有价值的借鉴和参考。 展开更多
关键词 不平衡数据分类 SMOTE 算法 K-NN 过采样 欠采样 高维数据 分类型数据
下载PDF
基于规则的分类数据离群挖掘方法研究 被引量:22
2
作者 史东辉 蔡庆生 +1 位作者 倪志伟 张春阳 《计算机研究与发展》 EI CSCD 北大核心 2000年第9期1094-1100,共7页
离群数据的挖掘 (outlier mining,简称离群挖掘 )是数据挖掘的重要内容 ,现有的离群数据挖掘算法大多对分类数据 (categorical data)缺乏有效的处理 ,提出了基于规则的分类数据离群挖掘方法 ,采用多层最大离群支持度 maxsup,搜索离群规... 离群数据的挖掘 (outlier mining,简称离群挖掘 )是数据挖掘的重要内容 ,现有的离群数据挖掘算法大多对分类数据 (categorical data)缺乏有效的处理 ,提出了基于规则的分类数据离群挖掘方法 ,采用多层最大离群支持度 maxsup,搜索离群规则 ,有效地解决了这一问题 ,用这一方法对医学流行病数据进行了各种实验 ,分析了该方法的适用范围、性能 ,验证了方法正确性 ;另外 ,实验表明 ,经过离散化后 ,基于规则的分类数据离群挖掘算法对连续性属性的数据也是有效的 . 展开更多
关键词 离散数据 离群挖掘 分类数据 流行病数据库 医学
下载PDF
基于新的距离度量的K-Modes聚类算法 被引量:46
3
作者 梁吉业 白亮 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2010年第10期1749-1755,共7页
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-... 传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-1匹配差异法的不足,既考虑了它们本身的异同,又考虑了其他相关分类属性对它们的区分性.并将提出的距离度量应用于传统K-Modes聚类算法中.通过与基于其他距离度量的K-Modes聚类算法进行实验比较,结果表明新的距离度量是更加有效的. 展开更多
关键词 聚类算法 分类属性数据 粗糙集 粗糙隶属度 距离度量
下载PDF
基于随机森林模型的分类数据缺失值插补 被引量:28
4
作者 孟杰 李春林 《统计与信息论坛》 CSSCI 2014年第9期86-90,共5页
缺失数据是影响调查问卷数据质量的重要因素,对调查问卷中的缺失值进行插补可以显著提高调查数据的质量。调查问卷的数据类型多以分类型数据为主,数据挖掘技术中的分类算法是处理属性分类问题的常用方法,随机森林模型是众多分类算法中... 缺失数据是影响调查问卷数据质量的重要因素,对调查问卷中的缺失值进行插补可以显著提高调查数据的质量。调查问卷的数据类型多以分类型数据为主,数据挖掘技术中的分类算法是处理属性分类问题的常用方法,随机森林模型是众多分类算法中精度较高的方法之一。将随机森林模型引入调查问卷缺失数据的插补研究中,提出了基于随机森林模型的分类数据缺失值插补方法,并根据不同的缺失模式探讨了相应的插补步骤。通过与其它方法的实证模拟比较,表明随机森林插补法得到的插补值准确度更优、可信度更高。 展开更多
关键词 缺失值插补 调查问卷 分类数据 随机森林 数据挖掘
下载PDF
一种大规模分类数据聚类算法及其并行实现 被引量:21
5
作者 丁祥武 郭涛 +1 位作者 王梅 金冉 《计算机研究与发展》 EI CSCD 北大核心 2016年第5期1063-1071,共9页
CLOPE算法在大规模、稀疏、高维的分类数据集的聚类上取得了很好的聚类效果.然而该算法受输入数据的顺序影响,难以获得稳定且全局最优的聚类结果.因此提出一种基于等分划分再排列思想的p-CLOPE算法对这一缺陷进行改进.在p-CLOPE算法的... CLOPE算法在大规模、稀疏、高维的分类数据集的聚类上取得了很好的聚类效果.然而该算法受输入数据的顺序影响,难以获得稳定且全局最优的聚类结果.因此提出一种基于等分划分再排列思想的p-CLOPE算法对这一缺陷进行改进.在p-CLOPE算法的每一轮迭代过程中,对输入数据集等分为p部分再排列生成不同顺序的p!份数据集,对这些数据集分别聚类并选取最优的聚类结果作为下一轮迭代的输入.为了降低上述过程的时间复杂度,提出了一种中间结果复用策略,较大程度地提高了聚类速度.最后,在Hadoop平台上实现了一个包含p-CLOPE相关算法的开源聚类工具.实验表明:p-CLOPE算法比CLOPE算法取得了更优的聚类结果.对蘑菇数据集,当CLOPE算法取得最优聚类结果时,p-CLOPE比CLOPE取得了高35.7%的收益值;在处理大量数据时,并行p-CLOPE比串行p-CLOPE极大地缩短了聚类时间,并在计算资源充足时,取得了接近p!倍的加速比. 展开更多
关键词 分类数据 CLOPE p-CLOPE 并行聚类 MAPREDUCE
下载PDF
一种基于CSA的混和属性特征大数据集聚类算法 被引量:9
6
作者 李洁 高新波 焦李成 《电子学报》 EI CAS CSCD 北大核心 2004年第3期357-362,共6页
在数据挖掘中 ,我们经常会遇到和分析大量具有数值和类属特征的数据 .然而 ,现有的大多数分类算法只能单独处理数值特征数据或类属特征数据 ,而不能分析具有两种混合属性的数据 .为此 ,本文提出一种基于克隆选择的模糊聚类新算法 ,通过... 在数据挖掘中 ,我们经常会遇到和分析大量具有数值和类属特征的数据 .然而 ,现有的大多数分类算法只能单独处理数值特征数据或类属特征数据 ,而不能分析具有两种混合属性的数据 .为此 ,本文提出一种基于克隆选择的模糊聚类新算法 ,通过改进距离测度函数将数值特征与类属特征相结合 ,从而实现具有混合属性特征数据的聚类分析 ;通过引入克隆选择算法 (CSA)实现目标函数的全局优化 .由于克隆算子能够将进化搜索与随机搜索、全局搜索和局部搜索相结合 ,因而通过对候选解进行克隆算子操作 ,能够快速得到全局最优解 .实验结果表明 。 展开更多
关键词 聚类分析 数值特征 混合属性特征 克隆选择算法 数据挖掘 模糊聚类新算法 大数据集
下载PDF
基于属性值集中度的分类数据聚类有效性内部评价指标 被引量:14
7
作者 傅立伟 武森 《工程科学学报》 EI CSCD 北大核心 2019年第5期682-693,共12页
针对分类数据,通过数据对象在属性值上的集中程度定义了新的基于属性值集中度的类内相似度(similarity based on concentration of attribute values,CONC),用于衡量聚类结果中类内各数据对象之间的相似度;通过不同类的特征属性值的差... 针对分类数据,通过数据对象在属性值上的集中程度定义了新的基于属性值集中度的类内相似度(similarity based on concentration of attribute values,CONC),用于衡量聚类结果中类内各数据对象之间的相似度;通过不同类的特征属性值的差异程度定义了基于强度向量差异的类间差异度(dissimilarity based on discrepancy of SVs,DCRP),用于衡量两个类之间的差异度.基于CONC和DCRP提出了新的分类数据聚类有效性内部评价指标(clustering validation based on concentration of attribute values,CVC),它具有以下3个特点:(1)在评价每个类内相似度时,不仅依靠类内各数据对象的特征,还考虑了整个数据集的信息;(2)采用几个特征属性值的差异评价两个类的差异度,确保评价过程不丢失有效的聚类信息,同时可以消除噪音的影响;(3)在评价类内相似度及类间差异度时,消除了数据对象个数对评价过程的影响.采用加州大学欧文分校提出的用于机器学习的数据库(UCI)进行实验,将CVC与类别效用(category utility,CU)指标、基于主观因素的分类数据指标(categorical data clustering with subjective factors,CDCS)指标和基于信息熵的内部评价指标(information entropy,IE)等内部评价指标进行对比,通过外部评价指标标准交互信息(normalized mutual information,NMI)验证内部评价效果.实验表明相对其他内部评价指标,CVC指标可以更有效地评价聚类结果.此外,CVC指标相对于NMI指标,不需要数据集以外的信息,更具实用性. 展开更多
关键词 聚类分析 聚类内部有效性评价指标 分类数据 高维数据 相似度 差异度
原文传递
一种基于GA的混合属性特征大数据集聚类算法 被引量:9
8
作者 李洁 高新波 焦李成 《电子与信息学报》 EI CSCD 北大核心 2004年第8期1203-1209,共7页
在数据挖掘中,经常会遇到和分析大量具有数值和类属特征的数据.然而,现有的大多数算法只能单独处理数值特征数据或类属特征数据,而不能分析具有混合属性的数据.为此,该文提出了一种基于GA的模糊聚类新算法,通过改进聚类目标函数将数值... 在数据挖掘中,经常会遇到和分析大量具有数值和类属特征的数据.然而,现有的大多数算法只能单独处理数值特征数据或类属特征数据,而不能分析具有混合属性的数据.为此,该文提出了一种基于GA的模糊聚类新算法,通过改进聚类目标函数将数值特征与类属特征相结合,从而实现具有混合属性特征数据的聚类分析;通过引入GA算法能够快速得到全局最优解,而且不依赖于原型初始化.实验结果表明,基于GA的新聚类算法对于处理具有混合特征的大数据集聚类问题是相当有效的. 展开更多
关键词 聚类分析 数值特征 类属特征 遗传算法
下载PDF
无人仓系统订单分批问题及K-max聚类算法 被引量:13
9
作者 李珍萍 田宇璇 +1 位作者 卜晓奇 吴凌云 《计算机集成制造系统》 EI CSCD 北大核心 2021年第5期1506-1517,共12页
为了提高订单拣选效率、降低拣选成本,研究了以自动引导小车(AGV)为搬运工具的无人仓库系统订单分批问题。分析了影响订单拣选成本和效率的两种主要因素,建立了以订单分批拣选总成本极小化为目标的整数规划模型。根据K-means聚类算法思... 为了提高订单拣选效率、降低拣选成本,研究了以自动引导小车(AGV)为搬运工具的无人仓库系统订单分批问题。分析了影响订单拣选成本和效率的两种主要因素,建立了以订单分批拣选总成本极小化为目标的整数规划模型。根据K-means聚类算法思想,结合订单分批问题的优化目标,基于每批订单中包含的商品种类和拣选每批订单需要搬运的货架信息,利用取大(max)运算符分别定义了能够反映订单拣选成本的两种类中心,以及订单到两种类中心的距离。进一步以工作人员拣选每种商品的单位成本和AGV搬运一个货架的成本为权重,构造了订单到批次(类中心)的加权距离。在此基础上设计了K-max聚类算法求解订单分批问题。采用具体算例验证了K-max聚类算法的有效性。 展开更多
关键词 无人仓 货到人 订单分批 分类型数据 取大运算 K-max聚类算法 加权距离
下载PDF
基于改进RBF神经网络的银行个人信用评级 被引量:11
10
作者 蓝润荣 程希骏 《中国科学院研究生院学报》 CAS CSCD 北大核心 2013年第3期298-303,共6页
研究RBF神经网络在个人信用评级中的应用.针对传统的RBF神经网络无法处理非数值型数据和对初始中心的选取及异常值十分敏感等问题,提出一种基于模糊K-Prototypes算法的RBF神经网络,提高了处理分类型数据及混合型数据的能力,并且改进的模... 研究RBF神经网络在个人信用评级中的应用.针对传统的RBF神经网络无法处理非数值型数据和对初始中心的选取及异常值十分敏感等问题,提出一种基于模糊K-Prototypes算法的RBF神经网络,提高了处理分类型数据及混合型数据的能力,并且改进的模糊K-Prototypes算法有助于降低模型对初始中心选取和异常值的敏感性.将改进前后的模型分别应用于商业银行的个人信贷评级中,结果表明,改进后的模型预测精度和稳健性都优于传统的RBF模型. 展开更多
关键词 RBF神经网络 模糊K-Prototypes算法 分类型数据 信用评级
下载PDF
基于相似度均值的分类数据层次聚类分析算法 被引量:11
11
作者 褚轲欣 荀亚玲 《计算机技术与发展》 2022年第11期154-163,共10页
层次聚类分析在数据挖掘与机器学习等领域是一种广泛使用的无监督学习技术,但是,由于层次聚类分析算法主要是依赖于人为设定的相似度阈值来实现聚类簇的合并或分裂,因此在没有任何先验知识时,难以设定相似度阈值。采用相似度均值以及边... 层次聚类分析在数据挖掘与机器学习等领域是一种广泛使用的无监督学习技术,但是,由于层次聚类分析算法主要是依赖于人为设定的相似度阈值来实现聚类簇的合并或分裂,因此在没有任何先验知识时,难以设定相似度阈值。采用相似度均值以及边界数据对象分配策略,提出了一种基于相似度均值的分类数据层次聚类分析算法。该算法利用相似度均值刻画数据集中数据对象分布的集中趋势以及平稳相似性度量,作为层次聚类簇合并或分裂的重要依据,给出了一种相似度均值的计算公式,从而可以自动确定相似度阈值,解决了层次聚类分析中相似度阈值参数的人为设定问题;利用相似度均值,给出了一种边界数据对象的分配策略,有效提高了边界数据对象分配的准确性及聚类质量。在UCI与人工合成数据集上的实验验证了该算法具有良好的聚类性能和抗噪性,以及相似度均值的稳定性和有效性。 展开更多
关键词 层次聚类 分类数据 相似度均值 平稳相似性度量 分配策略
下载PDF
GIS空间数据与属性数据的存储结构研究 被引量:6
12
作者 李欣 相生昌 +2 位作者 许少华 刘延军 李小红 《计算机应用研究》 CSCD 北大核心 2005年第11期64-65,68,共3页
对G IS中所涉及的各要素进行抽象,并给出其存储结构,在此基础上提出了整体G IS空间数据与属性数据的存储结构,包括逻辑存储结构和物理存储结构。采用层次模型和关系模型相结合的记录式文件系统来对空间数据和属性数据进行存取,并结合索... 对G IS中所涉及的各要素进行抽象,并给出其存储结构,在此基础上提出了整体G IS空间数据与属性数据的存储结构,包括逻辑存储结构和物理存储结构。采用层次模型和关系模型相结合的记录式文件系统来对空间数据和属性数据进行存取,并结合索引和数据字典技术加快了数据的存取速度,解决了传统G IS中空间数据和属性数据分开存储带来的问题,提高了大数据量的G IS应用的存取效率。 展开更多
关键词 GIS 空间数据 属性数据 存储结构 数据模型
下载PDF
分类数据的多目标模糊中心点聚类算法 被引量:10
13
作者 周治平 朱书伟 张道文 《计算机研究与发展》 EI CSCD 北大核心 2016年第11期2594-2606,共13页
针对传统面向分类属性数据的聚类算法大多是对单一指标优化而存在的局限性,将类内和类间信息同时引入到优化过程中,结合多目标优化算法与模糊中心点聚类,提出一种新颖的多目标模糊聚类算法.与传统的基于遗传算法的混合聚类方法不同的是... 针对传统面向分类属性数据的聚类算法大多是对单一指标优化而存在的局限性,将类内和类间信息同时引入到优化过程中,结合多目标优化算法与模糊中心点聚类,提出一种新颖的多目标模糊聚类算法.与传统的基于遗传算法的混合聚类方法不同的是,采用模糊隶属度对染色体进行编码,同时优化2个相对的聚类目标函数获得一组最优解集,并且采用了一种提前终止准则判断算法是否达到稳定状态并停止操作,以减少不必要的计算开销.为了进一步提高算法的效率,通过采样子集计算出相应的模糊中心点作为类的表达,然后以这些模糊中心点计算出全体样本的隶属度矩阵即可获得最终的聚类结果.对10种数据集的实验结果表明:所提方法在聚类精度和稳定性方面优于当前最新的多目标聚类算法,且计算效率也获得较大的提升. 展开更多
关键词 分类数据 聚类 多目标优化 模糊中心点 最优解集
下载PDF
基于耦合度量的多尺度聚类挖掘方法 被引量:10
14
作者 田真真 赵书良 +2 位作者 李文斌 张璐璐 陈润资 《数据采集与处理》 CSCD 北大核心 2020年第3期549-562,共14页
为了能够更好地对非独立同分布的多尺度分类型数据集进行研究,基于无监督耦合度量相似性方法,提出针对非独立同分布的分类属性型数据集的多尺度聚类挖掘算法。首先,对基准尺度数据集进行基于耦合度量的基准尺度聚类;其次,提出基于单链... 为了能够更好地对非独立同分布的多尺度分类型数据集进行研究,基于无监督耦合度量相似性方法,提出针对非独立同分布的分类属性型数据集的多尺度聚类挖掘算法。首先,对基准尺度数据集进行基于耦合度量的基准尺度聚类;其次,提出基于单链的尺度上推和基于Lanczos核的尺度下推尺度转换算法;最后,利用公用数据集以及H省真实数据集进行实验验证。将耦合度量相似性(Couple metric similarity,CMS)、逆发生频率(Inverse occurrence frequency,IOF)、汉明距离(Hamming distance,HM)等方法与谱聚类结合作为对比算法,结果表明,尺度上推算法与对比算法相比,NMI值平均提高13.1%,MSE值平均减小0.827,F-score值平均提高12.8%;尺度下推算法NMI值平均提高19.2%,MSE值平均减小0.028,F-score值平均提高15.5%。实验结果表明,所提出的算法具有有效性和可行性。 展开更多
关键词 多尺度 聚类 分类数据 尺度转换 度量学习
下载PDF
基于核方法的分类型属性数据集模糊聚类算法 被引量:5
15
作者 伍忠东 高新波 谢维信 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第9期23-28,共6页
针对分类型属性数据的聚类问题 ,将核方法的思想推广到快速、高效率的模糊c -均值算法 ,构造了基于核函数的模糊核c -均值聚类算法 .该算法通过使用经验核矩阵充分利用了数据间的“相异性”信息 ,并且避免了模糊k modes算法中每次迭代... 针对分类型属性数据的聚类问题 ,将核方法的思想推广到快速、高效率的模糊c -均值算法 ,构造了基于核函数的模糊核c -均值聚类算法 .该算法通过使用经验核矩阵充分利用了数据间的“相异性”信息 ,并且避免了模糊k modes算法中每次迭代均要直接计算类中心的缺点 ,提高了聚类的精确度和稳定性 ,同时该算法对模式 (类中心 )的初始值选择不敏感 . 展开更多
关键词 分类型属性数据 聚类 数据挖掘 模糊C-均值 核方法
下载PDF
面向分类数据的自组织神经网络 被引量:7
16
作者 汪加才 陈奇 俞瑞钊 《计算机工程与应用》 CSCD 北大核心 2003年第5期96-98,101,共4页
作为一种优良的聚类和降维工具,自组织神经网络SOM(SelfOrganizingFeatureMaps)已经得到广泛应用。其不足之处是仅适合于数值数据,这对时常需要处理分类型数据(Categoricalvalueddata)或数值型与分类型混合数据(Mixednumericandcategori... 作为一种优良的聚类和降维工具,自组织神经网络SOM(SelfOrganizingFeatureMaps)已经得到广泛应用。其不足之处是仅适合于数值数据,这对时常需要处理分类型数据(Categoricalvalueddata)或数值型与分类型混合数据(Mixednumericandcategoricalvalueddata)的数据挖掘应用是不够的。该文提出了一种新的基于覆盖(Overlap)的距离函数并将其用于SOM训练。实验结果表明,在不增加时空开销的前提下可取得较好的聚类效果。 展开更多
关键词 分类数据 自组织神经网络 聚类 数据挖掘 数据库
下载PDF
一种面向混合型数据聚类的k-prototypes聚类算法 被引量:7
17
作者 贾子琪 宋玲 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1845-1852,共8页
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高... 同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高维混合型数据聚类中的特征加权问题,提出了基于熵权的分类型相异度系数,量化的数值型相异度系数和适用于混合型数据聚类的混合型相异度系数.提出的相异度系数充分考虑了分类型特征值的重要性和数值型特征值的平均值,并具统一的准则,可以更客观的计算数据对象与簇之间的相异度.此外,将加权的混合型相异度系数应用到经典的k-prototypes算法中,提出了一种面向混合型数据聚类的k-prototypes聚类算法(KPMD).使用UCI真实数据集进行实验,结果验证了KPMD算法的有效性和鲁棒性. 展开更多
关键词 k-prototypes 混合型相异度系数 分类型数据 数值型数据 混合型数据
下载PDF
一种面向分类属性数据的聚类融合算法研究 被引量:7
18
作者 李桃迎 陈燕 +1 位作者 张金松 张琳 《计算机应用研究》 CSCD 北大核心 2011年第5期1671-1673,共3页
为了解决单一聚类算法存在结果不准确和随机性大,且现有算法对分类数据聚类时将其转换成数值型会产生误差等问题,提出了一种面向分类属性数据的聚类融合算法。算法利用原有分类属性值的差异产生聚类成员,然后采用相似度方法进行划分,通... 为了解决单一聚类算法存在结果不准确和随机性大,且现有算法对分类数据聚类时将其转换成数值型会产生误差等问题,提出了一种面向分类属性数据的聚类融合算法。算法利用原有分类属性值的差异产生聚类成员,然后采用相似度方法进行划分,通过寻求目标函数最小的划分来简化聚类过程。算法在UCI数据集上进行了验证,结果表明算法的效率和精度都优于现有算法,说明算法的设计和更新策略是有效的。 展开更多
关键词 聚类融合 分类属性数据 数据挖掘 相似度
下载PDF
多维测验项目参数的估计:基于SEM与MIRT方法的比较 被引量:7
19
作者 刘红云 骆方 +1 位作者 王玥 张玉 《心理学报》 CSSCI CSCD 北大核心 2012年第1期121-132,共12页
作者简要回顾了SEM框架下分类数据因素分析(CCFA)模型和MIRT框架下测验题目和潜在能力的关系模型,对两种框架下的主要参数估计方法进行了总结。通过模拟研究,比较了SEM框架下WLSc和WLSMV估计方法与MIRT框架下MLR和MCMC估计方法的差异。... 作者简要回顾了SEM框架下分类数据因素分析(CCFA)模型和MIRT框架下测验题目和潜在能力的关系模型,对两种框架下的主要参数估计方法进行了总结。通过模拟研究,比较了SEM框架下WLSc和WLSMV估计方法与MIRT框架下MLR和MCMC估计方法的差异。研究结果表明:(1)WLSc得到参数估计的偏差最大,且存在参数收敛的问题;(2)随着样本量增大,各种项目参数估计的精度均提高,WLSMV方法与MLR方法得到的参数估计精度差异很小,大多数情况下不比MCMC方法差;(3)除WLSc方法外,随着每个维度测验题目的增多参数估计的精度逐渐增高;(4)测验维度对区分度参数和难度参数的影响较大,而测验维度对项目因素载荷和阈值的影响相对较小;(5)项目参数的估计精度受项目测量维度数的影响,只测量一个维度的项目参数估计精度较高。另外文章还对两种方法在实际应用中应该注意的问题提供了一些建议。 展开更多
关键词 多维项目反应理论 验证性因素分析 参数估计 分类数据
下载PDF
空间分类数据同位规则挖掘算法 被引量:5
20
作者 王占全 王申康 华成 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2005年第10期2339-2344,共6页
针对空间分类数据的特性,提出一种空间分类数据同位规则挖掘算法.利用空间关系定义数据挖掘中事务的概念,采用多层参与索引搜索空间同位规则,从而实现了对空间分类数据的有效处理.采用文中算法对杭州地区119火灾数据进行实验,并验证了... 针对空间分类数据的特性,提出一种空间分类数据同位规则挖掘算法.利用空间关系定义数据挖掘中事务的概念,采用多层参与索引搜索空间同位规则,从而实现了对空间分类数据的有效处理.采用文中算法对杭州地区119火灾数据进行实验,并验证了该算法的适用范围和性能.实验表明,该算法可以有效地处理经过离散化后的连续数据. 展开更多
关键词 空间同位 邻域 规则 分类数据
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部