期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
基于CURE算法的相似重复记录检测 被引量:11
1
作者 时念云 张金明 褚希 《计算机工程》 CAS CSCD 北大核心 2009年第5期56-58,共3页
对CURE算法进行改进,将其应用到相似重复记录的检测。提出预抽样的概念,可以有效地确定记录集中相似重复记录的分布情况,提高随机抽样的准确性。改进代表点选择方法,提出基于距离影响因子的代表点选取策略,既可以根据数据集的密度进行... 对CURE算法进行改进,将其应用到相似重复记录的检测。提出预抽样的概念,可以有效地确定记录集中相似重复记录的分布情况,提高随机抽样的准确性。改进代表点选择方法,提出基于距离影响因子的代表点选取策略,既可以根据数据集的密度进行代表点的选取,又能适当选取有一定意义的边缘点作为代表点,提高代表点选取的合理性。理论分析和实验表明,该方法在保证执行效率的情况下有很高的准确性。 展开更多
关键词 相似重复记录 抽样算法 代表点
下载PDF
自然反向最近邻优化的密度峰值聚类算法 被引量:11
2
作者 刘娟 万静 《计算机科学与探索》 CSCD 北大核心 2021年第10期1888-1899,共12页
密度峰值聚类算法是一种基于密度的聚类算法。针对密度峰值聚类算法存在的参数敏感和对复杂流形数据得到的聚类结果较差的缺陷,提出一种新的密度峰值聚类算法,该算法基于自然反向最近邻结构。首先,该算法引入反向最近邻计算数据对象的... 密度峰值聚类算法是一种基于密度的聚类算法。针对密度峰值聚类算法存在的参数敏感和对复杂流形数据得到的聚类结果较差的缺陷,提出一种新的密度峰值聚类算法,该算法基于自然反向最近邻结构。首先,该算法引入反向最近邻计算数据对象的局部密度;其次,通过代表点和密度相结合的方式选取初始聚类中心;然后,应用密度自适应距离计算初始聚类中心之间的距离,利用基于反向最近邻计算出的局部密度和密度自适应距离在初始聚类中心上构建决策图,并通过决策图选择最终的聚类中心;最后,将剩余的数据对象分配到距离其最近的初始聚类中心所在的簇中。实验结果表明,该算法在合成数据集和UCI真实数据集上与实验对比算法相比较,具有较好的聚类效果和准确性,并且在处理复杂流形数据上的优越性较强。 展开更多
关键词 自然邻居 反向最近邻 代表点 局部密度 聚类
下载PDF
一种基于加权多代表点的层次聚类算法 被引量:5
3
作者 倪维健 黄亚楼 +1 位作者 李飞 刘赏 《计算机科学》 CSCD 北大核心 2005年第5期150-154,共5页
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-... CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-近邻方法的小簇合并机制,可以发现形状、尺寸更为复杂的簇。实验结果表明,该算法在保证执行效率的情况下取得了更好的聚类效果。 展开更多
关键词 聚类算法 代表点 加权 K-近邻 影响因子 聚类效果 执行效率 机制
下载PDF
结合代表点和密度峰的增量动态聚类算法 被引量:6
4
作者 郑河荣 陈恳 潘翔 《浙江工业大学学报》 CAS 北大核心 2017年第4期427-433,共7页
为了解决增量大数据聚类速度缓慢问题,提出了一种结合密度峰和代表点分析的快速聚类算法.先对样本集进行初始化聚类,然后根据删除失效的聚类数据调节聚类簇群的密度均值,再利用代表点的算法对样本集进行更新,最后采用密度峰算法进行重... 为了解决增量大数据聚类速度缓慢问题,提出了一种结合密度峰和代表点分析的快速聚类算法.先对样本集进行初始化聚类,然后根据删除失效的聚类数据调节聚类簇群的密度均值,再利用代表点的算法对样本集进行更新,最后采用密度峰算法进行重复聚类从而更新聚类核心点.通过实验分析表明:该算法可有效提高算法收敛速度.在应用方面,将这种聚类算法引用到大数据量的人脸聚类工作中,优化人脸聚类的效果. 展开更多
关键词 时效性 在线聚类 代表点 密度均值
下载PDF
在Pearson分布族总体中选取代表点的问题 被引量:5
5
作者 费荣昌 《无锡轻工业学院学报》 CSCD 1990年第1期71-78,共8页
本文研究如何在Pearson分布族总体中选取代表点,使它们尽可能多地保留总体的信息。证明了代表点的存在性,并给出了求代表点的算法和三个计算实例。
关键词 Pearson 分布族 代表点 损失函数
下载PDF
一种基于k-means算法的代表点估计方法
6
作者 王世康 类淑河 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第S01期184-189,共6页
本文讨论了基于k-means算法的代表点估计。根据k-means算法对偏进行校正,给出了一维连续分布代表点估计的新方法(Revised k-means,RKM方法)。以一维正态分布为例将该算法求解的代表点应用于核密度估计,比较了随机样本(独立同分布)、修改... 本文讨论了基于k-means算法的代表点估计。根据k-means算法对偏进行校正,给出了一维连续分布代表点估计的新方法(Revised k-means,RKM方法)。以一维正态分布为例将该算法求解的代表点应用于核密度估计,比较了随机样本(独立同分布)、修改的Monte Carlo方法、数论方法的样本(伪Monte Carlo方法)和RKM方法基于这4类近似离散统计分布的代表点的核密度估计,其中RKM代表点表现效果最好。 展开更多
关键词 代表点 聚类分析 正态分布 核密度估计
下载PDF
八宝河流域土壤水时间稳定性及其下垫面控制因素分析 被引量:2
7
作者 魏玲娜 欧阳如琳 +2 位作者 谢永玉 郭洛夫杰 董建志 《中国农村水利水电》 北大核心 2022年第1期50-58,共9页
时间稳定性概念体现了土壤水分的空间结构随时间具有持续稳定的特性,由此找到的代表性点其测量结果可用于反映流域平均土壤水分状况,此方法为流域尺度的土壤水分估算带来便利。本文围绕黑河上游八宝河流域开展表层土壤不同深度的土壤水... 时间稳定性概念体现了土壤水分的空间结构随时间具有持续稳定的特性,由此找到的代表性点其测量结果可用于反映流域平均土壤水分状况,此方法为流域尺度的土壤水分估算带来便利。本文围绕黑河上游八宝河流域开展表层土壤不同深度的土壤水时间稳定性特征分析,寻找能反映流域表层土壤水分平均状况的代表性点,结合流域土壤、植被、地形条件,研究流域内土壤水空间结构时间稳定性的主要控制因素。结果表明:八宝河流域代表性点多位于优势植被与主要土壤类型分布区域,在埋深4 cm处为23号、13号,10 cm处为47号、20 cm处为37号,时间稳定性在垂直方向随深度增加;植被覆盖类型和土壤类型是该流域表层土壤水时间稳定性的主要控制因素,在高寒禾草、苔草草原,棕黑毡土覆盖区域观测,更易于获得深度10 cm以上土壤水平均状况。本研究可为流域尺度的土壤水分估算提供理论参考,为优化设计流域土壤水观测网络提供科学依据。 展开更多
关键词 土壤水 时间稳定性 八宝河流域 下垫面 代表性点
下载PDF
6-UPS并联机器人快速正向运动学研究 被引量:3
8
作者 刘艳梨 吴洪涛 +3 位作者 李耀 王若冰 徐媛媛 陈柏 《农业机械学报》 EI CAS CSCD 北大核心 2019年第4期374-381,400,共9页
根据平面平台型6-UPS并联机器人的结构特点,选取3个代表点的空间坐标作为参数来描述动平台的位置和姿态,结合3个代表点之间的约束条件,建立9个参数的一次与二次多项式方程组,通过对方程组进行消元处理,最终得到6个未知数表示的二次多项... 根据平面平台型6-UPS并联机器人的结构特点,选取3个代表点的空间坐标作为参数来描述动平台的位置和姿态,结合3个代表点之间的约束条件,建立9个参数的一次与二次多项式方程组,通过对方程组进行消元处理,最终得到6个未知数表示的二次多项式方程。针对所获得的二次多项式方程组特点,改进传统牛顿-拉夫森数值迭代算法,并将其用于并联机器人的一般六维二次多项式方程数值求解,迭代算法收敛并可得到唯一解。数值算例表明,在同等条件下,传统旋转矩阵方法的计算时间为1. 42~2. 67 ms,所提代表点算法计算时间为0. 14~0. 23 ms,大大减少了计算时间,提高了收敛速度和计算效率,为并联机器人高性能闭环实时控制奠定了良好基础。 展开更多
关键词 6-UPS并联机器人 快速正向运动学 代表点 改进牛顿拉夫森方法
下载PDF
一种基于代表点的增量聚类算法 被引量:2
9
作者 孟凡荣 李晓翠 周勇 《计算机应用研究》 CSCD 北大核心 2012年第8期2865-2867,共3页
针对现有的增量聚类算法对参数敏感度较高、时空复杂度较高等问题,提出了一种基于代表点的增量聚类算法。首先采用代表点聚类算法对静态的数据库进行聚类;然后根据新增加的节点与已存的代表点之间的关系,判断是否将其添加到已存的代表... 针对现有的增量聚类算法对参数敏感度较高、时空复杂度较高等问题,提出了一种基于代表点的增量聚类算法。首先采用代表点聚类算法对静态的数据库进行聚类;然后根据新增加的节点与已存的代表点之间的关系,判断是否将其添加到已存的代表点所属的类簇中,或是提升为新的代表点;最后,再次采用代表点聚类算法对其进行聚类。实验结果证明,该算法对参数的敏感性低、效率高、占用空间小。 展开更多
关键词 代表点 节点属性 增量聚类
下载PDF
FM-代表点 被引量:1
10
作者 周永道 方开泰 《中国科学:数学》 CSCD 北大核心 2019年第7期1009-1020,共12页
本文提出一种寻找连续性随机变量代表点的新准则:FM-准则。该准则在前n-1样本矩等于相应的总体矩的约束条件下,最小化经验分布函数与总体分布之间差异的L2-范数。本文证明该准则对很多分布都是有意义的。当约束条件不满足时,该准则被推... 本文提出一种寻找连续性随机变量代表点的新准则:FM-准则。该准则在前n-1样本矩等于相应的总体矩的约束条件下,最小化经验分布函数与总体分布之间差异的L2-范数。本文证明该准则对很多分布都是有意义的。当约束条件不满足时,该准则被推广至伪FM-准则。一些例子表明, FM-代表点比其他类型的代表点更优。 展开更多
关键词 F-偏差 均方误差 代表点
原文传递
密集簇中心二次模糊聚类算法 被引量:1
11
作者 田生文 黄明明 《计算机工程与设计》 CSCD 北大核心 2007年第2期436-439,共4页
针对模糊C—均值聚类算法偏好发现球形簇,以及对孤立点非常敏感的问题,提出了密集簇中心二次模糊聚类算法,其中引入聚类有效性度量函数,并进行了有效的孤立点处理,最终的模糊簇由多个代表点共同表示,故算法可有效发现数据集中的自然簇数... 针对模糊C—均值聚类算法偏好发现球形簇,以及对孤立点非常敏感的问题,提出了密集簇中心二次模糊聚类算法,其中引入聚类有效性度量函数,并进行了有效的孤立点处理,最终的模糊簇由多个代表点共同表示,故算法可有效发现数据集中的自然簇数目,对簇的大小和形状没有偏好性,且在孤立点的处理上具有较好的健壮性。另外,随机采样过程方便地实现了上述算法在大型数据集上的扩展;与模糊C—均值聚类算法的实验结果比较也表明了该算法的优越性。 展开更多
关键词 模糊聚类 聚类有效性 密集簇 多代表点 随机采样
下载PDF
基于概率分布代表点的模型集合设计方法 被引量:1
12
作者 孙福明 洪日昌 吴秀清 《控制理论与应用》 EI CAS CSCD 北大核心 2009年第5期475-480,共6页
对于估计、滤波和控制等问题,多模型方法提供了一种非常优越的解决方案.设计优良的模型集合是应用多模型方法的首要问题.本文提出了一种基于概率分布代表点的模型集合设计方法.在已知系统模式的概率分布条件下,由数论方法获得代表其概... 对于估计、滤波和控制等问题,多模型方法提供了一种非常优越的解决方案.设计优良的模型集合是应用多模型方法的首要问题.本文提出了一种基于概率分布代表点的模型集合设计方法.在已知系统模式的概率分布条件下,由数论方法获得代表其概率分布的F-偏差或伪F-偏差代表点和均方差代表点,利用这些代表点构成覆盖系统模式空间的模型集合.文中给出了一维和二维模型集合的具体设计.仿真结果说明了所设计的模型集合的性能. 展开更多
关键词 模型集合 数论方法 代表点:偏差
下载PDF
在二元正态总体中选取代表点的问题 被引量:1
13
作者 费荥昌 《无锡轻工业学院学报》 CSCD 1991年第4期74-85,共12页
本文研究如何在二元正态总体中选取代表点,使它们尽可能多地保留总体的信息。
关键词 二元正态总体 代表点 损失函数
下载PDF
t分布的代表点及其在统计模拟中的应用 被引量:1
14
作者 周敏 汪文俊 《应用数学学报》 CSCD 北大核心 2016年第4期620-640,共21页
本文首先讨论了在均方误最小意义下学生氏tn分布代表点,利用方开泰、贺曙东的算法找出代表点,证明了当n≥3时,t_n分布总体下算法的收敛性,代表点的存在性及其唯一性,并从t_n分布角度研究了代表点在统计模拟方面的应用。传统的蒙特卡罗... 本文首先讨论了在均方误最小意义下学生氏tn分布代表点,利用方开泰、贺曙东的算法找出代表点,证明了当n≥3时,t_n分布总体下算法的收敛性,代表点的存在性及其唯一性,并从t_n分布角度研究了代表点在统计模拟方面的应用。传统的蒙特卡罗方法和自助法及重抽样方法对随机样本进行抽样,是统计模拟方法的基础.Fang,Zhou,Wang讨论了一元正态分布的代表点在统计模拟中的应用并且首次提出用代表点代替独立同分布的随机样本,构造一个离散的近似总体,通过对近似总体重复抽样来进行统计推断.这是—个新思想.本文继续探讨这个问题,文中统计推断主要有两部分:经典估计和稳健估计.经典估计主要集中考虑参数点估计(均值、方差、偏度和峰度);稳健估计主要考虑简单的位置参数(中位数和均值)和尺度参数(中位数绝对偏差和四分位距).我们的结果再次验证,代表点方法可以明显地提高统计估计量的精确度以及收敛速度. 展开更多
关键词 伪蒙特卡罗方法 代表点 统计模拟 tn分布 重抽样 稳健估计
原文传递
一种改进的CURE的事件聚类方法
15
作者 李静月 徐济成 朱昊 《重庆文理学院学报(社会科学版)》 2015年第5期121-124,共4页
一个文档往往包含多个主题的事件,把分散在多个文本中的同一主题事件组织起来依靠传统的文本聚类是无法实现的.本文通过对已有的CURE算法进行分析,根据事件的特征,对代表点的选取和小类合并机制进行改进,实现了一个改进的CURE算法.实验... 一个文档往往包含多个主题的事件,把分散在多个文本中的同一主题事件组织起来依靠传统的文本聚类是无法实现的.本文通过对已有的CURE算法进行分析,根据事件的特征,对代表点的选取和小类合并机制进行改进,实现了一个改进的CURE算法.实验结果表明:改进后的方法在保证执行效率的情况下取得了更好的聚类效果. 展开更多
关键词 层次聚类 CURE 代表点 事件聚类
下载PDF
在S形分布中选择给定数目的代表点问题
16
作者 王宏健 《福州大学学报(自然科学版)》 CAS CSCD 1995年第4期7-13,共7页
在损失函数情况下,讨论了在S形分布中给定数目的代表点存在性.给出n≤7时标准S型分布的全部代表点,并利用计算机模拟得出n≥8时为求代表点所得的方程组无解.
关键词 S型分布 代表点 损失函数 分布函数 随机变量
原文传递
三种混合二维正态分布代表点生成方法的比较
17
作者 吴丽华 叶杨 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第4期713-718,共6页
本文对三种寻找混合二维正态分布代表点的算法:蒙特卡洛法、数论法及均方误差法所产生的近似总体与真实总体间的分布偏差及均方误差进行了比较研究,结果表明均方误差法是最优的.然后本文采用自助法对三类代表点进行重抽样,并以重抽样的... 本文对三种寻找混合二维正态分布代表点的算法:蒙特卡洛法、数论法及均方误差法所产生的近似总体与真实总体间的分布偏差及均方误差进行了比较研究,结果表明均方误差法是最优的.然后本文采用自助法对三类代表点进行重抽样,并以重抽样的结果再次验证了均方误差法的优越性. 展开更多
关键词 统计仿真 混合二维正态分布 代表点 自助法
下载PDF
点簇聚合的目标顶点的优化
18
作者 黄健民 施法中 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第20期4721-4724,共4页
研究了点簇聚合的目标顶点位置的计算问题。当计算过程中得到的目标顶点不在小单元之内,或者虽然在小单元之内,但目标顶点的位置不能唯一确定时,则将求解目标顶点的问题转化为求解带约束的二次优化问题。此二次优化问题的解既能保证目... 研究了点簇聚合的目标顶点位置的计算问题。当计算过程中得到的目标顶点不在小单元之内,或者虽然在小单元之内,但目标顶点的位置不能唯一确定时,则将求解目标顶点的问题转化为求解带约束的二次优化问题。此二次优化问题的解既能保证目标顶点位于小单元之内,在位置上又最接近该点簇的重心。实验结果表明,该算法的时间效率类似于Lindstrom的算法,但在简化质量上要优于后者。 展开更多
关键词 点簇聚合 目标顶点 位置优化 三维模型
下载PDF
引入信息熵的CURE聚类算法 被引量:14
19
作者 伍恒 李文杰 蒋旻 《计算机应用研究》 CSCD 北大核心 2017年第8期2303-2305,共3页
为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数... 为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点。在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率。 展开更多
关键词 层次聚类 CURE算法 信息熵 代表点选取
下载PDF
一种基于代表点的快速聚类算法 被引量:4
20
作者 李晓翠 孟凡荣 周勇 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期504-512,共9页
目前经典的聚类算法在内存空间有限的情况下,聚类受到时间、空间等各方面的限制,提出一种基于代表点的快速聚类算法FCBRP(fast clustering based representative points).首先,判定数据集中所有节点的属性,当节点的D临域内存在大于等于... 目前经典的聚类算法在内存空间有限的情况下,聚类受到时间、空间等各方面的限制,提出一种基于代表点的快速聚类算法FCBRP(fast clustering based representative points).首先,判定数据集中所有节点的属性,当节点的D临域内存在大于等于K个邻居节点时,将其定义为代表点,代表点D临域内所有邻居节点与该代表点之间的平均欧氏距离即为该代表点的相关密度RD,所有的代表点组成代表点集合;将所有在代表点的D临域内的节点定义为能被代表的节点,并将其进行存储;既不是代表点、又不能被其它节点所代表的节点,将其定义为噪音节点;其次,对代表点集合进行聚类,对于给定的密度标准α,如果两个代表点满足密度相关,即两个代表点的相关密度分别乘以密度标准α后同时大于等于两者之间的欧氏距离,则将其划分到同一类簇中,通过对代表点的聚类,达到对数据的区域划分,得到所有类簇的基本形状;最后,对于被其它代表点所代表的节点,通过检测代表它们的代表点所属的类簇,判定被代表的节点所属的类簇,对于少数位于不同类簇中的代表点的D临域内的节点,将其划分到相对距离较近的代表点所属的类簇中.实验证明,FCBRP算法对空间需求较小,效率快,精度高,鲁棒性更佳. 展开更多
关键词 代表点选取 代表点聚类 FCBRP算法
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部