期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
数据挖掘在电信套餐预演中的应用研究 被引量:4
1
作者 刘永 陈治平 《计算机工程与设计》 CSCD 北大核心 2008年第15期4032-4034,4039,共4页
电信体制的改革引入了竞争的机制,使得电信企业根据不同的客户提供不同优惠的电信套餐。电信企业在客户细分的基础上针对具体的客户群推出新套餐,将新套餐推向市场前希望对该套餐进行预演,以预测该套餐推出后的市场情况。在分析现有套... 电信体制的改革引入了竞争的机制,使得电信企业根据不同的客户提供不同优惠的电信套餐。电信企业在客户细分的基础上针对具体的客户群推出新套餐,将新套餐推向市场前希望对该套餐进行预演,以预测该套餐推出后的市场情况。在分析现有套餐预演的基础上,提出了电信套餐预演的整体分析模型,并结合电信企业实际套餐数据对该模型各部分进行了具体的应用分析,结果证明了该模型的有效性。 展开更多
关键词 数据挖掘 距离 套餐预演 相似度计算 属性类
下载PDF
基于结构相似性和压缩变换的聚类方法 被引量:5
2
作者 牟廉明 詹德川 +1 位作者 黎铭 周志华 《模式识别与人工智能》 EI CSCD 北大核心 2011年第5期637-644,共8页
针对聚类分析在处理任意形状、任意密度和具有一定结构特征的数据集时存在的不足,首先在数据空间中建立离散拓扑流形,通过在此结构上定义邻域密度相似性和邻域密度变化光滑性两个相对性度量标准,并利用可达性给出样本结构相似性和类结... 针对聚类分析在处理任意形状、任意密度和具有一定结构特征的数据集时存在的不足,首先在数据空间中建立离散拓扑流形,通过在此结构上定义邻域密度相似性和邻域密度变化光滑性两个相对性度量标准,并利用可达性给出样本结构相似性和类结构的定义,证明类结构关系是一个等价关系.然后将结构相似性当作吸引力,设计基于压缩变换的聚类方法,该方法具备处理任意形状、任意密度和解释性好等许多优点.最后在人工数据集和标准数据集上的比较实验结果表明,该方法在聚类效率和有效性上都明显优于其它聚类算法. 展开更多
关键词 聚类分析 离散拓扑流形 结构相似性 类结构 压缩变换
原文传递
一种基于弱模糊相似关系的广义粗糙集 被引量:3
3
作者 田宏 王秀坤 《大连理工大学学报》 EI CAS CSCD 北大核心 2007年第2期287-290,共4页
粗糙集理论是建立在等价关系的基础上发展起来的,但等价关系性质的应用领域是有限的,等价关系不能对现实世界中的元素关系给出客观的描述.为此提出用模糊相似关系和弱模糊相似关系的概念来代替等价关系,同时引入了弱模糊相似关系的相似... 粗糙集理论是建立在等价关系的基础上发展起来的,但等价关系性质的应用领域是有限的,等价关系不能对现实世界中的元素关系给出客观的描述.为此提出用模糊相似关系和弱模糊相似关系的概念来代替等价关系,同时引入了弱模糊相似关系的相似度概念和相似类概念,定义了基于弱模糊相似关系的广义粗糙集及标准的广义粗糙集上下近似;研究了两对上下近似算子的性质,讨论了3种粗糙隶属函数的性质并验证了它们的性质. 展开更多
关键词 弱模糊相似关系 相似度 相似类
下载PDF
基于粗糙集理论的不完备决策表的完备化方法 被引量:3
4
作者 刘文军 《长沙电力学院学报(自然科学版)》 2006年第4期60-64,共5页
首先针对不同的条件属性类型,分别给出两对象关于条件属性的相似度,然后给出了t相似度的概念,最后分别就条件属性是离散、连续、序数型的决策表给出了相应的完备化(补齐)算法.实例表明此完备化方法是行之有效的.
关键词 完备化 相似度 t相似度 t相似类
下载PDF
基于知识划分相似性的属性约简 被引量:3
5
作者 宋姝婷 吴根秀 程子成 《计算机工程与应用》 CSCD 北大核心 2016年第8期80-83,共4页
信息系统的属性约简是粗糙集理论的重要内容之一。除正区域、差别矩阵、信息熵之外,运用模糊T的性质提出了一种基于t-范数的划分,基于知识的划分,给出了相似性的概念,提出了若干相似性的性质,并将该相似性的度量运用到属性约简中,给出... 信息系统的属性约简是粗糙集理论的重要内容之一。除正区域、差别矩阵、信息熵之外,运用模糊T的性质提出了一种基于t-范数的划分,基于知识的划分,给出了相似性的概念,提出了若干相似性的性质,并将该相似性的度量运用到属性约简中,给出了一个新的属性约简算法,从而对属性约简进行改进。通过一个数据模型的验证,新的算法同样可以有效地滤除冗余属性,保留关键属性,充分说明了该方法的可行性。 展开更多
关键词 粗糙集 属性约简 相似性 等价类 T-范数
下载PDF
RKR-GST算法在.NET中的分析与实现 被引量:3
6
作者 牛永洁 《信息技术》 2012年第3期171-174,共4页
针对计算字符串相似度的RKR-GST算法,分析了与该算法相关的技术并给出算法的流程图,然后在Visual Studio 2008中对该算法进行了实现,详细描述了实现过程中涉及的类与数据结构图,最后对算法的复杂度及算法运行过程中一些参数的选取进行... 针对计算字符串相似度的RKR-GST算法,分析了与该算法相关的技术并给出算法的流程图,然后在Visual Studio 2008中对该算法进行了实现,详细描述了实现过程中涉及的类与数据结构图,最后对算法的复杂度及算法运行过程中一些参数的选取进行了讨论。RKR-GST算法在剽窃检测、DNA序列匹配等领域具有广阔的应用前景,该算法在.NET中的实现具有良好的可移植性与可扩展性,可以在多个应用领域中推广使用。 展开更多
关键词 字符串相似度 RKR-GST算法 算法实现 类图 算法参数
下载PDF
基于相关性度量的伪主成分分析 被引量:3
7
作者 孙廷凯 冯爱民 陈松灿 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2006年第6期732-736,共5页
采用数据样本间的相关性作为相似性度量,并引入样本的类信息,提出一种新的降维方法,即伪主成分分析(Pseudo-PCA),该方法尽可能地保持原样本的变化信息,同时又使得降维后的同类数据样本尽可能保持相似。此外,将这种思想方法成功推广到近... 采用数据样本间的相关性作为相似性度量,并引入样本的类信息,提出一种新的降维方法,即伪主成分分析(Pseudo-PCA),该方法尽可能地保持原样本的变化信息,同时又使得降维后的同类数据样本尽可能保持相似。此外,将这种思想方法成功推广到近年来提出的2DPCA,MatPCA和(2D)2PCA。在ORL,Yale和AR等人脸数据集上的实验表明,该类方法的识别率高于相应的基于欧氏距离的PCA,2DPCA,M atPCA和(2D)2PCA等方法。 展开更多
关键词 主成分分析 相似性度量 类信息 欧氏距离 人脸识别
下载PDF
一种基于t相似分类的连续值域决策表的决策算法 被引量:1
8
作者 刘文军 谷云东 李洪兴 《模式识别与人工智能》 EI CSCD 北大核心 2005年第6期652-656,共5页
首先给出t相似度的定义,并引入t相似类的概念。随后,借助研究对象的t相似类定义了相似划分算法和广义决策集,并研究它们的性质,给出基于相似划分的类对应规则提取方法。接着,给出类对应规则中各条件类的区间表达,得到了面向连续值域决... 首先给出t相似度的定义,并引入t相似类的概念。随后,借助研究对象的t相似类定义了相似划分算法和广义决策集,并研究它们的性质,给出基于相似划分的类对应规则提取方法。接着,给出类对应规则中各条件类的区间表达,得到了面向连续值域决策表的规则提取算法。最后,结合实例说明了决策规则提取算法的实现过程。 展开更多
关键词 连续值域决策表 t相似度 t相似类 相似划分算法 广义决策集 规则获取
原文传递
合理进行多元分析——变量聚类分析 被引量:1
9
作者 胡纯严 胡良平 《四川精神卫生》 2023年第S01期61-66,共6页
本文目的是介绍与变量聚类分析有关的基本概念、计算方法、两个实例以及SAS实现。基本概念包括变量聚类分析、相似系数、变量聚类方法、类成分和类结构;计算方法涉及相似系数法计算过程和特征值法计算过程;两个实例涉及的资料分别是“6... 本文目的是介绍与变量聚类分析有关的基本概念、计算方法、两个实例以及SAS实现。基本概念包括变量聚类分析、相似系数、变量聚类方法、类成分和类结构;计算方法涉及相似系数法计算过程和特征值法计算过程;两个实例涉及的资料分别是“60名正常男性10项指标的测定结果”和“36只兔子的7项指标测定结果”;借助SAS对两个实例中的定量资料进行了全面的变量聚类分析,并对输出结果给出了解释。 展开更多
关键词 聚类统计量 聚类分析 相似系数 类成分 类结构
下载PDF
The ClasSi coefficient for the evaluation of ranking quality in the presence of class similarities 被引量:1
10
作者 Anca Maria IVANESCU Marc WICHTERICH Christian BEECKS Thomas SEIDL 《Frontiers of Computer Science》 SCIE EI CSCD 2012年第5期568-580,共13页
Evaluation measures play an important role in the design of new approaches, and often quality is measured by assessing the relevance of the obtained result set. While many evaluation measures based on precision/recall... Evaluation measures play an important role in the design of new approaches, and often quality is measured by assessing the relevance of the obtained result set. While many evaluation measures based on precision/recall are based on a binary relevance model, ranking correlation coefficients are better suited for multi-class problems. State-of-the-art rank- ing correlation coefficients like Kendall's T and Spearman's p do not allow the user to specify similarities between differ- ing object classes and thus treat the transposition of objects from similar classes the same way as that of objects from dissimilar classes. We propose ClasSi, a new ranking corre- lation coefficient which deals with class label rankings and employs a class distance function to model the similarities between the classes. We also introduce a graphical representation of ClasSi which describes how the correlation evolves throughout the ranking. 展开更多
关键词 RANKING quality measure class similarity classi
原文传递
面实体匹配的集成学习CatBoost方法 被引量:2
11
作者 刘贺 郭黎 +2 位作者 李豪 张婉晨 白翔天 《地球信息科学学报》 CSCD 北大核心 2022年第11期2198-2211,共14页
现有的面实体多指标几何匹配方法在计算综合相似度和确定最终匹配实体时面临着指标权重和阈值难以科学量化的难题,集成学习算法通过构建并结合多个机器学习器来完成学习任务,在解决分类问题时体现出了较为明显的性能优势。为此,本文提... 现有的面实体多指标几何匹配方法在计算综合相似度和确定最终匹配实体时面临着指标权重和阈值难以科学量化的难题,集成学习算法通过构建并结合多个机器学习器来完成学习任务,在解决分类问题时体现出了较为明显的性能优势。为此,本文提出了一种基于集成学习算法CatBoost的面实体匹配方法,将匹配问题转化为分类问题。选取形状、面积、方向和位置4个几何特征作为模型分类特征;利用过采样与欠采样相结合的混合重采样技术减轻原始训练样本的类别不平衡度;借助贝叶斯优化算法确定CatBoost模型的最优超参数;引入可解释人工智能领域的SHAP解释框架从全局和局部两个角度解释各输入特征对匹配结果的影响。在青藏高原的面状湖泊数据上对本文提出的方法进行了验证,实验结果表明:对模型预测影响最大的特征是位置,然后依次是面积、形状,影响最小的特征是方向。CatBoost匹配方法在实验数据集上的查准率、查全率和F1-score分别达到0.9937、0.9753和0.9844,相比于直接使用样本不均衡的原始样本进行模型训练,分别提高了约5.8%、0.6%和3.3%。与传统的面实体多指标双向匹配方法和逻辑回归、K近邻、决策树、神经网络等常规机器学习分类算法相比,集成学习算法CatBoost性能表现更加优异,在避免指标权重和阈值设置难题的同时取得了较好的匹配结果。 展开更多
关键词 面实体 相似性 匹配 集成学习 CatBoost 类别不平衡 贝叶斯优化 SHAP
原文传递
Decomposing class responsibilities using distance-based method similarity
12
作者 Junha LEE Dae-Kyoo KIM +1 位作者 Suntae KIM Sooyong PARK 《Frontiers of Computer Science》 SCIE EI CSCD 2016年第4期612-630,共19页
Cohesion is a design quality that has a great im- pact on the posterior development and maintenance. As software evolves, the cohesion of the system becomes weaker due to the changes introduced during evolution. Over ... Cohesion is a design quality that has a great im- pact on the posterior development and maintenance. As software evolves, the cohesion of the system becomes weaker due to the changes introduced during evolution. Over evolution, a single responsibility class may be unintentionally assigned other responsibilities, which makes the class less cohesive and more complex and consequently increases the complexity of the entire system. There has been much work on decomposing class responsibilities based on internal class relationships such as method-attribute referencing and internal method calls. However, object-oriented systems involve significant external class relationships carrying important behavioral semantics, which should be taken into account in identifying class responsibilities. In this paper, we present a novel approach for identifying and decomposing classes responsibilities based on method similarity using both internal and external class relationships. We extend the existing work for measuring similarity of internal class relationships and present a distance-based method for measuring external class relationships. We evaluate the approach using three open source applications -- JMeter, JHotDraw, and ArgoUML. The evaluation shows that the presented approach improves precision over the existing work. We validate the results using independent samples T-test and ANOVA applied to a set of hypotheses. The validation confirms that the results are statistically significant. 展开更多
关键词 class decomposition COHESION external rela-tionships identifying responsibility method similarity
原文传递
一种基于频繁项集的搜索引擎聚类浏览算法 被引量:1
13
作者 沙贝贝 谢丽聪 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第2期151-155,共5页
搜索引擎的聚类浏览技术可以帮助用户更好地在搜索引擎返回的结果中定位自己感兴趣的信息。TS-FIC算法通过加工关联规则挖掘出来的频繁项集作为类标签,形成初始聚类,利用频繁项集之间的语义关系,把初始聚类组织成树结构。在形成最终聚类... 搜索引擎的聚类浏览技术可以帮助用户更好地在搜索引擎返回的结果中定位自己感兴趣的信息。TS-FIC算法通过加工关联规则挖掘出来的频繁项集作为类标签,形成初始聚类,利用频繁项集之间的语义关系,把初始聚类组织成树结构。在形成最终聚类时,引入语义相似度作为计算类相似度的一个考量方面,最后利用一种新的排序方案把最终结果排序显示给用户。实验表明,该算法具有一定可行性,并在效率与聚类精度方面有不错表现。 展开更多
关键词 聚类 关联规则 语义相似度 类标签
下载PDF
四元数矩阵的右特征值相似类 被引量:1
14
作者 彭震春 《岳阳师范学院学报(自然科学版)》 2002年第2期15-16,共2页
将四元数矩阵的右特征值进行了一种分类 。
关键词 四元数矩阵 右特征值 右谱 相似类 四元数体 非奇异阵 Jordan形矩阵
下载PDF
基于K-means算法的优秀班集体评选方法 被引量:1
15
作者 曾新 杨健 +1 位作者 张鑫 陶安玲 《大理大学学报》 CAS 2018年第12期24-29,共6页
传统优秀班集体的遴选方法是将评价班集体的相关属性值进行简单求和,并取总和较大的前K个班级作为优秀班集体,这种评价体系会导致部分班级因为某个属性值过大而成为优秀班集体,而班级其他方面的表现却并不突出,同时,受到年级的限制,部... 传统优秀班集体的遴选方法是将评价班集体的相关属性值进行简单求和,并取总和较大的前K个班级作为优秀班集体,这种评价体系会导致部分班级因为某个属性值过大而成为优秀班集体,而班级其他方面的表现却并不突出,同时,受到年级的限制,部分评价班集体的属性值为空。针对目前优秀班集体评选方法存在的问题,提出基于K-means算法的优秀班集体评选方法,利用同一类簇中的样本相似度较高,而不同类簇的样本相似度较低的聚类特点,从不同年级的样本中评选出相似度较高的K个优秀班集体。通过采用真实样本数据集进行实验的结果表明:基于K-means算法的优秀班集体评选方法能够从不同年级当中遴选出班级各项指标均衡发展的优秀班集体。 展开更多
关键词 K-MEANS算法 相似度 班集体 评选方法
下载PDF
一种新的高速机动目标跟踪算法的研究 被引量:1
16
作者 孟凡 郑庆琳 +1 位作者 倪雪 刘建 《雷达与对抗》 2013年第3期27-30,共4页
针对高速机动目标,基于线性回归和聚类分析理论,设计出一种新的机动目标跟踪算法。对机动目标航迹的历史参数建立样本集,依据回归分析设计关联波门,形成多航迹。对该样本集提取特征向量,并根据聚类分析理论计算类内相似度。根据判别准... 针对高速机动目标,基于线性回归和聚类分析理论,设计出一种新的机动目标跟踪算法。对机动目标航迹的历史参数建立样本集,依据回归分析设计关联波门,形成多航迹。对该样本集提取特征向量,并根据聚类分析理论计算类内相似度。根据判别准则提取出目标航迹。仿真结果表明,本算法可以实现高速机动目标的稳定跟踪。 展开更多
关键词 机动目标 线性回归 聚类分析 类内相似度
下载PDF
基于等价类的图像相似性度量
17
作者 李年攸 《三明学院学报》 2006年第4期410-412,共3页
提出了基于等价类图像相似性度量算法,算法兼顾了图像单个区域和多区域(整体)相似性度量,既考虑到具体用户的需要,同时又降低了计算的时间复杂度,提高了图像匹配的效率。
关键词 等价类 相似度 区域类 匹配
下载PDF
Nonderotary矩阵
18
作者 徐运阁 陈媛 《数学的实践与认识》 北大核心 2018年第5期241-247,共7页
Nonderotary矩阵是一类重要的矩阵,将从相似标准形、中心化子、相似类维数等角度刻划这类矩阵的性质,证明矩阵A是Nonderotary当且仅当与A可交换的所有矩阵都可以写成A的多项式,当且仅当A的相似类的维数最大.
关键词 Nonderotary 矩阵 中心化子 相似类 相似标准形
原文传递
矩阵合同与矩阵相似的教学探讨
19
作者 周潘岳 《湖南理工学院学报(自然科学版)》 CAS 2021年第2期77-79,共3页
矩阵合同与矩阵相似是高等代数中两个很容易混淆的概念,也是研究生入学考试中数学科目的常考知识点.为了更透彻理解这两个概念,通过剖析两者的定义,探讨两者之间的关系并结合例子加以说明,加深学生对这两个概念的理解.并利用信息技术手... 矩阵合同与矩阵相似是高等代数中两个很容易混淆的概念,也是研究生入学考试中数学科目的常考知识点.为了更透彻理解这两个概念,通过剖析两者的定义,探讨两者之间的关系并结合例子加以说明,加深学生对这两个概念的理解.并利用信息技术手段,将讲解过程录制成微课视频,让学生利用课余时间去学习和消化吸收,达到事半功倍的效果. 展开更多
关键词 矩阵合同 矩阵相似 微课
下载PDF
区间值信息系统的知识约简 被引量:51
20
作者 张楠 苗夺谦 岳晓冬 《计算机研究与发展》 EI CSCD 北大核心 2010年第8期1362-1371,共10页
知识约简是粗糙集理论的重要研究内容之一.传统的知识约简主要针对单值信息系统,但在许多实际问题中,信息系统中的数据往往以区间值的形式存在,因此,区间值信息系统的知识约简研究具有重要意义.现有工作中,论域的分类结果存在冗余度大... 知识约简是粗糙集理论的重要研究内容之一.传统的知识约简主要针对单值信息系统,但在许多实际问题中,信息系统中的数据往往以区间值的形式存在,因此,区间值信息系统的知识约简研究具有重要意义.现有工作中,论域的分类结果存在冗余度大、误分率高等问题.针对上述问题,在区间值信息系统中引入了α-极大相容类的概念,并提出了新的粗糙上下近似算子,α-极大相容类的采用有效地提高了分类和粗糙近似精度.最后,给出了区间值信息系统知识约简的定义和相应区分函数的计算方法,为区间值信息系统的知识获取提供了一条新的途径. 展开更多
关键词 区间值信息系统 相似率 α-极大相容类 粗糙近似 知识约简
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部