期刊文献+
共找到66篇文章
< 1 2 4 >
每页显示 20 50 100
最大距离法选取初始簇中心的K-means文本聚类算法的研究 被引量:108
1
作者 翟东海 鱼江 +2 位作者 高飞 于磊 丁锋 《计算机应用研究》 CSCD 北大核心 2014年第3期713-715,719,共4页
由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的Kmeans文本聚类算法。该算法基于这样的事实... 由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的Kmeans文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类,构造了一种将文本相似度转换为文本距离的方法,同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中,对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析,其结果表明,与原始的K-means聚类算法以及其他的两种改进的K-means聚类算法相比,新提出的文本聚类算法在降低了聚类总耗时的同时,F度量值也有了明显提高。 展开更多
关键词 K-MEANS聚类算法 最大距离 文本聚类 文本距离 测度函数 f度量值
下载PDF
聚类有效性评价新指标 被引量:32
2
作者 谢娟英 周颖 +1 位作者 王明钊 姜炜亮 《智能系统学报》 CSCD 北大核心 2017年第6期873-882,共10页
聚类有效性评价指标分为外部评价指标和内部评价指标两大类。现有外部评价指标没有考虑聚类结果类偏斜现象;现有内部评价指标的聚类有效性检验效果难以得到最佳类簇数。针对现有内外部聚类评价指标的缺陷,提出同时考虑正负类信息的分别... 聚类有效性评价指标分为外部评价指标和内部评价指标两大类。现有外部评价指标没有考虑聚类结果类偏斜现象;现有内部评价指标的聚类有效性检验效果难以得到最佳类簇数。针对现有内外部聚类评价指标的缺陷,提出同时考虑正负类信息的分别基于相依表和样本对的外部评价指标,用于评价任意分布数据集的聚类结果;提出采用方差度量类内紧密度和类间分离度,以类间分离度与类内紧密度之比作为度量指标的内部评价指标。UCI数据集和人工模拟数据集实验测试表明,提出的新内部评价指标能有效发现数据集的真实类簇数;提出的基于相依表和样本对的外部评价指标,可有效评价存在类偏斜与噪音数据的聚类结果。 展开更多
关键词 聚类 聚类有效性 评价指标 外部指标 内部指标 f-measure Adjusted Rand INDEX STDI S2 PS2
下载PDF
基于密度和最近邻的K-means文本聚类算法 被引量:29
3
作者 张文明 吴江 袁小蛟 《计算机应用》 CSCD 北大核心 2010年第7期1933-1935,共3页
初始中心点的选择对于传统的K-means算法聚类结果影响较大,容易使聚类陷入局部最优解。针对这个问题,引入密度和最近邻思想,提出了生成初始聚类中心的算法Initial。将所选聚类中心用于K-means算法,得到了更好的应用于文本聚类的DN-K-me... 初始中心点的选择对于传统的K-means算法聚类结果影响较大,容易使聚类陷入局部最优解。针对这个问题,引入密度和最近邻思想,提出了生成初始聚类中心的算法Initial。将所选聚类中心用于K-means算法,得到了更好的应用于文本聚类的DN-K-means算法。实验结果表明,该算法可以生成聚类质量较高并且稳定性较好的结果。 展开更多
关键词 文本聚类 密度 最近邻 f度量
下载PDF
基于密度峰值优化的K-means文本聚类算法 被引量:25
4
作者 田诗宵 丁立新 郑金秋 《计算机工程与设计》 北大核心 2017年第4期1019-1023,共5页
传统K-means算法中初始质心选定的随机性可能使算法陷入局部最优解,使聚类结果不够准确。改进初始质心的选择算法,为各样本点引入局部密度指标,根据其局部密度分布情况,选取处于密度峰值的点作为初始质心,得到稳定的离收敛质心很近的初... 传统K-means算法中初始质心选定的随机性可能使算法陷入局部最优解,使聚类结果不够准确。改进初始质心的选择算法,为各样本点引入局部密度指标,根据其局部密度分布情况,选取处于密度峰值的点作为初始质心,得到稳定的离收敛质心很近的初始质心,减少算法迭代次数,提高运行效率,降低陷入局部最优的概率,显著提高聚类准确性。实验结果表明,与几种已有算法相比,该算法在文本聚类中有明显优势。 展开更多
关键词 文本聚类 密度峰值 f度量 K均值 向量化
下载PDF
多源遥感影像红树林信息提取方法比较 被引量:22
5
作者 章恒 王世新 +2 位作者 周艺 阎福礼 朱金峰 《湿地科学》 CSCD 北大核心 2015年第2期145-152,共8页
选取2012年2月24日的SPOT 5遥感影像和2013年12月6日的Landsat 8、"高分一号"遥感影像,应用最大似然法、支持向量机和面向对象方法提取红树林信息,并引入F值评价提取效果。研究结果表明,用最大似然法和支持向量机提取红树林... 选取2012年2月24日的SPOT 5遥感影像和2013年12月6日的Landsat 8、"高分一号"遥感影像,应用最大似然法、支持向量机和面向对象方法提取红树林信息,并引入F值评价提取效果。研究结果表明,用最大似然法和支持向量机提取红树林信息的精度相似,与影像的特征光谱信息量相关性较强;而对于SPOT 5影像等更高分辨率遥感影像,面向对象方法降低了最大似然法和支持向量机分类的红树林斑块破碎程度,其信息提取精度与影像的空间分辨率正相关。 展开更多
关键词 多源遥感影像 最大似然法 支持向量机 面向对象方法 红树林 f 海南岛
原文传递
面向类不平衡的逻辑回归方法 被引量:10
6
作者 郭华平 董亚东 +1 位作者 邬长安 范明 《模式识别与人工智能》 EI CSCD 北大核心 2015年第8期686-693,共8页
作为机器学习和模式识别中最重要的分类模型之一,逻辑回归(LR)具有较好的可解释性、泛化性.文中将该模型应用到类不平衡问题中,提出面向类不平衡的逻辑回归方法(LRCI)以处理数据不平衡问题.为了充分考虑数据不平衡性,分别构造基于g-mea... 作为机器学习和模式识别中最重要的分类模型之一,逻辑回归(LR)具有较好的可解释性、泛化性.文中将该模型应用到类不平衡问题中,提出面向类不平衡的逻辑回归方法(LRCI)以处理数据不平衡问题.为了充分考虑数据不平衡性,分别构造基于g-mean的目标函数(GBM)和基于f-measure的目标函数(FBM),监督LRCI学习模型参数,进而有效保证学习到的模型同时具有高准确率和召回率.UCI数据集上的实验表明,LRCI在保持LR高准确率的前提下,有效提高它的召回率、g-mean和f-measure.与其他类不平衡分类模型相比,LRCI表现出较明显优势. 展开更多
关键词 不平衡数据集 逻辑回归 g-mean f-measure
下载PDF
易地扶贫搬迁家庭劳动力外出务工对多维贫困的影响 被引量:10
7
作者 李聪 王颖文 +1 位作者 刘杰 荀阳 《当代经济科学》 CSSCI 北大核心 2020年第2期32-44,共13页
基于多维贫困理论,以陕西南部安康地区为例,使用"A-F"双临界值法对农户家庭多维贫困指数进行测度,实证分析移民搬迁视角下劳动力外出务工对家庭多维贫困的影响。研究发现:不同类型农户家庭,"搬迁户-打工户"家庭多... 基于多维贫困理论,以陕西南部安康地区为例,使用"A-F"双临界值法对农户家庭多维贫困指数进行测度,实证分析移民搬迁视角下劳动力外出务工对家庭多维贫困的影响。研究发现:不同类型农户家庭,"搬迁户-打工户"家庭多维贫困指数最低,"非搬迁户-非打工户"家庭多维贫困指数最高;外出务工和外出务工强度能有效减轻农户家庭多维贫困状态,家庭收到汇款额和打工时间对减轻多维贫困有显著正向影响,但受非搬迁户样本影响,外出务工强度对多维贫困的影响并不显著;外出务工作为家庭主要生计活动,对减轻农户家庭多维贫困有积极作用,相较于非搬迁户,外出务工的减贫效应在搬迁户群体中更为显著。 展开更多
关键词 多维贫困 外出务工 易地扶贫搬迁 减贫效应 “A-f”测度法
下载PDF
中日同形词意义用法距离的计量研究——以对译比构建的F-measure为尺度 被引量:10
8
作者 施建军 谯燕 《解放军外国语学院学报》 CSSCI 北大核心 2016年第4期76-84,160,共9页
中日同形词意义用法的差异一直是日语教学的一个重点,也是汉日语对比研究中的一个热点。传统研究试图用同形同义、同形异义、同形近义三分类的方法从意义用法上区分同形词。但是,这种区分方法存在一个难以解决的问题,即同形近义词的用... 中日同形词意义用法的差异一直是日语教学的一个重点,也是汉日语对比研究中的一个热点。传统研究试图用同形同义、同形异义、同形近义三分类的方法从意义用法上区分同形词。但是,这种区分方法存在一个难以解决的问题,即同形近义词的用法差异得不到精确描述,因为同形近义词的用法差异有大有小,其意义用法距离的大小无法用"同形近义"来衡量。本文提出了以对译语料库为知识库,以同形词的对译比和在其基础上构建的F-measure为参数描写中日同形词意义用法距离的方法,并用1900余对常用的中日同形词进行验证,取得了很好的效果。 展开更多
关键词 中日同形词 意义用法距离 对译比 f-measure
原文传递
基于深度强化学习的网格排序聚类算法
9
作者 高谨 《信息技术与信息化》 2024年第8期103-106,共4页
在数据聚类中,网格中的数据点分布可能极不均匀。某些区域可能密集分布着大量数据点,而另一些区域则可能只有很少或没有数据点,不均匀分布影响着网格数据聚类效果。为此,提出基于深度强化学习的网格排序聚类算法。通过定义和构建网格单... 在数据聚类中,网格中的数据点分布可能极不均匀。某些区域可能密集分布着大量数据点,而另一些区域则可能只有很少或没有数据点,不均匀分布影响着网格数据聚类效果。为此,提出基于深度强化学习的网格排序聚类算法。通过定义和构建网格单元,基于网格单元中数据点的数量对网格进行排序,提取出高密度网格区域。利用深度强化学习框架,对高密度网格序列进行迭代优化,将具有相似属性的网格聚类到同一簇中,从而实现精准的网格排序和聚类。实验结果表明,所提出的算法在F-measure上不低于97%,且聚类框与实际框的交并比不低于0.96,有效提高了网格数据的处理效率和聚类准确性。 展开更多
关键词 深度强化学习 网格单元 排序聚类 精准聚类 f-measure
下载PDF
混合图随机游走算法的商品推荐 被引量:4
10
作者 杨华 周琪云 +1 位作者 汤青 杨志明 《小型微型计算机系统》 CSCD 北大核心 2016年第11期2433-2436,共4页
为了解决传统商品推荐方法仅考虑商品两两相似性或只通过商品属性的简单集成构建推荐网络图,对网络对象复杂性和依赖关系考虑不够导致推荐准确性低的问题,提出一种改进的商品推荐算法.算法通过商品、品牌、店铺及关联关系构建混合图,根... 为了解决传统商品推荐方法仅考虑商品两两相似性或只通过商品属性的简单集成构建推荐网络图,对网络对象复杂性和依赖关系考虑不够导致推荐准确性低的问题,提出一种改进的商品推荐算法.算法通过商品、品牌、店铺及关联关系构建混合图,根据节点关系、节点出度、商户广告付费和商品点击数构建数学模型,得到商品、品牌和店铺间的转移概率,建立节点初始概率转移矩阵.通过重启动随机游走算法确定最终节点概率转移矩阵,实现商品推荐.实验结果表明,与当下常用推荐算法相比,该算法提高了商品推荐的准确率(Precision);算法扩展性强,适用于各种电商平台. 展开更多
关键词 混合图 随机游走 商品推荐 转移矩阵 f
下载PDF
两种聚类有效性评价指标的MATLAB实现 被引量:3
11
作者 向培素 《西南民族大学学报(自然科学版)》 CAS 2013年第6期1002-1005,共4页
在聚类分析应用中,为客观公正的评价聚类结果的有效性,需要使用各种有效的评价指标.使用MATLAB实现了F-Measure和Rand(RI)两种评价指标,为评判聚类结果的有效性提供了具体的方法.
关键词 f-measure Rand 聚类算法 MATLAB
下载PDF
Benchmarking Approach to Compare Web Applications Static Analysis Tools Detecting OWASP Top Ten Security Vulnerabilities 被引量:4
12
作者 Juan R.Bermejo Higuera Javier Bermejo Higuera +2 位作者 Juan A.Sicilia Montalvo Javier Cubo Villalba Juan JoséNombela Pérez 《Computers, Materials & Continua》 SCIE EI 2020年第9期1555-1577,共23页
To detect security vulnerabilities in a web application,the security analyst must choose the best performance Security Analysis Static Tool(SAST)in terms of discovering the greatest number of security vulnerabilities ... To detect security vulnerabilities in a web application,the security analyst must choose the best performance Security Analysis Static Tool(SAST)in terms of discovering the greatest number of security vulnerabilities as possible.To compare static analysis tools for web applications,an adapted benchmark to the vulnerability categories included in the known standard Open Web Application Security Project(OWASP)Top Ten project is required.The information of the security effectiveness of a commercial static analysis tool is not usually a publicly accessible research and the state of the art on static security tool analyzers shows that the different design and implementation of those tools has different effectiveness rates in terms of security performance.Given the significant cost of commercial tools,this paper studies the performance of seven static tools using a new methodology proposal and a new benchmark designed for vulnerability categories included in the known standard OWASP Top Ten project.Thus,the practitioners will have more precise information to select the best tool using a benchmark adapted to the last versions of OWASP Top Ten project.The results of this work have been obtaining using widely acceptable metrics to classify them according to three different degree of web application criticality. 展开更多
关键词 Web application benchmark security vulnerability Security Analysis Static Tools assessment methodology false positive false negative precision f-measure
下载PDF
基于序贯滤波的水平集图像分割 被引量:3
13
作者 王丹 何坤 张旭 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第3期518-525,共8页
传统基于边缘的水平集分割模型对非均匀区域分割效果不理想,为了解决这一问题,本文分析了序贯滤波的平滑能力与滤波次数之间的关系,将序贯滤波与水平集分割相结合提出了基于序贯滤波的图像分割模型.为了实现自适应于图像内容的平滑,根... 传统基于边缘的水平集分割模型对非均匀区域分割效果不理想,为了解决这一问题,本文分析了序贯滤波的平滑能力与滤波次数之间的关系,将序贯滤波与水平集分割相结合提出了基于序贯滤波的图像分割模型.为了实现自适应于图像内容的平滑,根据平滑分量分割区域的置信度,设计了图像分割的平滑指标,控制序贯滤波次数,使得不同平滑分量的轮廓曲线收敛于目标边界,改善了传统基于水平集方法对非均匀区域的分割效果.本文分割算法的F测度,精确率和召回率均高于传统模型,在一定程度上提高了非均匀区域的分割效果. 展开更多
关键词 图像分割 水平集 序贯滤波 f测度 非均匀区域
下载PDF
基于句子的多属性融合相似度计算方法 被引量:2
14
作者 袁绍正 周艳平 《计算机系统应用》 2022年第4期303-308,共6页
针对现有的句子相似度计算方法没有考虑句子中的关键词的多属性信息,无法更好衡量句子相似度的问题,综合考虑句子的结构和包含的属性,提出一种基于句子的多属性融合相似度计算方法.该方法通过提取句子的词频属性、词序属性、词性属性及... 针对现有的句子相似度计算方法没有考虑句子中的关键词的多属性信息,无法更好衡量句子相似度的问题,综合考虑句子的结构和包含的属性,提出一种基于句子的多属性融合相似度计算方法.该方法通过提取句子的词频属性、词序属性、词性属性及句长属性,采用层次分析法(AHP)计算出各属性的权重,并验证权重值的合理性,继而加权融合4种属性的相似度.将本文提出的多属性融合相似度计算方法在构建的数据集上进行实验,验证此方法的可靠性及可行性,并以召回率、准确率以及归一化F-度量值为标准和其他传统方法进行对比分析,结果表明,该方法不仅有着均衡的召回率和准确率,且F-度量值较高,达到83.57%. 展开更多
关键词 多属性 权重 句子相似度 层次分析法(AHP) f-度量值
下载PDF
一种基于优先级的迭代划分测试方法 被引量:3
15
作者 章晓芳 章宗长 +1 位作者 谢晓园 周谊成 《计算机学报》 EI CSCD 北大核心 2016年第11期2307-2323,共17页
随机测试和划分测试是两种重要的测试方法,关于两者在失效检测能力和效率方面的比较一直是软件测试领域的研究热点之一.适应性随机测试是对随机测试的一种增强,通过实现测试用例在输入域上的均匀分布,提高了随机测试的失效检测能力.该... 随机测试和划分测试是两种重要的测试方法,关于两者在失效检测能力和效率方面的比较一直是软件测试领域的研究热点之一.适应性随机测试是对随机测试的一种增强,通过实现测试用例在输入域上的均匀分布,提高了随机测试的失效检测能力.该文从划分测试出发,借鉴了均匀分布的思想,提出了一种基于优先级的迭代划分测试方法(Iterative Partition Testing based on Priority Sampling,IPT-PS).首先迭代划分输入域并选取划分后子域的中心点作为待执行的测试用例,随后采取优先级策略,将待执行的测试用例分为3种不同优先等级并依次执行.迭代划分和中心采样仅需要已知输入域的空间信息,优先级执行则考虑了测试用例的不同空间特性,上述3种操作均仅需要很少的时间开销并力求实现测试用例在输入域上的均匀分布,以提高失效检测能力.该文通过理论分析给出了IPT-PS检测出对应失效所需测试用例数量的上界,并通过一系列实验结果表明:IPT-PS在仅使用接近随机测试时间开销的情况下,可以获得与适应性随机测试相近甚至更好的失效检测能力,是一种高效的测试方法. 展开更多
关键词 软件测试 划分测试 随机测试 适应性随机测试 测试用例生成 失效率 f-度量
下载PDF
F积分及其应用
16
作者 张韬 邵全 《沈阳工业大学学报》 EI CAS 2001年第1期85-88,共4页
在 F积分定义的基础上,探讨了 F积分的其它表示方法,并由此给出了 F积分的计算方法,且对有限集合上的 F积分,利用 Fuzzy分布解决综合评价和诊断问题进行了探讨 .
关键词 f积分 可测空间 f测度 测度 可能度
下载PDF
PPI网络聚类的评价方法的研究与应用 被引量:2
17
作者 尤梦丽 雷秀娟 《计算机科学》 CSCD 北大核心 2013年第12期254-258,共5页
蛋白质相互作用网络(Protein-Protein Interaction,PPI)聚类结果的评价方法的研究是检测PPI网络功能模块聚类结果正确与否的关键。介绍并分析了4种有代表性的PPI网络聚类的评价方法,即p-value、匹配统计量、基于准确率和查全率的综合评... 蛋白质相互作用网络(Protein-Protein Interaction,PPI)聚类结果的评价方法的研究是检测PPI网络功能模块聚类结果正确与否的关键。介绍并分析了4种有代表性的PPI网络聚类的评价方法,即p-value、匹配统计量、基于准确率和查全率的综合评价以及基于层结构的hF-measure,在此基础上考虑了主错误划分类与该预测类的相似性,提出了新的罚分函数和新的Sf-measure评价方法。仿真结果表明了各评价方法的特点及Sf-measure评价方法的有效性及合理性。 展开更多
关键词 蛋白质相互作用网络 评价方法 调和平均值 主错误划分类 Sf-measure
下载PDF
The F-measure for Research Priority 被引量:2
18
作者 Ronald Rousseau 《Journal of Data and Information Science》 CSCD 2018年第1期1-17,共17页
Purpose: In this contribution we continue our investigations related to the activity index (A/) and its formal analogs. We try to replace the AI by an indicator which is better suited for policy applications. Desig... Purpose: In this contribution we continue our investigations related to the activity index (A/) and its formal analogs. We try to replace the AI by an indicator which is better suited for policy applications. Design/methodology/approach: We point out that fluctuations in the value of the AI for a given country and domain are never the result of that country's policy with respect to that domain alone because there are exogenous factors at play. For this reason we introduce the F-measure. This F-measure is nothing but the harmonic mean of the country's share in the world's publication output in the given domain and the given domain's share in the country's publication output.Findings: The F-measure does not suffer from the problems the AI does Research limitations: The indicator is not yet fully tested in real cases R&D policy management: In policy considerations, the AI should better be replaced by the F-measure as this measure can better show the results of science policy measures (which the AI cannot as it depends on exogenous factors). Originality/value: We provide an original solution for a problem that is not fully realized by policy makers. 展开更多
关键词 Keywords Activity index Harmonic mean f-measure Research policy Endogenous andexogenous factors
下载PDF
A multi-criteria fusion feature selection algorithm for fault diagnosis of helicopter planetary gear train 被引量:3
19
作者 Canfei SUN Youren WANG Guodong SUN 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2020年第5期1549-1561,共13页
Planetary gear train is a prominent component of helicopter transmission system and its health is of great significance for the flight safety of the helicopter.During health condition monitoring,the selection of a fau... Planetary gear train is a prominent component of helicopter transmission system and its health is of great significance for the flight safety of the helicopter.During health condition monitoring,the selection of a fault sensitive feature subset is meaningful for fault diagnosis of helicopter planetary gear train.According to actual situation,this paper proposed a multi-criteria fusion feature selection algorithm (MCFFSA) to identify an optimal feature subset from the highdimensional original feature space.In MCFFSA,a fault feature set of multiple domains,including time domain,frequency domain and wavelet domain,is first extracted from the raw vibration dataset.Four targeted criteria are then fused by multi-objective evolutionary algorithm based on decomposition (MOEA/D) to find Proto-efficient subsets,wherein two criteria for measuring diagnostic performance are assessed by sparse Bayesian extreme learning machine (SBELM).Further,Fmeasure is adopted to identify the optimal feature subset,which was employed for subsequent fault diagnosis.The effectiveness of MCFFSA is validated through six fault recognition datasets from a real helicopter transmission platform.The experimental results illustrate the superiority of combination of MOEA/D and SBELM in MCFFSA,and comparative analysis demonstrates that the optimal feature subset provided by MCFFSA can achieve a better diagnosis performance than other algorithms. 展开更多
关键词 fault detection feature selection f-measure Helicopter planetary gear train Multi-objective evolutionary algorithm
原文传递
一种应用于静态图像人体分割的显著性检测方法 被引量:2
20
作者 陈佳洲 曾碧 何元烈 《小型微型计算机系统》 CSCD 北大核心 2016年第3期608-611,共4页
针对人体肤色在显著性检测过程中容易被忽视,影响后期图像人体分割效果这一问题,本文提出了一种改进的显著性检测方法.首先利用超像素图分割法对图像进行分割,利用人脸检测提取肤色信息,接着将肤色信息融入到颜色独特性和颜色空间分布... 针对人体肤色在显著性检测过程中容易被忽视,影响后期图像人体分割效果这一问题,本文提出了一种改进的显著性检测方法.首先利用超像素图分割法对图像进行分割,利用人脸检测提取肤色信息,接着将肤色信息融入到颜色独特性和颜色空间分布计算中,最后将得到的超像素显著值分配给每个像素,生成像素级显著图.在公开的数据集上选取100幅包含人物的图片进行测试,该算法取得最高95%的精确度,优于其他显著性算法,在图像人体分割实验中,可以很好地把人体和背景分开.实验结果表明,本文方法在精确率、召回率和F-测量上都优于其他方法,并且能很好地分割人体图像. 展开更多
关键词 图像人体分割 显著性检测 人脸检测 图像分割 f-测量
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部