期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
多标签隐性知识显性化下的数据挖掘算法 被引量:2
1
作者 刘利民 张勇 《计算机仿真》 北大核心 2023年第4期504-508,共5页
对多标签数据进行挖掘时,由于数据挖掘模式的差异,导致算法加速比较低。提出基于SECI模型与属性分类的多标签数据挖掘算法。应用SECI理论建立数据转化模型,将多标签数据的隐性知识显性化处理。结合Relief F算法和互信息,提取多标签数据... 对多标签数据进行挖掘时,由于数据挖掘模式的差异,导致算法加速比较低。提出基于SECI模型与属性分类的多标签数据挖掘算法。应用SECI理论建立数据转化模型,将多标签数据的隐性知识显性化处理。结合Relief F算法和互信息,提取多标签数据特征。通过属性分类方法,按照类内距离平方和最小、类间距离平方和最大的原则设计多标签数据挖掘模式,获取数据挖掘结果。在MVVM模式的作用下,建立挖掘结果交互方案,获取实时数据挖掘结果。仿真结果表明:所提出的数据挖掘算法应用后,加速比得到了有效提升。 展开更多
关键词 属性分类 标签数据 数据挖掘 特征选择 隐性知识
下载PDF
基于判别性矩阵分解的多标签跨模态哈希检索 被引量:1
2
作者 谭钰 王小琴 +2 位作者 蓝如师 刘振丙 罗笑南 《计算机应用》 CSCD 北大核心 2023年第5期1349-1354,共6页
现有的跨模态哈希算法低估了不同类别标签之间语义差异的重要性,忽略了哈希向量的平衡条件,导致所学习到的哈希码的判别性能差。此外,一些方法利用标签信息构造相似性矩阵,并将多标签数据视为单标签数据进行建模,这在多标签跨模态检索... 现有的跨模态哈希算法低估了不同类别标签之间语义差异的重要性,忽略了哈希向量的平衡条件,导致所学习到的哈希码的判别性能差。此外,一些方法利用标签信息构造相似性矩阵,并将多标签数据视为单标签数据进行建模,这在多标签跨模态检索中造成了较大的语义损失。为了保留异构数据之间精确的相似程度和哈希向量的平衡特性,提出了一种新的有监督哈希算法——基于判别性矩阵分解的多标签跨模态哈希检索(DMFH)。该方法利用核化特征的协同矩阵分解(CMF)获得了一个共享的隐式子空间;同时利用数据之间共有标签的比例来描述异构数据的相似程度;此外,利用标签的平衡信息构造平衡矩阵,生成具有平衡特性的哈希向量,并最大化不同类别标签之间的类间距。在两个常用多标签数据集MIRFlickr和NUS-WIDE上与7种先进的跨模态哈希方法进行对比,在“以图搜文”(I2T)和“以文搜图”(T2I)任务上,DMFH均取得了最高的平均精度均值(mAP),而且T2I任务的mAP更优,说明DMFH能够更有效地利用文本模态中的多标签语义信息。还分析了所构造的平衡矩阵与相似性矩阵的有效性,验证了DMFH算法能有效保持语义信息和相似性关系,在多标签跨模式检索中是有效的。 展开更多
关键词 跨模态检索 矩阵分解 哈希学习 平衡向量 标签数据
下载PDF
利用最近邻信息快速分类多标签数据 被引量:3
3
作者 乔健 田庆 《计算机工程与应用》 CSCD 北大核心 2011年第32期138-140,190,共4页
为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签... 为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签归属的最近邻数对待分类实例进行排序分类。仿真结果表明,最近邻的选择方法对分类器性能有显著的影响;在分类效果上FKMC与ML-KNN相当,有时甚至优于后者;而在分类效率上FKMC则显著优于ML-KNN。 展开更多
关键词 最近邻 快速分类 标签数据 快速标签数据分类算法(FKMC)
下载PDF
基于分类规则挖掘的数据多标记特征分层识别 被引量:3
4
作者 朱方娥 郭建方 曹丽娜 《计算机仿真》 北大核心 2021年第4期310-314,共5页
面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法。利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,... 面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法。利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,利用分类规则挖掘方法构建一个分类识别模型,实现数据多标记特征分层识别。结果表明,与传统方法相比,所研究方法识别下,汉明损失度最小,数据多标记特征分层识别准确度最大,说明上述方法的识别质量较高,达到了研究的预期目标,为数据利用和挖掘提供了参考和借鉴。 展开更多
关键词 分类规则挖掘 标签数据 数据降维处理 标记特征选择 分层识别方法 免疫算法
下载PDF
样本线性化与数据去重的极限学习机
5
作者 张灿 代子彪 +1 位作者 安鑫 李建华 《智能计算机与应用》 2021年第7期24-31,共8页
对于多标签分类中存在非线性的数据样本和重复的样本数据问题,本文提出了一种基于在线顺序极限学习机(On⁃line Sequential Extreme Learning Machine,OS-ELM)的改进算法—样本线性化和数据预处理极限学习机(PDC-ELM)。PDC-ELM算法对线... 对于多标签分类中存在非线性的数据样本和重复的样本数据问题,本文提出了一种基于在线顺序极限学习机(On⁃line Sequential Extreme Learning Machine,OS-ELM)的改进算法—样本线性化和数据预处理极限学习机(PDC-ELM)。PDC-ELM算法对线性不可分的数据样本先利用核函数进行处理,使数据样本具有线性可分的特征,对于处理后的数据样本,利用在线顺序极限学习机(OS-ELM)在计算之前对分类数据进行预处理,即从训练和测试数据集中查找不一样的特征标签并保存类标签中,实验中新生成的标签组将不具有重复的特征标签,大大减少了训练的对比次数。实验表明,相比于其他没有样本线性化和数据预处理的极限学习机模型,计算的准确度得到很大的提升,计算时间也有所降低。 展开更多
关键词 极限学习机 核函数 标签分类 标签数据 支持向量机
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部