-
题名多标签隐性知识显性化下的数据挖掘算法
被引量:2
- 1
-
-
作者
刘利民
张勇
-
机构
桂林电子科技大学计算机工程学院
成都中医药大学医学信息工程学院
-
出处
《计算机仿真》
北大核心
2023年第4期504-508,共5页
-
文摘
对多标签数据进行挖掘时,由于数据挖掘模式的差异,导致算法加速比较低。提出基于SECI模型与属性分类的多标签数据挖掘算法。应用SECI理论建立数据转化模型,将多标签数据的隐性知识显性化处理。结合Relief F算法和互信息,提取多标签数据特征。通过属性分类方法,按照类内距离平方和最小、类间距离平方和最大的原则设计多标签数据挖掘模式,获取数据挖掘结果。在MVVM模式的作用下,建立挖掘结果交互方案,获取实时数据挖掘结果。仿真结果表明:所提出的数据挖掘算法应用后,加速比得到了有效提升。
-
关键词
属性分类
多标签数据
数据挖掘
特征选择
隐性知识
-
Keywords
Attribute classification
Multi-label data
Data mining
Feature selection
Tacit knowledge
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于判别性矩阵分解的多标签跨模态哈希检索
被引量:1
- 2
-
-
作者
谭钰
王小琴
蓝如师
刘振丙
罗笑南
-
机构
广西图像图形与智能处理重点实验室(桂林电子科技大学)
卫星导航定位与位置服务国家地方联合工程研究中心(桂林电子科技大学)
-
出处
《计算机应用》
CSCD
北大核心
2023年第5期1349-1354,共6页
-
基金
国家自然科学基金资助项目(62172120,61936002,6202780103,61772149)
广西科技计划项目(2019GXNSFFA245014,AD18216004,AD18281079,AA18118039)
广西图像图形与智能处理重点实验室开发课题(GIIP2001)。
-
文摘
现有的跨模态哈希算法低估了不同类别标签之间语义差异的重要性,忽略了哈希向量的平衡条件,导致所学习到的哈希码的判别性能差。此外,一些方法利用标签信息构造相似性矩阵,并将多标签数据视为单标签数据进行建模,这在多标签跨模态检索中造成了较大的语义损失。为了保留异构数据之间精确的相似程度和哈希向量的平衡特性,提出了一种新的有监督哈希算法——基于判别性矩阵分解的多标签跨模态哈希检索(DMFH)。该方法利用核化特征的协同矩阵分解(CMF)获得了一个共享的隐式子空间;同时利用数据之间共有标签的比例来描述异构数据的相似程度;此外,利用标签的平衡信息构造平衡矩阵,生成具有平衡特性的哈希向量,并最大化不同类别标签之间的类间距。在两个常用多标签数据集MIRFlickr和NUS-WIDE上与7种先进的跨模态哈希方法进行对比,在“以图搜文”(I2T)和“以文搜图”(T2I)任务上,DMFH均取得了最高的平均精度均值(mAP),而且T2I任务的mAP更优,说明DMFH能够更有效地利用文本模态中的多标签语义信息。还分析了所构造的平衡矩阵与相似性矩阵的有效性,验证了DMFH算法能有效保持语义信息和相似性关系,在多标签跨模式检索中是有效的。
-
关键词
跨模态检索
矩阵分解
哈希学习
平衡向量
多标签数据
-
Keywords
cross-modal retrieval
matrix factorization
hash learning
balanced vector
multi-label data
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP391
[自动化与计算机技术—控制科学与工程]
-
-
题名利用最近邻信息快速分类多标签数据
被引量:3
- 3
-
-
作者
乔健
田庆
-
机构
西北工业大学管理学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第32期138-140,190,共4页
-
基金
教育部人文社科基金(No.09YJAZH072)
-
文摘
为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签归属的最近邻数对待分类实例进行排序分类。仿真结果表明,最近邻的选择方法对分类器性能有显著的影响;在分类效果上FKMC与ML-KNN相当,有时甚至优于后者;而在分类效率上FKMC则显著优于ML-KNN。
-
关键词
最近邻
快速分类
多标签数据
快速多标签数据分类算法(FKMC)
-
Keywords
nearest neighbors
fast classifying
multi-label data
Fast K-nearest neighbors based Multi-label Categorization(FKMC)
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于分类规则挖掘的数据多标记特征分层识别
被引量:3
- 4
-
-
作者
朱方娥
郭建方
曹丽娜
-
机构
石家庄铁道大学四方学院
-
出处
《计算机仿真》
北大核心
2021年第4期310-314,共5页
-
文摘
面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法。利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,利用分类规则挖掘方法构建一个分类识别模型,实现数据多标记特征分层识别。结果表明,与传统方法相比,所研究方法识别下,汉明损失度最小,数据多标记特征分层识别准确度最大,说明上述方法的识别质量较高,达到了研究的预期目标,为数据利用和挖掘提供了参考和借鉴。
-
关键词
分类规则挖掘
多标签数据
数据降维处理
多标记特征选择
分层识别方法
免疫算法
-
Keywords
Classification rule mining
Multi-label data
Data dimension reduction
Multi-label feature selection
Hierarchical recognition method
Immune algorithm
-
分类号
TP184.66
[自动化与计算机技术—控制理论与控制工程]
-
-
题名样本线性化与数据去重的极限学习机
- 5
-
-
作者
张灿
代子彪
安鑫
李建华
-
机构
合肥工业大学计算机与信息学院
-
出处
《智能计算机与应用》
2021年第7期24-31,共8页
-
基金
国家自然科学基金青年基金(61402145,61673156)。
-
文摘
对于多标签分类中存在非线性的数据样本和重复的样本数据问题,本文提出了一种基于在线顺序极限学习机(On⁃line Sequential Extreme Learning Machine,OS-ELM)的改进算法—样本线性化和数据预处理极限学习机(PDC-ELM)。PDC-ELM算法对线性不可分的数据样本先利用核函数进行处理,使数据样本具有线性可分的特征,对于处理后的数据样本,利用在线顺序极限学习机(OS-ELM)在计算之前对分类数据进行预处理,即从训练和测试数据集中查找不一样的特征标签并保存类标签中,实验中新生成的标签组将不具有重复的特征标签,大大减少了训练的对比次数。实验表明,相比于其他没有样本线性化和数据预处理的极限学习机模型,计算的准确度得到很大的提升,计算时间也有所降低。
-
关键词
极限学习机
核函数
多标签分类
多标签数据
支持向量机
-
Keywords
extreme learning machine
kernel function
multi-label classification
multi-label data
support vector machine
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-