题名 基于局部广义多粒度粗糙集的多标记最优粒度选择
被引量:10
1
作者
梁美社
米据生
侯成军
靳晨霞
机构
河北师范大学数学与信息科学学院
石家庄职业技术学院科技发展与校企合作部
河北科技大学经济管理学院
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2019年第8期718-725,共8页
基金
国家自然科学基金项目(No.61573127)
河北省自然科学基金项目(No.A2018210120)资助~~
文摘
在多粒度粗糙集模型中,粒度选择总是与正域有关.由于全体标记确定对象集上的分类过细,落入正域的对象很少或为空集,导致正域约简方法可能丢失大量信息甚至失效.为了克服这一缺陷,文中提出基于局部广义多粒度粗糙集的多标记最优粒度选择方法.首先,引入广义局部多粒度粗糙集的相关概念,通过设置信息水平参数,对单个标记的对象集合进行近似.然后,通过定义多粒度多标记信息系统的粒度质量,给出粒度重要性.最后,设计最优粒度选择的启发式算法,并通过实例验证文中方法的有效性.
关键词
多标记数据
多粒度粗糙集
最优粒度选择
粒度重要度
Keywords
multi -label data
multi -granulation Rough Set
Optimal Granulation Selection
Granular Significance
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 多标签隐性知识显性化下的数据挖掘算法
被引量:2
2
作者
刘利民
张勇
机构
桂林电子科技大学计算机工程学院
成都中医药大学医学信息工程学院
出处
《计算机仿真》
北大核心
2023年第4期504-508,共5页
文摘
对多标签数据进行挖掘时,由于数据挖掘模式的差异,导致算法加速比较低。提出基于SECI模型与属性分类的多标签数据挖掘算法。应用SECI理论建立数据转化模型,将多标签数据的隐性知识显性化处理。结合Relief F算法和互信息,提取多标签数据特征。通过属性分类方法,按照类内距离平方和最小、类间距离平方和最大的原则设计多标签数据挖掘模式,获取数据挖掘结果。在MVVM模式的作用下,建立挖掘结果交互方案,获取实时数据挖掘结果。仿真结果表明:所提出的数据挖掘算法应用后,加速比得到了有效提升。
关键词
属性分类
多标签数据
数据挖掘
特征选择
隐性知识
Keywords
Attribute classification
multi -label data
data mining
Feature selection
Tacit knowledge
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于判别性矩阵分解的多标签跨模态哈希检索
被引量:1
3
作者
谭钰
王小琴
蓝如师
刘振丙
罗笑南
机构
广西图像图形与智能处理重点实验室(桂林电子科技大学)
卫星导航定位与位置服务国家地方联合工程研究中心(桂林电子科技大学)
出处
《计算机应用》
CSCD
北大核心
2023年第5期1349-1354,共6页
基金
国家自然科学基金资助项目(62172120,61936002,6202780103,61772149)
广西科技计划项目(2019GXNSFFA245014,AD18216004,AD18281079,AA18118039)
广西图像图形与智能处理重点实验室开发课题(GIIP2001)。
文摘
现有的跨模态哈希算法低估了不同类别标签之间语义差异的重要性,忽略了哈希向量的平衡条件,导致所学习到的哈希码的判别性能差。此外,一些方法利用标签信息构造相似性矩阵,并将多标签数据视为单标签数据进行建模,这在多标签跨模态检索中造成了较大的语义损失。为了保留异构数据之间精确的相似程度和哈希向量的平衡特性,提出了一种新的有监督哈希算法——基于判别性矩阵分解的多标签跨模态哈希检索(DMFH)。该方法利用核化特征的协同矩阵分解(CMF)获得了一个共享的隐式子空间;同时利用数据之间共有标签的比例来描述异构数据的相似程度;此外,利用标签的平衡信息构造平衡矩阵,生成具有平衡特性的哈希向量,并最大化不同类别标签之间的类间距。在两个常用多标签数据集MIRFlickr和NUS-WIDE上与7种先进的跨模态哈希方法进行对比,在“以图搜文”(I2T)和“以文搜图”(T2I)任务上,DMFH均取得了最高的平均精度均值(mAP),而且T2I任务的mAP更优,说明DMFH能够更有效地利用文本模态中的多标签语义信息。还分析了所构造的平衡矩阵与相似性矩阵的有效性,验证了DMFH算法能有效保持语义信息和相似性关系,在多标签跨模式检索中是有效的。
关键词
跨模态检索
矩阵分解
哈希学习
平衡向量
多标签数据
Keywords
cross-modal retrieval
matrix factorization
hash learning
balanced vector
multi -label data
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP391
[自动化与计算机技术—控制科学与工程]
题名 基于分类规则挖掘的数据多标记特征分层识别
被引量:3
4
作者
朱方娥
郭建方
曹丽娜
机构
石家庄铁道大学四方学院
出处
《计算机仿真》
北大核心
2021年第4期310-314,共5页
文摘
面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法。利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,利用分类规则挖掘方法构建一个分类识别模型,实现数据多标记特征分层识别。结果表明,与传统方法相比,所研究方法识别下,汉明损失度最小,数据多标记特征分层识别准确度最大,说明上述方法的识别质量较高,达到了研究的预期目标,为数据利用和挖掘提供了参考和借鉴。
关键词
分类规则挖掘
多标签数据
数据降维处理
多标记特征选择
分层识别方法
免疫算法
Keywords
Classification rule mining
multi -label data
data dimension reduction
multi -label feature selection
Hierarchical recognition method
Immune algorithm
分类号
TP184.66
[自动化与计算机技术—控制理论与控制工程]
题名 利用最近邻信息快速分类多标签数据
被引量:3
5
作者
乔健
田庆
机构
西北工业大学管理学院
出处
《计算机工程与应用》
CSCD
北大核心
2011年第32期138-140,190,共4页
基金
教育部人文社科基金(No.09YJAZH072)
文摘
为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签归属的最近邻数对待分类实例进行排序分类。仿真结果表明,最近邻的选择方法对分类器性能有显著的影响;在分类效果上FKMC与ML-KNN相当,有时甚至优于后者;而在分类效率上FKMC则显著优于ML-KNN。
关键词
最近邻
快速分类
多标签数据
快速多标签数据分类算法(FKMC)
Keywords
nearest neighbors
fast classifying
multi -label data
Fast K-nearest neighbors based multi -label Categorization(FKMC)
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于模糊不一致对的多标记属性约简
被引量:1
6
作者
高琪
李德玉
王素格
机构
山西大学计算机科学与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
出处
《智能系统学报》
CSCD
北大核心
2020年第2期374-385,共12页
基金
国家自然科学基金项目(61672331,61573231,61432011,61802237)
山西省重点研发计划项目(201803D421024,201903D421041)
+1 种基金
山西省高等学校优秀成果培育项目(2019SK036)
山西省高等学校青年科研人员培育计划。
文摘
在实际生活当中,存在着大量的高维多标记数据,为解决维度灾难问题,通常需要约简属性集。针对目前的多标记属性约简算法未考虑标记关系问题,本文提出了一种融合标记关系的模糊不一致对多标记属性约简算法。利用相对熵(KL散度)度量标记之间的关系,定义标记权重,结合标记权重,定义模糊不一致对,考虑到属性对于模糊不一致对的区分性,定义属性重要性并进行属性约简。在8个数据集上的对比实验表明,所提基于模糊不一致对的多标记属性约简算法优于当前的多标记属性约简算法。
关键词
多标记数据
属性约简
模糊不一致对
标记权重
KL散度
标记关系
模糊粗糙集
区分矩阵
Keywords
multi -label data
attribute reduction
fuzzy inconsistency pairs
label weight
Kullback-Leibler divergence
the relationship of label s
fuzzy rough sets
distinguished matrix
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于联合分布的多标记迁移学习
被引量:1
7
作者
桑江徽
姜海燕
机构
南京农业大学信息科技学院
出处
《计算机工程与应用》
CSCD
北大核心
2021年第9期154-161,共8页
基金
国家自然科学基金(31872847)
江苏省重点研发计划(现代农业)重点项目(BE2019383)。
文摘
针对现有的多标记迁移学习忽略条件分布而导致泛化能力不足的问题,设计了一种基于联合分布的多标记迁移学习(Multi-label Transfer Learning via Joint Distribution Alignment,J-MLTL)。分解原始特征生成特征子空间,在子空间中计算条件分布的权重系数,最小化跨领域数据的边际分布和条件分布差异;此外,为了防止标记内部结构信息损失,利用超图对具有多个相同标签的数据进行连接,保持领域内几何流行结构不受领域外知识结构的影响,进一步最小化领域间的分布差异。实验结果表明,相比于已有多标记迁移学习算法在分类精度方面具有显著提升。
关键词
多标记数据
迁移学习
子空间学习
联合分布
Keywords
multi -label data
transfer learning
subspace learning
joint distribution
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于粗糙集理论的多标记数据互补决策约简加速算法
8
作者
李华
王思宇
王雅茹
机构
石家庄铁道大学数理系
出处
《南华大学学报(自然科学版)》
2022年第3期106-112,共7页
基金
国家自然科学基金项目(61806133)
国家留学基金项目(201908130072)。
文摘
互补决策约简是一种多标记数据属性约简方法,当数据规模较大时,其启发式算法的计算耗时较大。基于粗糙集理论,对互补决策约简启发式算法的加速算法进行了研究。当粒度由粗变细时,在逐步去掉正域的数据集上,首先研究互补决策约简中属性外部重要度的保序性质;基于此,通过逐步缩小数据规模来降低计算约简的耗时,提出了互补决策约简加速算法。加速算法不仅减少了属性约简的计算时间,而且能够保持原始算法的约简结果。
关键词
多标记数据
互补决策约简
粗糙集
保序性
Keywords
multi -label data
complementary decision reduct
rough set
rank preservation
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 样本线性化与数据去重的极限学习机
9
作者
张灿
代子彪
安鑫
李建华
机构
合肥工业大学计算机与信息学院
出处
《智能计算机与应用》
2021年第7期24-31,共8页
基金
国家自然科学基金青年基金(61402145,61673156)。
文摘
对于多标签分类中存在非线性的数据样本和重复的样本数据问题,本文提出了一种基于在线顺序极限学习机(On⁃line Sequential Extreme Learning Machine,OS-ELM)的改进算法—样本线性化和数据预处理极限学习机(PDC-ELM)。PDC-ELM算法对线性不可分的数据样本先利用核函数进行处理,使数据样本具有线性可分的特征,对于处理后的数据样本,利用在线顺序极限学习机(OS-ELM)在计算之前对分类数据进行预处理,即从训练和测试数据集中查找不一样的特征标签并保存类标签中,实验中新生成的标签组将不具有重复的特征标签,大大减少了训练的对比次数。实验表明,相比于其他没有样本线性化和数据预处理的极限学习机模型,计算的准确度得到很大的提升,计算时间也有所降低。
关键词
极限学习机
核函数
多标签分类
多标签数据
支持向量机
Keywords
extreme learning machine
kernel function
multi -label classification
multi -label data
support vector machine
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于多值分解和多类标学习的分类框架设计
10
作者
沈良忠
陈胜凯
胡捷臻
机构
温州大学城市学院
出处
《计算机系统应用》
2010年第10期187-190,22,共5页
文摘
多值多类标的数据分类是研究一个样本不但同时属于多个类别,而且在某些属性下也可能存在多个取值的问题。提出了一种结合多值分解和多类标学习的多值多类标分类框架(MDML),采用4种不同的多值分解策略,将问题转化为多类标问题,然后利用3种经典的多类标算法进行学习。实验结果表明,MDML与已有的多值多类标决策树算法相比,有效地提高了分类的性能,而且不同的组合方法适用于不同特点的数据集。
关键词
分类
多值属性分解
多类标数据
数据转化
Keywords
classification
multi -label data
multi -valued attribute decomposition
data transformation
分类号
TP311.12
[自动化与计算机技术—计算机软件与理论]
题名 针对弱标记的多标记数据集成学习分类方法
11
作者
李凤英
李宏
李培
机构
中南大学信息科学与工程学院
出处
《微型机与应用》
2012年第13期73-75,共3页
文摘
提出一种针对弱标记的多标记数据集成学习分类方法,它通过采用基于相似性成对约束投影的方法来处理数据,更好地利用了弱标记样本的特征,从而提高了分类性能。
关键词
分类
多标记数据
集成学习
弱标记数据
Keywords
classification
multi -label data
ensemble learning
weak label ing
分类号
TP399
[自动化与计算机技术—计算机应用技术]