期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
免疫分析法进展 被引量:12
1
作者 杨晓达 常文保 慈云祥 《化学进展》 SCIE CAS CSCD 1995年第2期83-97,共15页
本文首先从试剂分析的观,点对免疫分析的原理进行了论述,对抗体作为分析试剂进行了评价并且总结了标记免疫分析的三种方式和四个环节;其次,对免疫分析的现状作了综述,并评述了当代免疫分析的五个热点:基因工程抗体,生物素。亲合... 本文首先从试剂分析的观,点对免疫分析的原理进行了论述,对抗体作为分析试剂进行了评价并且总结了标记免疫分析的三种方式和四个环节;其次,对免疫分析的现状作了综述,并评述了当代免疫分析的五个热点:基因工程抗体,生物素。亲合素多重标记体系,时间分辨荧光免疫分析,多组分免疫分析和自动化免疫分析;最后,对免疫分析的发展趋势作了讨论。 展开更多
关键词 免疫分析 抗体 基因工程抗体 多重标记
下载PDF
基于改进ReliefF的多标记特征选择算法 被引量:9
2
作者 孙林 陈雨生 徐久成 《山东大学学报(理学版)》 CAS CSCD 北大核心 2022年第4期1-11,共11页
针对传统的ReliefF算法仅能处理单标记数据,以及其改进算法没有充分利用样本间相关性等问题,提出一种基于改进ReliefF的多标记特征选择算法。首先使用余弦相似度函数衡量样本特征间的相似程度,利用杰卡德距离度量样本的标记之间的标记... 针对传统的ReliefF算法仅能处理单标记数据,以及其改进算法没有充分利用样本间相关性等问题,提出一种基于改进ReliefF的多标记特征选择算法。首先使用余弦相似度函数衡量样本特征间的相似程度,利用杰卡德距离度量样本的标记之间的标记相关性,定义样本间相似度函数度量样本在整个样本空间的相似关系。然后,定义样本的同类或异类判别公式,判断随机样本的最近邻同类和异类样本。最后,提出新的特征权值迭代公式改进ReliefF算法,设计多标记特征选择算法。通过平均分类精度、覆盖率、1错误率、排序损失、汉明损失这5种评价指标,在7个公开多标记数据集上分析和测试所提算法的分类性能。实验结果表明所提算法是有效的。 展开更多
关键词 多标记 特征选择 标记相关性 RELIEFF
原文传递
A Novel Metadata Based Multi-Label Document Classification Technique
3
作者 Naseer Ahmed Sajid Munir Ahmad +13 位作者 Atta-ur Rahman Gohar Zaman Mohammed Salih Ahmed Nehad Ibrahim Mohammed Imran BAhmed Gomathi Krishnasamy Reem Alzaher Mariam Alkharraa Dania AlKhulaifi Maryam AlQahtani Asiya A.Salam Linah Saraireh Mohammed Gollapalli Rashad Ahmed 《Computer Systems Science & Engineering》 SCIE EI 2023年第8期2195-2214,共20页
From the beginning,the process of research and its publication is an ever-growing phenomenon and with the emergence of web technologies,its growth rate is overwhelming.On a rough estimate,more than thirty thousand res... From the beginning,the process of research and its publication is an ever-growing phenomenon and with the emergence of web technologies,its growth rate is overwhelming.On a rough estimate,more than thirty thousand research journals have been issuing around four million papers annually on average.Search engines,indexing services,and digital libraries have been searching for such publications over the web.Nevertheless,getting the most relevant articles against the user requests is yet a fantasy.It is mainly because the articles are not appropriately indexed based on the hierarchies of granular subject classification.To overcome this issue,researchers are striving to investigate new techniques for the classification of the research articles especially,when the complete article text is not available(a case of nonopen access articles).The proposed study aims to investigate the multilabel classification over the available metadata in the best possible way and to assess,“to what extent metadata-based features can perform in contrast to content-based approaches.”In this regard,novel techniques for investigating multilabel classification have been proposed,developed,and evaluated on metadata such as the Title and Keywords of the articles.The proposed technique has been assessed for two diverse datasets,namely,from the Journal of universal computer science(J.UCS)and the benchmark dataset comprises of the articles published by the Association for computing machinery(ACM).The proposed technique yields encouraging results in contrast to the state-ofthe-art techniques in the literature. 展开更多
关键词 multilabel classification INDEXING METADATA content/data mining
下载PDF
The multilabel fault diagnosis model of bearing based on integrated convolutional neural network and gated recurrent unit
4
作者 Shanling Han Shoudong Zhang +1 位作者 Yong Li Long Chen 《International Journal of Intelligent Computing and Cybernetics》 EI 2022年第3期401-413,共13页
Purpose-Intelligent diagnosis of equipment faults can effectively avoid the shutdown caused by equipment faults and improve the safety of the equipment.At present,the diagnosis of various kinds of bearing fault inform... Purpose-Intelligent diagnosis of equipment faults can effectively avoid the shutdown caused by equipment faults and improve the safety of the equipment.At present,the diagnosis of various kinds of bearing fault information,such as the occurrence,location and degree of fault,can be carried out by machine learning and deep learning and realized through the multiclassification method.However,the multiclassification method is not perfect in distinguishing similar fault categories and visual representation of fault information.To improve the above shortcomings,an end-to-end fault multilabel classification model is proposed for bearing fault diagnosis.Design/methodology/approach-In this model,the labels of each bearing are binarized by using the binary relevance method.Then,the integrated convolutional neural network and gated recurrent unit(CNN-GRU)is employed to classify faults.Different from the general CNN networks,the CNN-GRU network adds multiple GRU layers after the convolutional layers and the pool layers.Findings-The Paderborn University bearing dataset is utilized to demonstrate the practicability of the model.The experimental results show that the average accuracy in test set is 99.7%,and the proposed network is better than multilayer perceptron and CNN in fault diagnosis of bearing,and the multilabel classification method is superior to the multiclassification method.Consequently,the model can intuitively classify faults with higher accuracy.Originality/value-The fault labels of each bearing are labeled according to the failure or not,the fault location,the damage mode and the damage degree,and then the binary value is obtained.The multilabel problem is transformed into a binary classification problem of each fault label by the binary relevance method,and the predicted probability value of each fault label is directly output in the output layer,which visually distinguishes different fault conditions. 展开更多
关键词 Intelligent fault diagnosis Bearing fault multilabel classification CNN-GRU Binary relevance method
原文传递
ENSOCOM: Ensemble of Multi-Output Neural Network’s Components for Multi-Label Classification
5
作者 Khudran M.Alzhrani 《Computers, Materials & Continua》 SCIE EI 2022年第9期5459-5479,共21页
Multitasking and multioutput neural networks models jointly learn related classification tasks from a shared structure.Hard parameters sharing is a multitasking approach that shares hidden layers between multiple task... Multitasking and multioutput neural networks models jointly learn related classification tasks from a shared structure.Hard parameters sharing is a multitasking approach that shares hidden layers between multiple taskspecific outputs.The output layers’weights are essential in transforming aggregated neurons outputs into tasks labels.This paper redirects the multioutput network research to prove that the ensemble of output layers prediction can improve network performance in classifying multi-label classification tasks.The network’s output layers initialized with different weights simulate multiple semi-independent classifiers that can make non-identical label sets predictions for the same instance.The ensemble of a multi-output neural network that learns to classify the same multi-label classification task per output layer can outperform an individual output layer neural network.We propose an ensemble strategy of output layers components in the multi-output neural network for multi-label classification(ENSOCOM).The baseline and proposed models are selected based on the size of the hidden layer and the number of output layers to evaluate the proposed method comprehensively.The ENSOCOM method improved the performance of the neural networks on five different multi-label datasets based on several evaluation metrics.The methods presented in this work can substitute the standard labels representation and predictions generation of any neural network. 展开更多
关键词 Ensemble learning multilabel classification neural networks
下载PDF
面向不均衡医学数据集的疾病预测模型研究 被引量:43
6
作者 陈旭 刘鹏鹤 +5 位作者 孙毓忠 沈曦 张磊 王晓青 孙晓平 程伟 《计算机学报》 EI CSCD 北大核心 2019年第3期596-609,共14页
基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然... 基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然而,在医疗领域往往存在着样本数据集不均衡的问题,导致模型的预测效果降低.欠采样技术是目前解决样本不均衡问题的常用手段.其主要采用一定的方法从多数类样本中抽取部分样本,与少数类样本组成平衡数据集后再构建模型.现有的欠采样方法往往可以显著提高模型对少数类样本的召回率,然而其通常也会造成模型准确率的降低,从而限制了预测模型的整体提升效果.为此,该文提出了一种新的基于迭代提升欠采样的集成分类方法(Under-Sampling with Iteratively Boosting,USIB),该方法迭代地从多数类样本中进行欠抽样,构建多组弱分类器,并采用加权组合方式将这些弱分类器构成一个强分类器,从而提升样本不平衡条件下单种疾病预测效果.另外,医学病例样本数据集通常是多类别、多标签的,为此,该文将多个单种疾病的预测模型进行组合构成一个多标签疾病预测模型,以满足临床意义上的多病种以及并发症的诊断.为了进一步提升多标签预测模型的效果,该文设计了一种基于标签最大互信息生成树的标签选择方法(Labels Selection method based on Maximum Mutual Information Spanning Tree,LS-MMIST),该方法根据原始数据集的分布构建标签之间的最大互信息生成树,在每一次的样本预测阶段,借助树中疾病标签之间的关系确定最终的预测标签集合.实验方面,该文首先选择三种公开的不均衡二分类数据集和我们私有的四种稀有疾病的数据集,对该文提出的迭代提升欠采样方法进行性能评估.其次,分别对比了该文提出的多标签预测模型与现有的多标签预测技术在 展开更多
关键词 疾病预测 不均衡数据集 欠采样 二分类 多标签分类
下载PDF
基于ReliefF和最大相关最小冗余的多标记特征选择 被引量:7
7
作者 孙林 徐枫 +1 位作者 李硕 王振 《河南师范大学学报(自然科学版)》 CAS 北大核心 2023年第6期21-29,F0002,共10页
针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy,mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的... 针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy,mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的相关度,使用每项相关度占其相关度之和的比例设计了标记权重,由此构建了特征和标记集间的相关度,初选与标记集相关度高的特征;其次,计算对象在特征上的距离,构建了新的特征权值更新公式,基于标记权重改进多标记ReliefF模型.然后,基于互信息和标记权重构建了最大相关性,设计了最小冗余性及其新的最大相关最小冗余评价准则,并将其应用于多标记特征选择,进一步剔除冗余特征;最后,设计了一种基于ReliefF和最大相关最小冗余的多标记特征选择算法,有效提高了多标记分类性能.在8个多标记数据集上测试所提算法的平均分类精度、覆盖率、汉明损失、1错误率和排序损失,实验结果证明了该算法的有效性. 展开更多
关键词 多标记学习 特征选择 标记权重 RELIEFF 最大相关最小冗余
下载PDF
基于Fisher score与模糊邻域熵的多标记特征选择算法 被引量:3
8
作者 孙林 马天娇 薛占熬 《计算机应用》 CSCD 北大核心 2023年第12期3779-3789,共11页
针对Fisher score未充分考虑特征与标记以及标记之间的相关性,以及一些邻域粗糙集模型容易忽略边界域中知识粒的不确定性,导致算法分类性能偏低等问题,提出一种基于Fisher score与模糊邻域熵的多标记特征选择算法(MLFSF)。首先,利用最... 针对Fisher score未充分考虑特征与标记以及标记之间的相关性,以及一些邻域粗糙集模型容易忽略边界域中知识粒的不确定性,导致算法分类性能偏低等问题,提出一种基于Fisher score与模糊邻域熵的多标记特征选择算法(MLFSF)。首先,利用最大信息系数(MIC)衡量特征与标记之间的关联程度,构建特征与标记关系矩阵;基于修正余弦相似度定义标记关系矩阵,分析标记之间的相关性。其次,给出一种二阶策略获得多个二阶标记关系组,以此重新划分多标记论域;通过增强标记之间的强相关性和削弱标记之间的弱相关性得到每个特征的得分,进而改进Fisher score模型,对多标记数据进行预处理。再次,引入多标记分类间隔,定义自适应邻域半径和邻域类并构造了上、下近似集;在此基础上提出了多标记粗糙隶属度函数,将多标记邻域粗糙集映射到模糊集,基于多标记模糊邻域给出了上、下近似集以及多标记模糊邻域粗糙集模型,由此定义模糊邻域熵和多标记模糊邻域熵,有效度量边界域的不确定性。最后,设计基于二阶标记相关性的多标记Fisher score特征选择算法(MFSLC),从而构建MLFSF。在多标记K近邻(MLKNN)分类器下11个多标记数据集上的实验结果表明,相较于ReliefF多标记特征选择(MFSR)等6种先进算法,MLFSF的平均分类精度(AP)的均值提高了2.47~6.66个百分点;同时,在多数数据集上,MLFSF在5个评价指标上均能取得最优值。 展开更多
关键词 多标记学习 特征选择 Fisher score 多标记模糊邻域粗糙集 模糊邻域熵
下载PDF
基于LSTM网络的谐波多标签分类 被引量:9
9
作者 陈倩 齐林海 王红 《电力建设》 北大核心 2019年第7期101-106,共6页
针对电力电子设备的广泛接入,谐波污染更加复杂、影响更大等问题,引入了长短期记忆网络(long short-term memory,LSTM),提出LSTM与多标签分类算法融合的复合谐波扰动分类模型。该模型首先通过LSTM提取特征值,再通过全连接层进行特征降... 针对电力电子设备的广泛接入,谐波污染更加复杂、影响更大等问题,引入了长短期记忆网络(long short-term memory,LSTM),提出LSTM与多标签分类算法融合的复合谐波扰动分类模型。该模型首先通过LSTM提取特征值,再通过全连接层进行特征降维处理,最后通过分类层进行多标签分类识别。使用该模型克服了人工进行特征选择的缺陷,以及传统神经网络训练时收敛速度慢、容易陷入局部最优的缺点。实验结果表明,在不同的噪声条件下该算法模型可有效分类识别复合谐波扰动。 展开更多
关键词 谐波分类识别 特征提取 长短期记忆网络(LSTM) 多标签分类 深度学习
原文传递
基于中心偏移的Fisher score与直觉邻域模糊熵的多标记特征选择
10
作者 孙林 马天娇 《计算机科学》 CSCD 北大核心 2024年第7期96-107,共12页
现有多标记Fisher score模型中边缘样本会影响算法分类效果。鉴于邻域直觉模糊熵处理不确定信息时具有更强的表达能力与分辨能力的优势,文中提出了一种基于中心偏移的Fisher score与邻域直觉模糊熵的多标记特征选择方法。首先,根据标记... 现有多标记Fisher score模型中边缘样本会影响算法分类效果。鉴于邻域直觉模糊熵处理不确定信息时具有更强的表达能力与分辨能力的优势,文中提出了一种基于中心偏移的Fisher score与邻域直觉模糊熵的多标记特征选择方法。首先,根据标记将多标记论域划分为多个样本集,计算样本集的特征均值作为标记下样本的原始中心点,以最远样本的距离乘以距离系数,去除边缘样本集,定义了新的有效样本集,计算中心偏移处理后的标记下每个特征的得分以及标记集的特征得分,进而建立了基于中心偏移的多标记Fisher score模型,预处理多标记数据。然后,引入多标记分类间隔作为自适应模糊邻域半径参数,定义了模糊邻域相似关系和模糊邻域粒,由此构造了多标记模糊邻域粗糙集的上、下近似集;在此基础上提出了多标记邻域粗糙直觉隶属度函数和非隶属度函数,定义了多标记邻域直觉模糊熵。最后,给出了特征的外部和内部重要度的计算公式,设计了基于邻域直觉模糊熵的多标记特征选择算法,筛选出最优特征子集。在多标记K近邻分类器下、9个多标记数据集上的实验结果表明,所提算法选择的最优子集具有良好的分类性能。 展开更多
关键词 多标记学习 特征选择 Fisher score 多标记模糊邻域粗糙集 邻域直觉模糊熵
下载PDF
不稳定型心绞痛患者不良结局的多标签预测模型构建
11
作者 王紫芸 张瑜 +2 位作者 韩港飞 闫晶晶 田晶 《中国循证心血管医学杂志》 2024年第6期651-656,共6页
目的不稳定型心绞痛患者不良结局具有多维性的特点,传统统计方法多对不稳定型心绞痛的单维结局进行预测,无法解决多标签数据特征冗余、标签不平衡等问题。本文尝试采用多标签合成少数类过采样技术(MLSMOTE)算法进行处理,并构建多标签预... 目的不稳定型心绞痛患者不良结局具有多维性的特点,传统统计方法多对不稳定型心绞痛的单维结局进行预测,无法解决多标签数据特征冗余、标签不平衡等问题。本文尝试采用多标签合成少数类过采样技术(MLSMOTE)算法进行处理,并构建多标签预测模型,以提高其预测性能。方法收集来自2017年1月~2020年5月于山西医科大学第二医院收治的不稳定型心绞痛患者纳入本研究。采用回顾性和前瞻性相结合的临床队列收集患者信息。以不稳定型心绞痛患者发生心肌梗死、心力衰竭、血运重建、脑卒中、死亡为结局,使用改进Relief F的多标记特征选择(RF-ML)算法选择多标签特征子集,MLSMOTE算法进行多标签不平衡处理,在此基础上构建分类器链(CC)的多标签分类模型,选取随机森林、朴素贝叶斯、支持向量机、K近邻(K-nearest neighbors,KNN)算法等为基分类器进行比较,并评价模型性能。结果采用多标签特征选择方法RF-ML进行变量筛选,最终筛选出18个变量纳入模型,分别为:尿酸、肌酐、血小板、氯、血红蛋白、收缩压、舒张压、心率、钠、血清总胆红素、血清间接胆红素、白蛋白、血清总胆汁酸、体质指数(BMI)、血糖、血清直接胆红素、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇。采用多标签不平衡算法MLSMOTE对此次研究涉及的5个标签:心肌梗死、心力衰竭、血运重建、脑卒中、死亡进行不平衡处理。采用不平衡处理后的数据,选择随机森林、朴素贝叶斯、支持向量机、KNN作为基分类器,建立CC模型,结果显示以朴素贝叶斯为基分类器的CC模型在Ranking loss、Macro_AUC、Micro_AUC、Macro_F1、Micro_F1、Macro_recall六个指标上的表现性能均优于其他模型。结论本研究采用MLSMOTE算法进行不平衡处理,使原始标签的不平衡率得到一定改善。运用均衡化数据建立CC模型,充分考虑了标签的特定特� 展开更多
关键词 不稳定型心绞痛 多标签特征选择 多标签不平衡 标签特定特征
下载PDF
基于农业网络信息分类的热词自动提取方法 被引量:8
12
作者 段青玲 张璐 +1 位作者 刘怡然 王沙沙 《农业机械学报》 EI CAS CSCD 北大核心 2018年第7期160-167,共8页
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料... 热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助。 展开更多
关键词 农业网络信息 农业舆情监测 热词 多标记分类 热度计算
下载PDF
基于标记相关性和ReliefF的多标记特征选择 被引量:6
13
作者 孙林 杜雯娟 +1 位作者 李硕 徐久成 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第5期834-846,共13页
针对现有一些特征选择算法未充分考虑特征和标记之间的相关性,造成分类精度偏低,以及ReliefF算法中样本间分类间隔较大导致分类无意义的问题,提出了一种基于标记相关性和改进ReliefF的多标记特征选择方法。首先,根据正类样本在标记集合... 针对现有一些特征选择算法未充分考虑特征和标记之间的相关性,造成分类精度偏低,以及ReliefF算法中样本间分类间隔较大导致分类无意义的问题,提出了一种基于标记相关性和改进ReliefF的多标记特征选择方法。首先,根据正类样本在标记集合中的所占比例定义标记权重,结合互信息和标记权重,构建特征与标记集合之间的相关度计算公式,有效反映特征与标记集的相关性,进而提高算法的分类精度。然后,依据ReliefF模型中的距离计算公式,分别计算样本与最近邻异类样本、最近邻同类样本的距离,提出一种新的样本分类间隔,结合标记权重与分类间隔构建新的特征权值更新公式,有效解决了传统ReliefF算法中因样本间距离过大导致异类样本和同类样本失效的问题。最后,结合标记相关性和改进的ReliefF算法,设计了一种新的多标记特征选择算法。在7个多标记数据集上选择不同评价指标,对所提多标记特征选择算法进行仿真实验与分析,实验结果表明所提算法是有效的。 展开更多
关键词 多标记学习 特征选择 标记相关性 RELIEFF
下载PDF
基于超前钻探及优化集成算法的隧道围岩双层质量评价 被引量:6
14
作者 梁铭 彭浩 +3 位作者 解威威 宋冠先 朱孟龙 张亚飞 《隧道建设(中英文)》 CSCD 北大核心 2022年第8期1443-1452,共10页
为解决隧道超前钻探地质预报在解译过程中存在的主观判断性强、定量数据利用率低、评判标准不统一等问题,通过引入机器学习中的极限梯度提升集成算法模型(extreme gradient boosting,XGBoost),结合钻探数据开展隧道围岩完整程度与围岩... 为解决隧道超前钻探地质预报在解译过程中存在的主观判断性强、定量数据利用率低、评判标准不统一等问题,通过引入机器学习中的极限梯度提升集成算法模型(extreme gradient boosting,XGBoost),结合钻探数据开展隧道围岩完整程度与围岩级别的双层质量评价研究。一方面,采取数据降噪、等距分割、二级指标计算等数据预处理手段对11 233条原始钻探采样数据进行规律发掘和质量提升;另一方面,结合遗传算法(genetic algorithm,GA)与分类器链(classifier chains,CC)构建GA-CC-XGBoost模型,实现复杂机器学习模型的超参数组合自动寻优以及多标签分类的内在相关性考虑。最终所构建训练集的完整程度与围岩级别2项标签的分类准确率分别为95.91%、97.95%,综合分类准确率为93.88%。经过实际隧道工程应用表明,该模型预测结果满足现场超前钻探地质预报的解译需求。 展开更多
关键词 隧道工程 超前地质预报 水平钻探 模型优化 多标签分类
下载PDF
融合视觉关系检测的电力场景自动危险预警 被引量:7
15
作者 高明 左红群 +4 位作者 柏帆 田清阳 葛志峰 董兴宁 甘甜 《中国图象图形学报》 CSCD 北大核心 2021年第7期1583-1593,共11页
目的借助深度学习强大的识别与检测能力,辅助人工进行电力场景下的危险描述与作业预警是一种较为经济和高效的电力安全监管手段。然而,目前主流的以目标检测技术为基础的预警系统只能给出部分危险目标的信息,忽视了电力设备的单目危险... 目的借助深度学习强大的识别与检测能力,辅助人工进行电力场景下的危险描述与作业预警是一种较为经济和高效的电力安全监管手段。然而,目前主流的以目标检测技术为基础的预警系统只能给出部分危险目标的信息,忽视了电力设备的单目危险关系和成对对象间潜在的二元危险关系。不同于以往的方法,为了拓展危险预警模块的识别能力与功能范畴,本文提出了一种在电力场景下基于视觉关系检测的自动危险预警描述生成方法。方法对给定的待检测图像,通过目标检测模块得到图中对象的类别名称和限界框位置;分别对图像进行语义特征、视觉特征和空间位置特征的抽取,将融合后的总特征送入关系检测模块,输出单个对象的一元关系和成对对象间的关系三元组;根据检测出的对象类别和关系信息,进行危险预测并给出警示描述。结果本文自主搜集了多场景下的电力生产作业图像并进行标注,同时进行大量消融实验。实验显示,结合了语义特征、空间特征和视觉特征的关系检测器在前5召回率Recall@5和前10召回率Recall@10上的精度分别达到86.80%和93.93%,比仅使用视觉特征的关系检测器的性能提高约15%。结论本文提出的融合多模态特征输入的视觉关系检测网络能够较好地给出谓词关系的最佳匹配,并减少不合理的关系预测,且具有一定零样本学习(zero-shot learning)能力。相关可视化结果表明,整体系统能够较好地完成电力场景下的危险预警描述任务。 展开更多
关键词 危险预警 目标检测 视觉关系检测 多模态特征融合 多标签余量损失
原文传递
软多标签和深度特征融合的无监督行人重识别 被引量:6
16
作者 张宝华 朱思雨 +6 位作者 吕晓琪 谷宇 王月明 刘新 任彦 李建军 张明 《光电工程》 CAS CSCD 北大核心 2020年第12期13-22,共10页
跨摄像头场景中依赖面向标签映射关系的学习以提高识别精度,有监督行人重识别模型虽然识别精度较好,但存在可扩展问题,诸如算法识别精度严重依赖有效的监督信息,算法实时性差等;针对上述问题,提出一种基于软多标签的无监督行人重识别算... 跨摄像头场景中依赖面向标签映射关系的学习以提高识别精度,有监督行人重识别模型虽然识别精度较好,但存在可扩展问题,诸如算法识别精度严重依赖有效的监督信息,算法实时性差等;针对上述问题,提出一种基于软多标签的无监督行人重识别算法。为了提高标签匹配精度,首先利用软多标签逼近真实标签,通过计算参考数据集和参考代理在软多标签函数中的损失函数,预训练参考数据集,并构建预训练与训练结果的映射模型。再通过生成数据和真实数据分布的最小距离的期望即简化的2-Wasserstein距离计算相机视图中软多标签均值和标准差得到损失函数,解决跨视域标签一致性问题。为了提高软多标签对未标记目标数据集的有效性,计算联合嵌入损失,挖掘不同类别间的相似对,纠正跨域分布错位。针对残差网络训练时长和无监督学习精度低的问题,通过结合压缩激励网络(SENet)和多层级深度特征融合改进残差网络的结构,提高训练速度和精度。实验结果表明,该方法在标准数据集下的首位命中率和平均精度均值优于先进相关算法。 展开更多
关键词 残差网络 行人重识别 软多标签 无监督 深度特征
下载PDF
基于互信息的Fisher Score多标记特征选择 被引量:2
17
作者 孙林 张起峰 徐久成 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第1期55-66,共12页
目前,Fisher Score模型在处理多标记数据时没有考虑样本和整个特征空间之间以及特征和标记之间的关系.提出一种基于互信息的Fisher Score多标记特征选择方法.首先,在多标记决策系统中考虑整个样本空间对特征选择的影响,根据异类样本与... 目前,Fisher Score模型在处理多标记数据时没有考虑样本和整个特征空间之间以及特征和标记之间的关系.提出一种基于互信息的Fisher Score多标记特征选择方法.首先,在多标记决策系统中考虑整个样本空间对特征选择的影响,根据异类样本与同类样本之间的欧式距离定义权重公式,并在特征空间下对标记赋予权重衡量标记的重要程度.然后,基于互信息理论定义特征与每个标记之间的互信息来计算每个特征和每个标记之间的相关度,将特征与标记之间的相关度与该标记所占的权重相结合来定义特征和标记集之间的总相关度.将Fisher得分与总相关度结合,定义每个特征的新的Fisher得分,进而构建多标记Fisher Score模型.最后,设计了一种基于互信息的Fisher Score多标记特征选择算法.在六个多标记数据集上的实验证明,提出的算法与其他算法相比,其四种评价指标都表现良好,分类性能出色. 展开更多
关键词 多标记学习 特征选择 互信息 Fisher Score
下载PDF
结合双流形映射的不完备多标签学习
18
作者 许智磊 黄睿 《计算机工程》 CAS CSCD 北大核心 2024年第4期104-112,共9页
在多标签学习中,有效利用标签相关性可以提高分类性能。然而,由于人工标注标签的主观性和实际应用中标签语义的相似性,通常只能观察到不完备的标签空间,导致标签相关性的估计不准确,使得算法性能下降。针对该问题,提出一种结合双流形映... 在多标签学习中,有效利用标签相关性可以提高分类性能。然而,由于人工标注标签的主观性和实际应用中标签语义的相似性,通常只能观察到不完备的标签空间,导致标签相关性的估计不准确,使得算法性能下降。针对该问题,提出一种结合双流形映射的不完备多标签学习(ML-DMM)算法。构造两种流形映射,一种是保留实例数据空间局部结构信息的特征流形映射,另一种是基于迭代学习得到的标签相关性的标签流形映射。首先通过拉普拉斯映射构造数据的低维流形,然后通过回归系数矩阵和标签相关性矩阵将初始特征空间和初始标签空间分别映射到该低维流形上,形成一种双流形映射结构来提升算法性能,最后利用迭代学习得到的回归系数矩阵进行多标签分类。在8个多标签数据集及3种标签缺失率情况下的对比实验结果表明,ML-DMM算法性能优于其他针对缺失标签的多标签分类算法。 展开更多
关键词 多标签学习 缺失标签 标签相关性 低维流形 双流形映射
下载PDF
基于BERT模型的安全生产事故多标签文本分类 被引量:6
19
作者 吴德平 时翔 王晓东 《武汉工程大学学报》 CAS 2021年第5期586-590,共5页
结合安全生产事故案例文本特点,利用自然语言处理(NLP)技术对安全生产事故分类,基于转换器的双向编码表征(BERT)模型利用“抽取+生成”相结合的方式获得文本摘要,再通过迁移学习训练提升模型性能,并利用分组分类算法对文本的52个标签进... 结合安全生产事故案例文本特点,利用自然语言处理(NLP)技术对安全生产事故分类,基于转换器的双向编码表征(BERT)模型利用“抽取+生成”相结合的方式获得文本摘要,再通过迁移学习训练提升模型性能,并利用分组分类算法对文本的52个标签进行多标签分类,获得较好的分类效果,为安全生产监管、事故隐患的排查和分析奠定基础。 展开更多
关键词 BERT模型 抽取式摘要 生成式摘要 迁移学习 多标签文本分类
下载PDF
一种基于树型贝叶斯网络的集成多标记分类算法 被引量:3
20
作者 张志东 王志海 +1 位作者 刘海洋 孙艳歌 《计算机科学》 CSCD 北大核心 2018年第3期189-195,共7页
在多标记分类问题中,有效地利用标记间的依赖关系是进一步提升分类器性能的主要途径之一。基于分类器链算法,利用互信息度量理论构造分类对象的类属性之间明确的多标记关系依赖模型,并依据建立的标记依赖模型将分类器链中的线性依赖拓... 在多标记分类问题中,有效地利用标记间的依赖关系是进一步提升分类器性能的主要途径之一。基于分类器链算法,利用互信息度量理论构造分类对象的类属性之间明确的多标记关系依赖模型,并依据建立的标记依赖模型将分类器链中的线性依赖拓展成树型依赖,以适应更为复杂的标记依赖关系;同时,在此基础上利用Stacking集成学习方法建立最终训练模型,提出了一种新的针对树型依赖表示模型的Stacking算法。在多个实验数据集上的实验结果表明,与原有的Stacking集成学习相比,该算法提升了分类器的相应评价指标。 展开更多
关键词 多标记分类 标记依赖 STACKING 树型贝叶斯网络
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部