期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
基于Lattice-LSTM的多粒度中文分词 被引量:17
1
作者 张文静 张惠蒙 +1 位作者 杨麟儿 荀恩东 《中文信息学报》 CSCD 北大核心 2019年第1期18-24,共7页
中文分词是中文信息处理领域中的一项关键基础技术,而多粒度分词是中文分词领域较新的研究方向。针对多粒度中文分词任务,该文提出一种基于Lattice-LSTM的多粒度中文分词模型,在传统基于字的多粒度中文分词模型基础上,加入了多分词粒度... 中文分词是中文信息处理领域中的一项关键基础技术,而多粒度分词是中文分词领域较新的研究方向。针对多粒度中文分词任务,该文提出一种基于Lattice-LSTM的多粒度中文分词模型,在传统基于字的多粒度中文分词模型基础上,加入了多分词粒度的词典信息。与传统模型相比,所提出的模型在网格结构的辅助下,对不同粒度的分词标准都有较强的捕捉能力,且不局限于单一的分词标准。实验表明,该文提出的方法在多粒度中文分词方向取得了目前最好的结果。 展开更多
关键词 中文分词 多粒度 Lattice-LSTM
下载PDF
基于多模态多粒度融合网络的癫痫识别方法
2
作者 戚晓雨 丁卫平 +2 位作者 鞠恒荣 程学云 黄嘉爽 《数据采集与处理》 CSCD 北大核心 2024年第3期710-723,共14页
结构脑网络(Structural brain network,SC)和功能脑网络(Functional brain network,FC)能从不同角度反映癫痫对大脑结构信息的改变。目前,融合两类脑网络信息进行癫痫的辅助诊断已成为领域内的重要研究之一。然而,常见的融合模型仅在单... 结构脑网络(Structural brain network,SC)和功能脑网络(Functional brain network,FC)能从不同角度反映癫痫对大脑结构信息的改变。目前,融合两类脑网络信息进行癫痫的辅助诊断已成为领域内的重要研究之一。然而,常见的融合模型仅在单一粒度上融合两类脑网络信息,忽略了脑网络的多粒度属性。本文提出一种基于多模态多粒度融合网络(Multi-modal multi-grained fusion network,MMFN)的癫痫识别方法,从全局和局部两个粒度对多模态脑网络特征进行融合,充分利用两类脑网络信息。局部粒度上,设计了连接边特征融合和节点特征融合,用以重构两类脑网络的连接边层和节点层的特征图,使两个模态交互式地学习特征;全局粒度上,设计了多模态分解双线性池化模块,学习两类脑网络的联合表示。实验结果表明,相比主流方法,所提方法可以显著提高对癫痫识别的准确率,辅助医生进行癫痫诊断。 展开更多
关键词 多模态图像 多粒度 癫痫 结构脑网络 功能脑网络
下载PDF
Research on Determining the Weights of Key Influencing Factors Based on Multi-Grained Binary Semantics
3
作者 Yun Li Weizhe Shu 《Journal of Electronic Research and Application》 2024年第6期157-161,共5页
To effectively address the complexity of the environment,information uncertainty,and variability among decision-makers in the event of an enterprise emergency,a multi-granularity binary semantic-based emergency decisi... To effectively address the complexity of the environment,information uncertainty,and variability among decision-makers in the event of an enterprise emergency,a multi-granularity binary semantic-based emergency decision-making method is proposed.Decision-makers use preferred multi-granularity non-uniform linguistic scales combined with binary semantics to represent the evaluation information of key influencing factors.Secondly,the weights were determined based on the proposed method.Finally,the proposed method’s effectiveness is validated using a case study of a fire incident in a chemical company. 展开更多
关键词 multi-grained binary semantics EMERGENCY Key influencing factor
下载PDF
Deep learning for predictive mechanical properties of hot-rolled strip in complex manufacturing systems 被引量:2
4
作者 Feifei Li Anrui He +5 位作者 Yong Song Zheng Wang Xiaoqing Xu Shiwei Zhang Yi Qiang Chao Liu 《International Journal of Minerals,Metallurgy and Materials》 SCIE EI CAS CSCD 2023年第6期1093-1103,共11页
Higher requirements for the accuracy of relevant models are put throughout the transformation and upgrade of the iron and steel sector to intelligent production.It has been difficult to meet the needs of the field wit... Higher requirements for the accuracy of relevant models are put throughout the transformation and upgrade of the iron and steel sector to intelligent production.It has been difficult to meet the needs of the field with the usual prediction model of mechanical properties of hotrolled strip.Insufficient data and difficult parameter adjustment limit deep learning models based on multi-layer networks in practical applications;besides,the limited discrete process parameters used make it impossible to effectively depict the actual strip processing process.In order to solve these problems,this research proposed a new sampling approach for mechanical characteristics input data of hot-rolled strip based on the multi-grained cascade forest(gcForest)framework.According to the characteristics of complex process flow and abnormal sensitivity of process path and parameters to product quality in the hot-rolled strip production,a three-dimensional continuous time series process data sampling method based on time-temperature-deformation was designed.The basic information of strip steel(chemical composition and typical process parameters)is fused with the local process information collected by multi-grained scanning,so that the next link’s input has both local and global features.Furthermore,in the multi-grained scanning structure,a sub sampling scheme with a variable window was designed,so that input data with different dimensions can get output characteristics of the same dimension after passing through the multi-grained scanning structure,allowing the cascade forest structure to be trained normally.Finally,actual production data of three steel grades was used to conduct the experimental evaluation.The results revealed that the gcForest-based mechanical property prediction model outperforms the competition in terms of comprehensive performance,ease of parameter adjustment,and ability to sustain high prediction accuracy with fewer samples. 展开更多
关键词 hot-rolled strip prediction of mechanical properties deep learning multi-grained cascade forest time series feature extraction variable window subsampling
下载PDF
典型可重构架构的算法映射分析 被引量:1
5
作者 方琛 何卫锋 毛志刚 《微电子学与计算机》 CSCD 北大核心 2013年第8期160-164,168,共6页
可重构架构高效、灵活,能够满足嵌入式处理领域的高性能需求.通过对三种粗粒度与两种多粒度的典型可重构架构进行建模,将算法分类,并映射不同类型的算法到可重构架构上,从硬件利用率,计算时间,输入输出带宽,数据组织形式,数据复用率等... 可重构架构高效、灵活,能够满足嵌入式处理领域的高性能需求.通过对三种粗粒度与两种多粒度的典型可重构架构进行建模,将算法分类,并映射不同类型的算法到可重构架构上,从硬件利用率,计算时间,输入输出带宽,数据组织形式,数据复用率等五个方面进行分析,得到多粒度的可重构架构,配以灵活的互联能够更好地完成各类算法,但是总体的硬件利用率较低.而数据带宽仍然是可重构架构的瓶颈.为可重构架构设计提供理论依据. 展开更多
关键词 可重构架构 粗粒度 多粒度 计算密集型 I/O密集型 算法映射
下载PDF
An efficient wear-leveling-aware multi-grained allocator for persistent memory file systems
6
作者 Zhiwang YU Runyu ZHANG +2 位作者 Chaoshu YANG Shun NIE Duo LIU 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2023年第5期688-702,共15页
Persistent memory(PM)file systems have been developed to achieve high performance by exploiting the advanced features of PMs,including nonvolatility,byte addressability,and dynamic random access memory(DRAM)like perfo... Persistent memory(PM)file systems have been developed to achieve high performance by exploiting the advanced features of PMs,including nonvolatility,byte addressability,and dynamic random access memory(DRAM)like performance.Unfortunately,these PMs suffer from limited write endurance.Existing space management strategies of PM file systems can induce a severely unbalanced wear problem,which can damage the underlying PMs quickly.In this paper,we propose a Wear-leveling-aware Multi-grained Allocator,called WMAlloc,to achieve the wear leveling of PMs while improving the performance of file systems.WMAlloc adopts multiple min-heaps to manage the unused space of PMs.Each heap represents an allocation granularity.Then,WMAlloc allocates less-worn blocks from the corresponding min-heap for allocation requests.Moreover,to avoid recursive split and inefficient heap locations in WMAlloc,we further propose a bitmap-based multi-heap tree(BMT)to enhance WMAlloc,namely,WMAlloc-BMT.We implement WMAlloc and WMAlloc-BMT in the Linux kernel based on NOVA,a typical PM file system.Experimental results show that,compared with the original NOVA and dynamic wear-aware range management(DWARM),which is the state-of-the-art wear-leveling-aware allocator of PM file systems,WMAlloc can,respectively,achieve 4.11×and 1.81×maximum write number reduction and 1.02×and 1.64×performance with four workloads on average.Furthermore,WMAlloc-BMT outperforms WMAlloc with 1.08×performance and achieves 1.17×maximum write number reduction with four workloads on average. 展开更多
关键词 File system Persistent memory Wear-leveling multi-grained allocator
原文传递
基于深度森林算法的电力系统短期负荷预测 被引量:31
7
作者 陈吕鹏 殷林飞 +1 位作者 余涛 王克英 《电力建设》 北大核心 2018年第11期42-50,共9页
为了提高电力系统短期负荷预测的精确度,解决目前基于机器学习算法的负荷预测需要人为凭经验对超参数进行大量设置和调整的问题,该文将深度森林算法引入了电力系统短期负荷预测领域。深度森林算法包含多粒度扫描阶段和级联森林阶段,具... 为了提高电力系统短期负荷预测的精确度,解决目前基于机器学习算法的负荷预测需要人为凭经验对超参数进行大量设置和调整的问题,该文将深度森林算法引入了电力系统短期负荷预测领域。深度森林算法包含多粒度扫描阶段和级联森林阶段,具有表征学习的能力。与深度神经网络相比,深度森林算法能够进行高效并行训练,无须大量人为设置和调整超参数。该文选取了某地区实际电力负荷值以及气象因素数据,分别利用了前21天和前40天的数据对深度森林算法进行训练,并将其负荷预测结果与智能算法和传统分类算法的负荷预测结果进行了对比分析。试验结果表明深度森林算法具有高效的电力系统短期负荷预测的能力。 展开更多
关键词 深度森林 短期负荷预测 多粒度扫描 级联森林 超参数配置
原文传递
基于多粒度级联孤立森林算法的异常检测模型 被引量:28
8
作者 杨晓晖 张圣昌 《通信学报》 EI CSCD 北大核心 2019年第8期133-142,共10页
孤立森林算法是基于隔离机制的异常检测算法,存在与轴平行的局部异常点无法检测、对高维数据异常点缺乏敏感性和稳定性等问题。针对这些问题,提出了基于随机超平面的隔离机制和多粒度扫描机制,随机超平面使用多个维度的线性组合简化数... 孤立森林算法是基于隔离机制的异常检测算法,存在与轴平行的局部异常点无法检测、对高维数据异常点缺乏敏感性和稳定性等问题。针对这些问题,提出了基于随机超平面的隔离机制和多粒度扫描机制,随机超平面使用多个维度的线性组合简化数据模型的隔离边界,利用随机线性分类器的隔离边界能够检测更复杂的数据模式。同时,多粒度扫描机制利用滑动窗口的方式进行维度子采样,每一个维度子集均训练一个森林,多个森林集成投票决策,构造层次化集成学习异常检测模型。实验表明,改进的孤立森林算法对复杂异常数据模式有更好的稳健性,层次化集成学习模型提高了高维数据中异常检测的准确性和稳定性。 展开更多
关键词 异常检测 孤立森林 隔离机制 多粒度扫描 随机超平面
下载PDF
基于改进深度森林的滚动轴承剩余寿命预测方法 被引量:25
9
作者 王玉静 王诗达 +2 位作者 康守强 王庆岩 V.I.MIKULOVICH 《中国电机工程学报》 EI CSCD 北大核心 2020年第15期5032-5042,共11页
针对现有人工智能方法在滚动轴承剩余寿命预测中存在精度差、运算效率低的问题,提出一种基于深层迭代特征(deep iterative features,DIF)级联CatBoost(cascade catboost,CasCatBoost)的滚动轴承剩余寿命预测新方法。该方法是一种改进的... 针对现有人工智能方法在滚动轴承剩余寿命预测中存在精度差、运算效率低的问题,提出一种基于深层迭代特征(deep iterative features,DIF)级联CatBoost(cascade catboost,CasCatBoost)的滚动轴承剩余寿命预测新方法。该方法是一种改进的新型深度森林算法,首先对由快速傅里叶变换得到的滚动轴承频域信号进行迭代计算,得到迭代特征。为了减小内存的消耗,将深度森林中的多粒度扫描结构替换为卷积神经网络,提取迭代特征的深层特征,并构建性能退化特征集。然后对可实现GPU并行加速的单一CatBoost模型进行集成,引入决定系数R2构建CasCatBoost结构以提高模型的表征能力,选取模型最后一个级联层的平均寿命百分比p表示输出。最后运用一次函数对p进行拟合,预测出轴承的剩余寿命。利用PHM2012数据库对滚动轴承剩余寿命进行预测,所提方法的预测平均误差为10.57%、平均得分为0.426。 展开更多
关键词 滚动轴承 卷积神经网络 深层迭代特征 深度森林 剩余寿命预测
下载PDF
基于多传感器信息融合和多粒度级联森林模型的液压泵健康状态评估 被引量:24
10
作者 单增海 李志远 +4 位作者 张旭 黄亦翔 李彦明 刘成良 张轩 《中国机械工程》 EI CAS CSCD 北大核心 2021年第19期2374-2382,共9页
液压泵健康状态评估对工程设备的运行状态监测有极其重要的意义,现有基于振动信号分析的方法数据来源单一、可靠性低,为此,提出了一种基于多传感器信息融合和多粒度级联森林模型的液压泵健康状态评估方法。通过试验系统采集了不同工作... 液压泵健康状态评估对工程设备的运行状态监测有极其重要的意义,现有基于振动信号分析的方法数据来源单一、可靠性低,为此,提出了一种基于多传感器信息融合和多粒度级联森林模型的液压泵健康状态评估方法。通过试验系统采集了不同工作时间下液压泵的压力、温度、流量等信号,分别提取信号的时域特征组成初步特征。使用多个分类器获取初步特征的类别概率向量,将其与随机森林模型选出来的重要特征进行拼接形成最终特征,并使用多粒度级联森林模型进行健康状态评估。试验结果表明,所提方法在仅有5%训练比例的情况下分类精确率仍可达99.5%,可以有效提高液压泵健康状态评估的准确度。 展开更多
关键词 液压泵 多传感器融合 多粒度级联森林模型 健康评估
下载PDF
基于深度森林算法的窃电行为检测方法研究 被引量:21
11
作者 杨学良 陶晓峰 +2 位作者 熊霞 戚梦逸 孙萌 《智慧电力》 北大核心 2019年第10期85-92,共8页
深度学习在窃电行为检测领域的研究中应用越来越多,但传统的基于神经网络的深度学习因需要大量的训练样本、调参过程复杂等原因应用十分受限。首次将深度森林分类算法引入窃电行为检测领域,利用其依赖训练样本量小、超参数少、计算效率... 深度学习在窃电行为检测领域的研究中应用越来越多,但传统的基于神经网络的深度学习因需要大量的训练样本、调参过程复杂等原因应用十分受限。首次将深度森林分类算法引入窃电行为检测领域,利用其依赖训练样本量小、超参数少、计算效率高的优点,结合从电量、电压、电流、功率因数等数据提取的特征检测用户是否存在窃电嫌疑。通过某地区用电信息采集系统提供的负荷数据,验证了所提窃电行为检测模型的有效性。 展开更多
关键词 窃电行为检测 深度森林 多粒度扫描 级联森林 特征增强 超参数调试
下载PDF
一种加权的深度森林算法 被引量:15
12
作者 宫振华 王嘉宁 苏翀 《计算机应用与软件》 北大核心 2019年第2期274-278,共5页
深度森林DF(Deep Forest)由多粒度扫描和级联森林两个部分组成。其中:多粒度扫描通过滑动窗口技术获取多个特征子集,以增强级联森林的差异性;级联森林则是将决策树组成的森林通过级联方式实现表征学习。因此,深度森林克服深度学习参数... 深度森林DF(Deep Forest)由多粒度扫描和级联森林两个部分组成。其中:多粒度扫描通过滑动窗口技术获取多个特征子集,以增强级联森林的差异性;级联森林则是将决策树组成的森林通过级联方式实现表征学习。因此,深度森林克服深度学习参数依赖性强、训练开销大以及仅适用于大数据集等不足之处。然而,深度森林中各个子树的预测精度是各不相同的,简单算术平均会导致子树的错误预测对整个森林的预测产生影响,进而随着级数增加,有可能使错误被进一步放大。为此,提出一种根据森林中每棵子树的预测精度进行加权的深度森林。在高维和低维数据集上进行实验,结果表明:加权的深度森林在高维和低维数据集上性能都获得一定提升,特别在高维数据集上优势较为明显。 展开更多
关键词 深度森林 多粒度扫描 级联森林 加权
下载PDF
基于深度森林算法的慢性胃炎中医证候分类 被引量:15
13
作者 颜建军 刘章鹏 +4 位作者 刘国萍 郭睿 王忆勤 付晶晶 钱鹏 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期593-599,共7页
针对中医问诊复杂性和非线性的特点,采用深度森林算法(gcForest)构建慢性胃炎中医问诊证候分类模型.利用gcForest分析慢性胃炎问诊数据,建立证候分类模型,并与DBN和DBM两种深度学习算法以及ML-KNN、BSVM、ECC、RankSVM、LIFT这5种多标... 针对中医问诊复杂性和非线性的特点,采用深度森林算法(gcForest)构建慢性胃炎中医问诊证候分类模型.利用gcForest分析慢性胃炎问诊数据,建立证候分类模型,并与DBN和DBM两种深度学习算法以及ML-KNN、BSVM、ECC、RankSVM、LIFT这5种多标记学习算法构建的模型进行比较.实验结果表明,该模型在多标记评价指标和单个证型的分类准确率上都优于其他算法,能有效地解决慢性胃炎中医问诊证候分类问题,通过该算法建立的模型分类效果良好,可以为慢性胃炎证候量化诊断研究提供参考. 展开更多
关键词 证候分类 深度森林 深度学习 慢性胃炎 中医
下载PDF
基于MGS-LGBM算法的电力系统暂态稳定评估 被引量:10
14
作者 卢锦玲 郭鲁豫 +2 位作者 张梦雪 闻若彤 张祥国 《电力科学与工程》 2020年第3期52-60,共9页
多粒度级联轻型梯度提升机(MGS-LGBM)具有超参数设置简单、模型泛化能力强、分类准确率高、训练评估快等特点。为提高电力系统暂态稳定评估的准确性和快速性,将MGS-LGBM引入电力系统暂态评估中。首先通过时域仿真提取原始数据,构造能够... 多粒度级联轻型梯度提升机(MGS-LGBM)具有超参数设置简单、模型泛化能力强、分类准确率高、训练评估快等特点。为提高电力系统暂态稳定评估的准确性和快速性,将MGS-LGBM引入电力系统暂态评估中。首先通过时域仿真提取原始数据,构造能够反映系统稳定情况的23维特征量,输入MGS-LGBM模型中,稳定结果作为输出量,利用模型中的多粒度扫描和级联结构对样本特征和结果进行高效并行训练。通过新英格兰10机39节点系统仿真验证MGS-LGBM算法,通过与其它机器学习算法比较,算法在提高暂态评估准确率的同时兼顾快速性,且在含有无关特征和训练集较少的情况下仍能保持较好的评估性能。 展开更多
关键词 暂态稳定评估 人工智能 轻型梯度提升机 级联结构 多粒度扫描
下载PDF
基于深度森林的网络流量分类方法 被引量:9
15
作者 戴瑾 王天宇 王少尉 《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第4期30-34,共5页
随着网络应用的迅猛发展,流量分类在网络资源分配、流量调度和网络安全等诸多研究领域受到广泛关注。现有的机器学习流量分类方法对流量数据特征的选取和分布要求苛刻,导致在实际应用中的复杂流量场景下分类精确度和稳定度难以提高。为... 随着网络应用的迅猛发展,流量分类在网络资源分配、流量调度和网络安全等诸多研究领域受到广泛关注。现有的机器学习流量分类方法对流量数据特征的选取和分布要求苛刻,导致在实际应用中的复杂流量场景下分类精确度和稳定度难以提高。为了解决样本特征属性的复杂性给分类性能带来的不利影响,引入了基于深度森林的流量分类方法。该算法通过级联森林和多粒度扫描机制,能够在样本数量规模和特征属性选取规模有限的情况下,有效地提高流量整体分类性能。通过网络流量公开数据集Moore对支持向量机、随机森林和深度森林机器学习算法进行训练和测试,结果表明基于深度森林的网络流量分类器的分类准确率能够达到96.36%,性能优于其他机器学习模型。 展开更多
关键词 特征选取 多粒度级联森林 机器学习 网络流量分类
下载PDF
基于多粒度级联森林的骨质疏松性骨折预测研究 被引量:7
16
作者 徐辉煌 张海宇 林勇 《北京生物医学工程》 2019年第4期384-391,共8页
目的骨质疏松性骨折(osteoporotic fracture,OF)的预测对于骨折防范具有重要的临床指导意义。针对传统logistic回归预测模型存在的精度不高和未考虑遗传因子问题,本文引入多粒度级联森林(multi-grained cascade forest,gcForest)并结合... 目的骨质疏松性骨折(osteoporotic fracture,OF)的预测对于骨折防范具有重要的临床指导意义。针对传统logistic回归预测模型存在的精度不高和未考虑遗传因子问题,本文引入多粒度级联森林(multi-grained cascade forest,gcForest)并结合遗传因子来预测OF。方法首先基于 t 分布邻域嵌入( t -distributed stochastic neighbor embedding, t -SNE)算法对OF关联基因位点进行非线性降维,降维后的基因位点与临床因素构成特征组。然后构建gcForest模型对OF进行预测。最后通过10次十折分层交叉验证与logistic、梯度提升决策树、随机森林进行对比。结果基于gcForest的模型分类精度为0.892 7,AUC值为0.92±0.05,泛化性能最优。结论在考虑遗传因素的条件下,gcForest分类效果优于其他模型,验证了本文方法的高效性和实用性。 展开更多
关键词 机器学习 骨质疏松性骨折 t分布邻域嵌入 随机森林 多粒度级联森林
下载PDF
基于改进深度森林的用电信息采集故障诊断 被引量:6
17
作者 杨学良 戚梦逸 +2 位作者 丁宏 陶晓峰 刘涅煊 《电力信息与通信技术》 2022年第4期32-40,共9页
针对用电信息采集系统采集故障形式复杂多样,人工检定愈发难以满足电网公司运维需求的问题,文章提出一种基于改进深度森林的用电信息采集故障诊断算法,从表征信息与算法效率2个维度对深度森林算法进行改进,利用国内省级电力公司用电信... 针对用电信息采集系统采集故障形式复杂多样,人工检定愈发难以满足电网公司运维需求的问题,文章提出一种基于改进深度森林的用电信息采集故障诊断算法,从表征信息与算法效率2个维度对深度森林算法进行改进,利用国内省级电力公司用电信息采集系统收集特征数据集,基于提出的采集故障诊断算法进行实验,结果表明该模型平均分类准确率可达96.05%,时间与内存消耗较原始深度森林算法降低一半,性能显著优于原始深度森林。通过与多种其他类型的分类器对比,该模型的分类准确率具有明显的优势。 展开更多
关键词 深度森林 多粒度扫描 级联森林 用电信息采集系统 故障诊断
下载PDF
基于上下文保持能力的方面级情感分类模型 被引量:6
18
作者 何丽 房婉琳 张红艳 《模式识别与人工智能》 EI CSCD 北大核心 2021年第2期157-166,共10页
方面级情感分类可发现语句在不同方面隐藏的情感特征.文中基于特定方面的图卷积网络的框架,构建基于上下文保持能力的方面级情感分类模型.在图卷积层中引入上下文门控单元,整合前一层输出中的有用信息.在基于图卷积网络的模型中加入多... 方面级情感分类可发现语句在不同方面隐藏的情感特征.文中基于特定方面的图卷积网络的框架,构建基于上下文保持能力的方面级情感分类模型.在图卷积层中引入上下文门控单元,整合前一层输出中的有用信息.在基于图卷积网络的模型中加入多粒度注意力计算模块,描述方面词与上下文在情感表达上的相互关系.在5个公开数据集上的实验表明,文中模型在分类准确率和F1宏平均指标上均表现较优. 展开更多
关键词 方面级情感分类 图卷积网络 多粒度注意力计算 上下文保持能力
下载PDF
基于Stacking特征增强多粒度联级Logistic的个人信用评估 被引量:4
19
作者 侯天宝 王爱银 《河南师范大学学报(自然科学版)》 CAS 北大核心 2023年第3期111-122,共12页
主要针对广受关注的P2P网贷信用评估问题,利用机器学习方法提高申请人网贷违约预测准确率,研究出基于Stacking特征增强多粒度联级Logistic方法及其应用.所提分类器是一种混合模型,结合了Stacking集成学习和联级Logistic学习的思想.首先... 主要针对广受关注的P2P网贷信用评估问题,利用机器学习方法提高申请人网贷违约预测准确率,研究出基于Stacking特征增强多粒度联级Logistic方法及其应用.所提分类器是一种混合模型,结合了Stacking集成学习和联级Logistic学习的思想.首先,通过网格搜索技术分别建立XGBoost,Catboost,LightGBM,AdaBoost以及Gradient Boosting模型,并筛选出适合的基评估器作为Stacking集成的初级学习器,logistic模型作为次级学习器,构建基于Stacking的多粒度扫描器,生成预测结果作为元特征,拼接成新特征数据.其次,通过新特征数据以及元特征在每级Logistic上的特征增强建立联级Logistic Regression模型,并且与现有的单一集成学习器和各基评估器在3个不同的P2P网贷信用评估数据集上进行对比.实验结果表明,通过AUC、准确率等指标对其进行评价,相比于各基评估器以及其他单一集成分类器,基于Stacking增强多粒度联级Logistic模型有较高的准确率,预测效果更优. 展开更多
关键词 个人信用 特征增强 Stacking集成 多粒度扫描 联级Logistic模型
下载PDF
基于多粒度图与注意力机制的半监督短文本分类
20
作者 游奔 李晓红 +1 位作者 姚锦 冯绍杰 《计算机工程》 CAS CSCD 北大核心 2024年第5期83-90,共8页
短文本语义稀疏模糊、蕴含信息不足、表达不规则等缺陷给短文本分类任务带来了极大的挑战,且现有短文本分类方法通常忽略词项间的交互信息,不能充分挖掘隐含的语义信息,导致分类效率低下。针对上述问题,提出一种基于多粒度图与注意力机... 短文本语义稀疏模糊、蕴含信息不足、表达不规则等缺陷给短文本分类任务带来了极大的挑战,且现有短文本分类方法通常忽略词项间的交互信息,不能充分挖掘隐含的语义信息,导致分类效率低下。针对上述问题,提出一种基于多粒度图与注意力机制的半监督短文本分类模型MgGAt。该模型在词粒度和文本粒度基础上构建2种类型的图,通过充分挖掘语义信息完成分类任务。首先构建词级图,捕获词嵌入,进而学习得到文本特征表示。在词级图上引入跳内注意力和跳间注意力,从多种语义角度有效提取词项间隐含的高阶信息,捕获语义丰富的词嵌入。同时依据词级子图的特点设计池化策略,聚合词嵌入,学习文本表征。其次构建文本级图,借助部分已知的标签信息,利用图神经网络的优势,在图上执行标签传播和推理,完成半监督短文本分类任务。在4个公开数据集上的实验结果表明,与基线模型相比,MgGAt模型的短文本分类精确率平均提升了1.18个百分点,F1值平均提升了1.37个百分点,具有更好的分类性能。 展开更多
关键词 短文本分类 半监督分类 图神经网络 注意力机制 多粒度图
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部