期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于强化学习的工控系统恶意软件行为检测方法 被引量:14
1
作者 高洋 王礼伟 +5 位作者 任望 谢丰 莫晓锋 罗熊 王卫苹 杨玺 《工程科学学报》 EI CSCD 北大核心 2020年第4期455-462,共8页
网络环境下的恶意软件严重威胁着工控系统的安全,随着目前恶意软件变种的逐渐增多,给工控系统恶意软件的检测和安全防护带来了巨大的挑战.现有的检测方法存在着自适应检测识别的智能化程度不高等局限性.针对此问题,围绕威胁工控系统网... 网络环境下的恶意软件严重威胁着工控系统的安全,随着目前恶意软件变种的逐渐增多,给工控系统恶意软件的检测和安全防护带来了巨大的挑战.现有的检测方法存在着自适应检测识别的智能化程度不高等局限性.针对此问题,围绕威胁工控系统网络安全的恶意软件对象,本文通过结合利用强化学习这一高级的机器学习算法,设计了一个检测应用方法框架.在实现过程中,根据恶意软件行为检测的实际需求,充分结合强化学习的序列决策和动态反馈学习等智能特征,详细讨论并设计了其中的特征提取网络、策略网络和分类网络等关键应用模块.基于恶意软件实际测试数据集进行的应用实验验证了本文方法的有效性,可为一般恶意软件行为检测提供一种智能化的决策辅助手段. 展开更多
关键词 恶意软件 检测方法 强化学习 特征提取 策略网络
下载PDF
一种改进的深度确定性策略梯度网络交通信号控制系统 被引量:8
2
作者 刘利军 王州 余臻 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第4期87-93,共7页
交通信号系统控制着城市车辆运行秩序,其效率高低直接影响了社会经济的发展.以十字路口的交通信号控制系统为研究对象,基于深度确定性策略梯度网络DDPG提出了一种改进算法.结合交通环境的特点设计了特征增强和样本去重算法提高算法的性... 交通信号系统控制着城市车辆运行秩序,其效率高低直接影响了社会经济的发展.以十字路口的交通信号控制系统为研究对象,基于深度确定性策略梯度网络DDPG提出了一种改进算法.结合交通环境的特点设计了特征增强和样本去重算法提高算法的性能.通过对实际交通系统运行情况进行调研,基于SUMO仿真环境搭建了交叉路口交通仿真平台.利用FEPG算法控制交通信号,实现了车辆的高效通行.实验结果表明,该算法能够有效地降低车辆等待时间,减少车辆的污染排放. 展开更多
关键词 交通信号控制 强化学习 样本去重 特征增强
下载PDF
拼装式锚杆(索)框架结构力学特征数值模拟与试验研究 被引量:7
3
作者 苏俊霞 郑静 +2 位作者 安孟康 孙书伟 杨秀梅 《铁道建筑》 北大核心 2017年第10期101-104,共4页
为快速治理灾后边坡病害,研发了2种新型拼装式锚杆(索)框架结构。通过数值模拟进行比选,可知横梁为单向变截面矩形梁时,拼装式锚杆(索)框架在应力分布、变形协调及施工难度上优于横梁为单向变截面倒T形梁时。对优选框架在全风化砂岩边... 为快速治理灾后边坡病害,研发了2种新型拼装式锚杆(索)框架结构。通过数值模拟进行比选,可知横梁为单向变截面矩形梁时,拼装式锚杆(索)框架在应力分布、变形协调及施工难度上优于横梁为单向变截面倒T形梁时。对优选框架在全风化砂岩边坡的力学分布特征进行数值模拟,结果显示,框架在节点处弯矩和剪力最大,锚固点下部土体在集中力作用下发生较大沉陷变形,跨中部位出现挤压变形。现场试验表明,框架在节点处出现破坏。由数值模拟和现场试验结果可知,框架结构可以满足一般锚固工程对反力构件承载能力的要求。 展开更多
关键词 铁路路基 边坡加固 拼装式锚杆(索)框架 力学特征 数值模拟 试验研究
下载PDF
喷锚支护洞室受力特征研究 被引量:5
4
作者 董武 《武汉理工大学学报(交通科学与工程版)》 2011年第2期401-405,共5页
为研究喷锚支护作用机理及其对围岩的加固效果,采用模型试验和数值计算方法,分别对洞室围岩介质应变、洞壁位移、锚杆应变和纵向应力进行了量测和模拟,研究了喷锚支护在均质围岩中的受力特点和变形特征,分析了支护参数选择对加固效果的... 为研究喷锚支护作用机理及其对围岩的加固效果,采用模型试验和数值计算方法,分别对洞室围岩介质应变、洞壁位移、锚杆应变和纵向应力进行了量测和模拟,研究了喷锚支护在均质围岩中的受力特点和变形特征,分析了支护参数选择对加固效果的影响以及单独喷锚支护和喷锚联合支护在围岩加固效果上的区别.采用有限差分软件得出的结果与试验数据的吻合性较好,进一步证实了模型参数和建模的有效性和正确性.并根据试验结果,提出了较合理的锚杆参数选择及布置的建议. 展开更多
关键词 隧道工程 喷锚支护 洞室加固 受力特征 模型试验 数值模拟
下载PDF
Feature Selection and Feature Learning for High-dimensional Batch Reinforcement Learning: A Survey 被引量:2
5
作者 De-Rong Liu Hong-Liang Li Ding Wang 《International Journal of Automation and computing》 EI CSCD 2015年第3期229-242,共14页
Tremendous amount of data are being generated and saved in many complex engineering and social systems every day.It is significant and feasible to utilize the big data to make better decisions by machine learning tech... Tremendous amount of data are being generated and saved in many complex engineering and social systems every day.It is significant and feasible to utilize the big data to make better decisions by machine learning techniques. In this paper, we focus on batch reinforcement learning(RL) algorithms for discounted Markov decision processes(MDPs) with large discrete or continuous state spaces, aiming to learn the best possible policy given a fixed amount of training data. The batch RL algorithms with handcrafted feature representations work well for low-dimensional MDPs. However, for many real-world RL tasks which often involve high-dimensional state spaces, it is difficult and even infeasible to use feature engineering methods to design features for value function approximation. To cope with high-dimensional RL problems, the desire to obtain data-driven features has led to a lot of works in incorporating feature selection and feature learning into traditional batch RL algorithms. In this paper, we provide a comprehensive survey on automatic feature selection and unsupervised feature learning for high-dimensional batch RL. Moreover, we present recent theoretical developments on applying statistical learning to establish finite-sample error bounds for batch RL algorithms based on weighted Lpnorms. Finally, we derive some future directions in the research of RL algorithms, theories and applications. 展开更多
关键词 Intelligent control reinforcement learning adaptive dynamic programming feature selection feature learning big data.
原文传递
基于深度强化学习的自适应图像隐写算法
6
作者 钱清 龙永 +2 位作者 蒋忠远 段春红 王宏 《计算机工程》 CAS CSCD 北大核心 2024年第8期319-327,共9页
针对自适应图像隐写中如何在轻量化隐写、最佳嵌入定位、高隐匿输出三者之间实现均衡的问题,提出一种基于深度强化学习的自适应图像隐写算法(AISA-DRL)。设计一种轻量化安全隐写网络,在降低模型隐写成本的前提下加强模型对图像隐写特征... 针对自适应图像隐写中如何在轻量化隐写、最佳嵌入定位、高隐匿输出三者之间实现均衡的问题,提出一种基于深度强化学习的自适应图像隐写算法(AISA-DRL)。设计一种轻量化安全隐写网络,在降低模型隐写成本的前提下加强模型对图像隐写特征的提取能力,增强载密图像的安全性和稳定性。首先将具有高效特征融合特性的EPSANet引入EfficientnetV2-s,得到改进的EPSA-EfficientnetV2-s,以提高像素级嵌入过程的表征能力,从而获得最优像素修改位张量。随后将秘密信息与最优像素修改位张量加权求和得到载密图像。最后通过学习隐写分析网络对载密图像进行最优像素级奖励分配,根据设计的最小化失真函数通过梯度回传来更新网络参数,以获得最佳嵌入位置,从而实现秘密信息的最佳化嵌入。实验结果表明,AISA-DRL算法的模型参数量减少了94.22%,FLOPs减少了24.88%,与其他基于强化学习的隐写方案相比,在不同经典隐写分析器下的检错率提高了2.48%~6.55%。此外,在不同载荷下生成的载密图像PSNR值均在30 dB以上,不仅提高了模型对像素修改位的定位准确率,而且使隐写网络具有更强的表征能力。 展开更多
关键词 图像隐写 强化学习 隐写分析 嵌入策略 特征提取
下载PDF
Regional Multi-Agent Cooperative Reinforcement Learning for City-Level Traffic Grid Signal Control
7
作者 Yisha Li Ya Zhang +1 位作者 Xinde Li Changyin Sun 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2024年第9期1987-1998,共12页
This article studies the effective traffic signal control problem of multiple intersections in a city-level traffic system.A novel regional multi-agent cooperative reinforcement learning algorithm called RegionSTLight... This article studies the effective traffic signal control problem of multiple intersections in a city-level traffic system.A novel regional multi-agent cooperative reinforcement learning algorithm called RegionSTLight is proposed to improve the traffic efficiency.Firstly a regional multi-agent Q-learning framework is proposed,which can equivalently decompose the global Q value of the traffic system into the local values of several regions Based on the framework and the idea of human-machine cooperation,a dynamic zoning method is designed to divide the traffic network into several strong-coupled regions according to realtime traffic flow densities.In order to achieve better cooperation inside each region,a lightweight spatio-temporal fusion feature extraction network is designed.The experiments in synthetic real-world and city-level scenarios show that the proposed RegionS TLight converges more quickly,is more stable,and obtains better asymptotic performance compared to state-of-theart models. 展开更多
关键词 Human-machine cooperation mixed domain attention mechanism multi-agent reinforcement learning spatio-temporal feature traffic signal control
下载PDF
Double DQN Method For Botnet Traffic Detection System
8
作者 Yutao Hu Yuntao Zhao +1 位作者 Yongxin Feng Xiangyu Ma 《Computers, Materials & Continua》 SCIE EI 2024年第4期509-530,共22页
In the face of the increasingly severe Botnet problem on the Internet,how to effectively detect Botnet traffic in realtime has become a critical problem.Although the existing deepQnetwork(DQN)algorithminDeep reinforce... In the face of the increasingly severe Botnet problem on the Internet,how to effectively detect Botnet traffic in realtime has become a critical problem.Although the existing deepQnetwork(DQN)algorithminDeep reinforcement learning can solve the problem of real-time updating,its prediction results are always higher than the actual results.In Botnet traffic detection,although it performs well in the training set,the accuracy rate of predicting traffic is as high as%;however,in the test set,its accuracy has declined,and it is impossible to adjust its prediction strategy on time based on new data samples.However,in the new dataset,its accuracy has declined significantly.Therefore,this paper proposes a Botnet traffic detection system based on double-layer DQN(DDQN).Two Q-values are designed to adjust the model in policy and action,respectively,to achieve real-time model updates and improve the universality and robustness of the model under different data sets.Experiments show that compared with the DQN model,when using DDQN,the Q-value is not too high,and the detectionmodel has improved the accuracy and precision of Botnet traffic.Moreover,when using Botnet data sets other than the test set,the accuracy and precision of theDDQNmodel are still higher than DQN. 展开更多
关键词 DQN DDQN deep reinforcement learning botnet detection feature classification
下载PDF
MDP下基于特征表示强化学习的自适应交通信号控制 被引量:4
9
作者 夏新海 《公路交通科技》 CAS CSCD 北大核心 2015年第1期116-121,共6页
将传统强化学习算法应用到交叉口自适应交通信号控制中,存在着维数灾难的问题,即状态和动作空间大小随着交叉口的增加而呈指数增长。因此,将交叉口自适应交通信号控制问题看成马尔科夫决策过程(MDP)问题,通过有效地利用基于特征的状态... 将传统强化学习算法应用到交叉口自适应交通信号控制中,存在着维数灾难的问题,即状态和动作空间大小随着交叉口的增加而呈指数增长。因此,将交叉口自适应交通信号控制问题看成马尔科夫决策过程(MDP)问题,通过有效地利用基于特征的状态表示和线性平均函数估计思想,减少了计算复杂度,保证了收敛性。在设置的多交叉口交通环境下,仿真试验表明:在不同的交通需求水平和车流到达分布下,此算法均优于定时控制和传统的强化学习算法,并且其参数θ和学习步数是收敛的。 展开更多
关键词 交通工程 交通信号控制 强化学习 交叉口 特征表示
原文传递
Modified reward function on abstract features in inverse reinforcement learning 被引量:1
10
作者 Shen-yi CHEN Hui QIAN Jia FAN Zhuo-jun JIN Miao-liang ZHU 《Journal of Zhejiang University-Science C(Computers and Electronics)》 SCIE EI 2010年第9期718-723,共6页
We improve inverse reinforcement learning(IRL) by applying dimension reduction methods to automatically extract Abstract features from human-demonstrated policies,to deal with the cases where features are either unkno... We improve inverse reinforcement learning(IRL) by applying dimension reduction methods to automatically extract Abstract features from human-demonstrated policies,to deal with the cases where features are either unknown or numerous.The importance rating of each abstract feature is incorporated into the reward function.Simulation is performed on a task of driving in a five-lane highway,where the controlled car has the largest fixed speed among all the cars.Performance is almost 10.6% better on average with than without importance ratings. 展开更多
关键词 Importance rating Abstract feature feature extraction Inverse reinforcement learning(IRL) Markov decision process(MDP)
原文传递
基于强化学习的特征选择算法 被引量:3
11
作者 朱振国 赵凯旋 刘民康 《计算机系统应用》 2018年第10期214-218,共5页
针对在数据挖掘过程中存在的维度灾难和特征冗余问题,本文在传统特征选择方法的基础上结合强化学习中Q学习方法,提出基于强化学习的特征选择算法,智能体Agent通过训练学习后自主决策得到特征子集.实验结果表明,本文提出的算法能有效的... 针对在数据挖掘过程中存在的维度灾难和特征冗余问题,本文在传统特征选择方法的基础上结合强化学习中Q学习方法,提出基于强化学习的特征选择算法,智能体Agent通过训练学习后自主决策得到特征子集.实验结果表明,本文提出的算法能有效的减少特征数量并有较高的分类性能. 展开更多
关键词 强化学习 特征选择 Q学习 特征子集 数据挖掘
下载PDF
融合强化学习和关系网络的样本分类 被引量:3
12
作者 张碧陶 庞振全 《计算机工程与应用》 CSCD 北大核心 2019年第21期189-196,253,共9页
针对少量训练样本在深度学习算法中难以实现高精度分类的问题,提出一种融合强化学习和关系网络的小样本分类算法。采用图像预处理过程中基于强化学习的美学意识图像自动裁剪模型,通过构建美学意识奖励函数来输出最佳裁剪图像,从而保留... 针对少量训练样本在深度学习算法中难以实现高精度分类的问题,提出一种融合强化学习和关系网络的小样本分类算法。采用图像预处理过程中基于强化学习的美学意识图像自动裁剪模型,通过构建美学意识奖励函数来输出最佳裁剪图像,从而保留图像最具特征部分。利用关系网络模型,将自动裁剪后的小样本图像中的训练样本图像与测试图像通过关系网络中的嵌入模块进行特征提取。将提取后的特征进行特征映射级联,并将级联后的特征映射馈送到关系网络中的关系模块中进行比较,将最终产生的0到1范围内的关系评分作为比较结果,从而判断测试图像所属的类别。在小样本数据集上进行实验并与现有方法进行对比,实验表明该方法能够实现较高精度的小样本分类。 展开更多
关键词 小样本分类 强化学习 自动裁剪 关系网络 特征映射
下载PDF
Greedy feature replacement for online value function approximation
13
作者 Feng-fei ZHAO Zheng QIN +2 位作者 Zhuo SHAO Jun FANG Bo-yan REN 《Journal of Zhejiang University-Science C(Computers and Electronics)》 SCIE EI 2014年第3期223-231,共9页
Reinforcement learning(RL) in real-world problems requires function approximations that depend on selecting the appropriate feature representations. Representational expansion techniques can make linear approximators ... Reinforcement learning(RL) in real-world problems requires function approximations that depend on selecting the appropriate feature representations. Representational expansion techniques can make linear approximators represent value functions more effectively; however, most of these techniques function well only for low dimensional problems. In this paper, we present the greedy feature replacement(GFR), a novel online expansion technique, for value-based RL algorithms that use binary features. Given a simple initial representation, the feature representation is expanded incrementally. New feature dependencies are added automatically to the current representation and conjunctive features are used to replace current features greedily. The virtual temporal difference(TD) error is recorded for each conjunctive feature to judge whether the replacement can improve the approximation. Correctness guarantees and computational complexity analysis are provided for GFR. Experimental results in two domains show that GFR achieves much faster learning and has the capability to handle large-scale problems. 展开更多
关键词 reinforcement learning Function approximation feature dependency Online expansion feature replacement
原文传递
基于残差反馈和自注意力的图像篡改取证网络 被引量:1
14
作者 袁国龙 张玉金 刘洋 《计算机应用》 CSCD 北大核心 2023年第9期2925-2931,共7页
现存的使用噪声特征的多篡改类型图像伪造检测算法,往往不能有效地检测篡改区域和非篡改区域之间的特征差异,特别是对复制-粘贴篡改类型。为此,提出一种融合残差反馈和自注意力机制的双流编-解码器图像篡改取证网络,通过两个流分别检测... 现存的使用噪声特征的多篡改类型图像伪造检测算法,往往不能有效地检测篡改区域和非篡改区域之间的特征差异,特别是对复制-粘贴篡改类型。为此,提出一种融合残差反馈和自注意力机制的双流编-解码器图像篡改取证网络,通过两个流分别检测RGB像素的非自然边缘等篡改伪影和局部噪声不一致性。首先,在编码器阶段使用多个融合残差反馈的双重残差单元提取相关篡改特征,以获得粗特征图;其次,通过改进后的自注意力机制对粗特征图进行进一步特征增强;随后,将互相对应的编码器浅层特征和解码器深层特征进行融合;最后,串联融合两个流最终提取到的篡改特征,再通过一个特殊卷积操作实现对篡改区域的像素级定位。实验结果表明,所提网络在COVERAGE数据集上的F1值和曲线下面积(AUC)优于对比网络。在NIST16、Columbia数据集上,所提网络的F1值相较于TED-Net(Two-stream Encoder-Decoder Network)分别提高了9.8和7.7个百分点,AUC分别提高了1.1和6.5个百分点。所提网络在复制-粘贴篡改类型检测上取得了良好的效果,并且也适用于其他篡改类型检测。同时,该网络能在像素级上对篡改区域准确定位,检测性能优于对比网络。 展开更多
关键词 图像篡改 编-解码器 特征增强 残差反馈 自注意力机制 噪声特征
下载PDF
SiC增强铝基复合材料的切屑形貌与变形 被引量:2
15
作者 王大镇 李波 闫勇刚 《组合机床与自动化加工技术》 北大核心 2009年第11期13-16,共4页
SiC增强铝基复合材料切削时的切屑形貌和变形系数是确定切削变形程度的重要手段,是计算其它切削过程参数的来源。通过采用硬质合金和聚晶金刚石PCD刀具车削SiC增强铝基复合材料,观察切屑形貌的SEM图片,检测切屑变形尺寸,计算切屑变形系... SiC增强铝基复合材料切削时的切屑形貌和变形系数是确定切削变形程度的重要手段,是计算其它切削过程参数的来源。通过采用硬质合金和聚晶金刚石PCD刀具车削SiC增强铝基复合材料,观察切屑形貌的SEM图片,检测切屑变形尺寸,计算切屑变形系数。结果表明,正常切削条件下切屑形态为节状锯齿形,且锯齿顶角约为45°;切削速度对变形系数的影响曲线呈驼峰型,即在积屑瘤生长阶段,增大切削速度会减小变形系数,而在积屑瘤消退阶段,增大切削速度会增大变形系数;随着进给量和刀具前角的增加,变形系数都会相应地减小。 展开更多
关键词 SiC增强相 铝基复合材料 切屑形貌 变形系数
下载PDF
Feature Selection with Deep Reinforcement Learning for Intrusion Detection System 被引量:1
16
作者 S.Priya K.Pradeep Mohan Kumar 《Computer Systems Science & Engineering》 SCIE EI 2023年第9期3339-3353,共15页
An intrusion detection system(IDS)becomes an important tool for ensuring security in the network.In recent times,machine learning(ML)and deep learning(DL)models can be applied for the identification of intrusions over... An intrusion detection system(IDS)becomes an important tool for ensuring security in the network.In recent times,machine learning(ML)and deep learning(DL)models can be applied for the identification of intrusions over the network effectively.To resolve the security issues,this paper presents a new Binary Butterfly Optimization algorithm based on Feature Selection with DRL technique,called BBOFS-DRL for intrusion detection.The proposed BBOFSDRL model mainly accomplishes the recognition of intrusions in the network.To attain this,the BBOFS-DRL model initially designs the BBOFS algorithm based on the traditional butterfly optimization algorithm(BOA)to elect feature subsets.Besides,DRL model is employed for the proper identification and classification of intrusions that exist in the network.Furthermore,beetle antenna search(BAS)technique is applied to tune the DRL parameters for enhanced intrusion detection efficiency.For ensuring the superior intrusion detection outcomes of the BBOFS-DRL model,a wide-ranging experimental analysis is performed against benchmark dataset.The simulation results reported the supremacy of the BBOFS-DRL model over its recent state of art approaches. 展开更多
关键词 Intrusion detection security reinforcement learning machine learning feature selection beetle antenna search
下载PDF
基于上下文注意的强化学习目标检测 被引量:1
17
作者 曹立春 智敏 《计算机应用与软件》 北大核心 2023年第5期221-226,共6页
为了完善目标检测中的小目标、遮挡等造成的漏检问题,提出融合上下文的强化学习算法。在特征提取阶段,采用U型网络框架,并通过引入上下文机制,推测判定可能存在的特征,利用向量拼接的方式得到最终特征。在目标检测阶段,引入强化学习Soft... 为了完善目标检测中的小目标、遮挡等造成的漏检问题,提出融合上下文的强化学习算法。在特征提取阶段,采用U型网络框架,并通过引入上下文机制,推测判定可能存在的特征,利用向量拼接的方式得到最终特征。在目标检测阶段,引入强化学习Soft Actor-Critic模型来提升检测精度。实验证明,该方法对目标检测精确度有了明显的提升,有效地提高了对小目标的检测能力。 展开更多
关键词 目标检测 上下文信息 强化学习 Actor-Critic 特征融合
下载PDF
基于Solidworks不同肋板三维建模方法研究 被引量:1
18
作者 侯俊芳 薛爱文 《科技创新与生产力》 2016年第4期85-86,共2页
分析经典零件的基本特征和肋板构型,运用Solidworks软件的拉伸和筋特征,对不同零件及肋板特征建模方法进行了详细的设计研究,有效地方便了编辑符合国家标准的机械制图的工程图。
关键词 零件 肋板 拉伸特征 筋特征
下载PDF
基于改进U型网络的注意强化学习目标检测 被引量:1
19
作者 曹立春 《计算机应用与软件》 北大核心 2022年第6期169-175,共7页
为了提高目标检测领域小目标漏检及整体的检测精度不高的问题,提出改进的U-Net,以提取不同尺度的特征,并引入强化学习来调整包围框的精度。具体过程是定义检测框为agent,agent根据初始候选区域信息决定移动行为以选择下一个逼近真实目... 为了提高目标检测领域小目标漏检及整体的检测精度不高的问题,提出改进的U-Net,以提取不同尺度的特征,并引入强化学习来调整包围框的精度。具体过程是定义检测框为agent,agent根据初始候选区域信息决定移动行为以选择下一个逼近真实目标的候选区域,重复上述过程直至agent确定当前区域足够精确时终止搜索过程。实验证明,该方法的目标检测精确度相比文献[16]方法提升了1.6百分点,有效地提升了小目标的利用率。 展开更多
关键词 目标检测 U型网络 强化学习 特征融合 注意力机制机
下载PDF
A Reinforcement Learning System for Fault Detection and Diagnosis in Mechatronic Systems 被引量:1
20
作者 Wanxin Zhang Jihong Zhu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2020年第9期1119-1130,共12页
With the increasing demand for the automation of operations and processes in mechatronic systems,fault detection and diagnosis has become a major topic to guarantee the process performance.There exist numerous studies... With the increasing demand for the automation of operations and processes in mechatronic systems,fault detection and diagnosis has become a major topic to guarantee the process performance.There exist numerous studies on the topic of applying artificial intelligence methods for fault detection and diagnosis.However,much of the focus has been given on the detection of faults.In terms of the diagnosis of faults,on one hand,assumptions are required,which restricts the diagnosis range.On the other hand,different faults with similar symptoms cannot be distinguished,especially when the model is not trained by plenty of data.In this work,we proposed a reinforcement learning system for fault detection and diagnosis.No assumption is required.Feature exaction is first made.Then with the features as the states of the environment,the agent directly interacts with the environment.Optimal policy,which determines the exact category,size and location of the fault,is obtained by updating Q values.The method takes advantage of expert knowledge.When the features are unclear,action will be made to get more information from the new state for further determination.We create recurrent neural network with the long short-term memory architecture to approximate Q values.The application on a motor is discussed.The experimental results validate that the proposed method demonstrates a significant improvement compared with existing state-of-the-art methods of fault detection and diagnosis. 展开更多
关键词 CLASSIFICATION reinforcement learning neural network feature exaction and selection fault detection and diagnosis
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部