摘要
无人水面艇(Unmanned Surface Vehicle,USV)是一种自主式海洋无人航行运载器,在无人控制领域中被广泛研究,但复杂环境下传统的控制方法建模困难且不具有很好泛化性。本文以深度强化学习算法为基础,建立无人艇在复杂海况下的环境,分析并设计环境的状态空间、动作空间和奖励等,通过经验池回放技术提供训练样本,训练网络以实现对航线的跟踪。通过实验仿真验证,训练后的网络能够很好地对无人艇进行控制,并具有对不同航线和无人艇模型具有良好的泛化性。
出处
《计测技术》
2018年第A01期207-211,共5页
Metrology & Measurement Technology