DQN等深度强化学习方法的学习过程与工作机制不透明,无法感知其决策依据与决策可靠性,使模型做出的决策饱受质疑,极大限制了深度强化学习的应用场景。为了解释智能体的决策机理,提出一种基于梯度的显著性图生成算法(saliency map genera...DQN等深度强化学习方法的学习过程与工作机制不透明,无法感知其决策依据与决策可靠性,使模型做出的决策饱受质疑,极大限制了深度强化学习的应用场景。为了解释智能体的决策机理,提出一种基于梯度的显著性图生成算法(saliency map generation algorithm based on gradient,SMGG)。使用高层卷积层生成的特征图梯度信息计算不同特征图的重要性,在模型的结构和内部参数已知的情况下,从模型最后一层入手,通过对特征图梯度的计算,生成不同特征图相对于显著性图的权重;对特征重要性进行正向和负向分类,利用有正向影响的权值将特征图中捕获的特征进行加权,构成当前决策的正向解释;利用对其他类别有负向影响的权值将特征图中捕获的特征进行加权,构成当前决策的反向解释。二者共同生成决策的显著性图,得出智能体决策行为的依据,实验证明了该方法的有效性。展开更多
提出一种基于密度峰值搜索(find of density peaks,FDP)的全极化SAR图像(polarimetric synthetic aperture radar,POLSAR)无监督分类方法。由于在边缘地带以及奇异点的散射类型复杂,在无监督分类过程中干扰巨大,本文通过构建基于信息熵...提出一种基于密度峰值搜索(find of density peaks,FDP)的全极化SAR图像(polarimetric synthetic aperture radar,POLSAR)无监督分类方法。由于在边缘地带以及奇异点的散射类型复杂,在无监督分类过程中干扰巨大,本文通过构建基于信息熵的显著性图来剔除这一类点的影响,并对剩余部分的参数进行了加权处理。随后在H/珔α/A/SPAN空间基于FDP方法进行无监督分类。最后通过ESAR的数据进行了实验验证,结果证明了方法的有效性。展开更多
文摘DQN等深度强化学习方法的学习过程与工作机制不透明,无法感知其决策依据与决策可靠性,使模型做出的决策饱受质疑,极大限制了深度强化学习的应用场景。为了解释智能体的决策机理,提出一种基于梯度的显著性图生成算法(saliency map generation algorithm based on gradient,SMGG)。使用高层卷积层生成的特征图梯度信息计算不同特征图的重要性,在模型的结构和内部参数已知的情况下,从模型最后一层入手,通过对特征图梯度的计算,生成不同特征图相对于显著性图的权重;对特征重要性进行正向和负向分类,利用有正向影响的权值将特征图中捕获的特征进行加权,构成当前决策的正向解释;利用对其他类别有负向影响的权值将特征图中捕获的特征进行加权,构成当前决策的反向解释。二者共同生成决策的显著性图,得出智能体决策行为的依据,实验证明了该方法的有效性。
文摘提出一种基于密度峰值搜索(find of density peaks,FDP)的全极化SAR图像(polarimetric synthetic aperture radar,POLSAR)无监督分类方法。由于在边缘地带以及奇异点的散射类型复杂,在无监督分类过程中干扰巨大,本文通过构建基于信息熵的显著性图来剔除这一类点的影响,并对剩余部分的参数进行了加权处理。随后在H/珔α/A/SPAN空间基于FDP方法进行无监督分类。最后通过ESAR的数据进行了实验验证,结果证明了方法的有效性。