以MOTOROLA嵌入式处理器POWER PC 7410为核心的系统支撑平台,依靠高处理速度和强大的处理能力,使整体性能得到保证,系统具有很好的稳定性和可靠性。系统以MPC7410做为核心处理器,以MPC107做为北桥芯片,外挂高速CACHE作为二级缓存,充分利...以MOTOROLA嵌入式处理器POWER PC 7410为核心的系统支撑平台,依靠高处理速度和强大的处理能力,使整体性能得到保证,系统具有很好的稳定性和可靠性。系统以MPC7410做为核心处理器,以MPC107做为北桥芯片,外挂高速CACHE作为二级缓存,充分利用60X总线、系统本地总线和PORT X总线,充分发挥高的平台性能。展开更多
在复杂的连续空间应用场景中,经典的离散空间强化学习方法已难以满足实际需要,而已有的连续空间强化学习方法主要采用线性拟合方法逼近状态值函数和动作选择函数,存在精度不高的问题。提出一种基于联合神经网络非线性行动者评论家方法(a...在复杂的连续空间应用场景中,经典的离散空间强化学习方法已难以满足实际需要,而已有的连续空间强化学习方法主要采用线性拟合方法逼近状态值函数和动作选择函数,存在精度不高的问题。提出一种基于联合神经网络非线性行动者评论家方法(actor-critic approach based on union neural network,UNN-AC)。该方法将动作选择函数和评论值函数表示为统一的联合神经网络模型,利用联合神经网络非线性拟合状态值函数和动作选择概率。与已有的线性拟合方法相比,非线性UNN-AC提高了对评论值函数和动作选择函数的拟合精度。实验结果表明,UNN-AC算法能够有效求解连续空间中近似最优策略问题。与经典的连续动作空间算法相比,该算法具有收敛速度快和稳定性高的优点。展开更多
文摘以MOTOROLA嵌入式处理器POWER PC 7410为核心的系统支撑平台,依靠高处理速度和强大的处理能力,使整体性能得到保证,系统具有很好的稳定性和可靠性。系统以MPC7410做为核心处理器,以MPC107做为北桥芯片,外挂高速CACHE作为二级缓存,充分利用60X总线、系统本地总线和PORT X总线,充分发挥高的平台性能。
文摘在复杂的连续空间应用场景中,经典的离散空间强化学习方法已难以满足实际需要,而已有的连续空间强化学习方法主要采用线性拟合方法逼近状态值函数和动作选择函数,存在精度不高的问题。提出一种基于联合神经网络非线性行动者评论家方法(actor-critic approach based on union neural network,UNN-AC)。该方法将动作选择函数和评论值函数表示为统一的联合神经网络模型,利用联合神经网络非线性拟合状态值函数和动作选择概率。与已有的线性拟合方法相比,非线性UNN-AC提高了对评论值函数和动作选择函数的拟合精度。实验结果表明,UNN-AC算法能够有效求解连续空间中近似最优策略问题。与经典的连续动作空间算法相比,该算法具有收敛速度快和稳定性高的优点。