莫烦python强化学习中的算法【伪代码】汇总

前言

将莫烦python强化学习中提及算法的【伪代码】汇总起来,方便复习。

1、Q_Learning

莫烦python强化学习中的算法【伪代码】汇总

2、Sarsa

莫烦python强化学习中的算法【伪代码】汇总

3、Sarsa_Lambda

莫烦python强化学习中的算法【伪代码】汇总

4、DQN

莫烦python强化学习中的算法【伪代码】汇总

5、Double_DQN

莫烦python强化学习中的算法【伪代码】汇总

6、暂无Dueling_DQN

7、Prioritized_DQN

莫烦python强化学习中的算法【伪代码】汇总

8、Policy_Gradients

莫烦python强化学习中的算法【伪代码】汇总

9、暂无Actor_Critic

10、DDPG

莫烦python强化学习中的算法【伪代码】汇总

11、A3C

莫烦python强化学习中的算法【伪代码】汇总

12、OpenAI_PPO

莫烦python强化学习中的算法【伪代码】汇总

13、DeepMind_PPO

莫烦python强化学习中的算法【伪代码】汇总