【莫烦强化学习】视频笔记(一)3. 为什么用强化学习?

【莫烦强化学习系列视频】笔记本

第3节 为什么用强化学习?

强化学习是机器学习中的一个大的分支,随着近些年的发展,强化学习也多与深度学习相结合。总的来说,强化学习就是让你的计算机从无到有地学习,不需要任何“监督(Um……基本上就是自学,从小白到大佬的意思) 参考”来进行学习如何选择动作,如何行动才能获得给更高的回报。之前说过,强化学习具有 “分数导向性”
下面是一些强化学习的小例子,其中环境就是比如迷宫,哪里是起点,那里是墙,哪里是终点(这些都可以叫做状态),还有状态转移概率,可视化等等,动作比如东南西北、上下左右等等。计算机通过不断尝试(前期宛如智障),然后不断总结经验(更新策略),最终得到最优策略的过程。
优酷 强化学习模拟视频