人工智能一种现代的方法第2章智能Agent

Agent的本质，完美性，环境多样性，分类

Agent感知序列：该Agent所接收到的是所有输入数据的完整历史。

Agent函数：描述Agent行为，将任意给定感知序列映射为行动

Agent程序：人造Agent函数的实现。

对每个可能的感知序列，根据已有的感知序列提供的证据和Agent具有的先验知识，理性Agent应该选择能使其新能最大化的行动。

全知Agent明确知道他的行动产生的实际结果并做出相应的动作，现实中不可能。

Agent要从它感知的信息中尽可能地学习。

自主性使Agent不只依赖于先验知识，也依赖于自身的感知信息。

PEAS描述：Performance，Environment，Actuators，Sensors

Agent的Sensors在每个时间点上都能获取环境的完整状态。

若监测到的信息与行动决策相关，则该任务环境是有效完全可观察的。

对抗，竞争性/

环境的下一个状态完全取决于当前状态和Agent执行的行动则环境是确定的。

片段：下一个片段不依赖于以前片段采取的行动（如大部分的分类任务）。

连续：当前决策会影响到所有未来决策。

取决于环境在Agent计算时是否会改变。

环境状态，时间处理方式，Agent感知信息和行动都有离散和连续之分。

Agent = 体系结构（计算设备） + 程序（Agent程序）

人工智能一种现代的方法第2章智能Agent

人工智能一种现代的方法第2章智能Agent

人工智能一种现代的方法第2章智能Agent

人工智能一种现代的方法第2章智能Agent

人工智能一种现代的方法第2章智能Agent

学习元件负责改进提高，性能原件负责选择外部行动。问题发生器负责可以得到新的和有信息的经验的行动建议。

各部件的工作

人工智能 一种现代的方法 第2章 智能Agent