教材：《人工智能及其应用》，蔡自兴等，2016m清华大学出版社（第5版）

参考书：
《人工智能》之《非经典推理》

现实世界中的大多数问题是不确定、非完备的。对于这些问题，若采用前面所讨论的确定性推理方法显然是无法解决的。为此，人工智能需要研究不确定性的推理方法，以满足客观问题的需求。

1 经典推理与非经典推理

经典推理指的是传统的命题逻辑、谓词逻辑，而非经典推理一般泛指与经典命题逻辑不同的那些逻辑。现代非经典逻辑的研究始于1910年，最早提出和创立的是美国逻辑学家刘易斯（C.I.Lewis）——建立了模态命题逻辑，波兰的J.卢卡西维茨和美国的E.L.波斯特分别于1920和1921年建立了多值逻辑。

《人工智能》之《非经典推理》

非经典逻辑大体上分为两类：

与经典逻辑平行的逻辑，如多值逻辑和模糊逻辑
对经典逻辑进行扩充的逻辑，如模态逻辑、时态逻辑、动态逻辑

2 不确定性推理

不确定性推理，也称不精确推理，泛指除确定性推理以外的其它各种推理问题，包括不完备、不确定性知识的推理，模糊知识的推理，非单调性推理等。不确定性推理从不确定性的初始证据出发，通过运用不确定性的知识，最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。

不确定性推理存在三种不确定性，即关于知识的不确定性、关于证据的不确定性和关于结论的不确定性。
《人工智能》之《非经典推理》
不确定性推理的基本问题

知识和证据都具有某种程度的不确定性，这就为推理机的设计与实现增加了复杂性和难度。

要解决推理方向、推理方法、控制策略等基本问题，还要解决以下问题：

不确定性的表示和量度
不确定性匹配
组合证据不确定性的计算
不确定性的传递
不确定性的合成

1.不确定性的表示与量度

知识不确定性的表示
证据不确定性的表示——证据的动态强度
不确定性的量度

2.不确定性匹配

含义：不确定的前提条件与不确定的事实匹配。

不确定性匹配算法及阈值的选择：

不确定性匹配算法：用来计算匹配双方相似程度的算法。
阈值：用来指出相似的“限度”。

3.组合证据不确定性的计算

含义: 前提条件是多个证据的组合

方法: (确定性：Certainty; 证据: Evidence; 结论: Hypothesis）

最大最小方法，如合取取最小、析取取最大
C(E1∧E2)=min[C(E1),C(E2)]
C(E1∨E2)=max[C(E1),C(E2)]
概率方法，按概率公式
C(E1∧E2)=C(E1)C(E2) （Ei 彼此独立）
C(E1∨E2)=C(E1)+C(E2)-C(E1)C(E2)
有界法
C(E1∧E2)=max[0, C(E1)+C(E2)-1]
C(E1∨E2)=min[1, C(E1)+C(E2)]

4.不确定性的传递

含义：

在每一步推理中，如何把证据及知识的不确定性传递给结论。
即：C(H)=g1[C(E),f(H,E)]
表示：由规则前提E的不确定性C(E)，规则强度f(H,E)，求结论H的不确定性C(H)。（g1是一函数，该函数是根据不同的情况来定义的）
在多步推理中，如何把初始证据的不确定性传递给最终结论

5.结论不确定性的合成

多个不同知识推出同一结论，且每条知识的前提条件是相互独立的证据，即：C(H)=g2[C1(H), C2 (H)]

表示：根据分别由独立的证据E1，E2求出的结论H的不确定性C1(H)，C2(H)，求出证据E1和E2的组合所导致的结论H的不确定性C(H)（g2是一函数，该函数是根据不同的情况来定义的）。

2.1 不确定性推理模型

不确定性推理模型无统一的模型，种类多，比较著名的有：

Shortliffe在1975年结合医疗专家系统MYCIN建立的可信度方法（确定性理论+概率论）
Duda在1976年结合探矿专家系统PROSPECTOR建立的主观Bayes推理
Dempster Shafer在1976年提出的证据理论
Zadeh在1978年提出的可能性理论，1983年提出的模糊逻辑和逻辑推理
Nilsson在1986年提出的概率逻辑
Judea Pearl在1986年提出的信任网络
Bayes提出的Bayes网络

不确定性推理的分类：
《人工智能》之《非经典推理》

3 概率推理

3.1 概率的基本性质和计算公式

样本空间

概念：在概率论中，把试验中每一个可能出现的结果称为试验的一个样本点，由全体样本点构成的集合称为样本空间。

表示：通常，用D表示样本空间，d表示样本点。

例子：在掷币试验中，若用d1表示硬币的正面向上，用d2表示硬币的反面向上，则该试验的样本空间为：D={d1, d2}。

随机事件

概念：由样本点构成的集合称为随机事件。

例子：在掷币试验中，若用A表示硬币正面向上这一事件，则有A={d1}

运算：

并事件
事件A与事件B至少有一个发生记为A∪B
交事件
事件A与事件B同时发生记为A∩B
互斥事件
事件A与B之间满足“A∩B=Φ, A∪B=D ”

频率

《人工智能》之《非经典推理》

统计概率的性质

《人工智能》之《非经典推理》

条件概率

《人工智能》之《非经典推理》

全概率公式

《人工智能》之《非经典推理》

贝叶斯公式

《人工智能》之《非经典推理》

3.2 概率推理方法

假设有产生式规则：if E then H，证据(或前提条件) E不确定性的概率为P(E)，概率方法不确定性推理的目的就是求出在证据 E 下结论 H 发生的概率P(H|E)。

《人工智能》之《非经典推理》
这也叫做逆概率方法。

逆概率方法的优缺点：

4 主观贝叶斯方法

1976年，杜达（R.O.Duda）、哈特（P.E.Hart）等人提出主观Bayes方法，建立了不确定性推理模型，并在地矿勘探专家系统PROSPECTOR中得到了成功的应用。

4.1 知识不确定性的表示

《人工智能》之《非经典推理》
主观贝叶斯方法的不精确推理过程就是根据前提E的概率P(E)，利用规则的LS和LN，把结论H的先验概率P(H)更新为后验概率P(H|E)的过程。

这样，就可把取值为[0,1]的P(X)放大为取值[0,+∞)的O(X)。

红色的两个公式就是修改的贝叶斯公式。

LS的性质
《人工智能》之《非经典推理》
LN的性质

LS与LN的关系

4.2 证据不确定性的表示

主观贝叶斯方法中证据的不确定性也是用概率表示的。
《人工智能》之《非经典推理》

《人工智能》之《非经典推理》

4.3 主观贝叶斯方法的推理过程

若采用初始证据进行推理，则通过用户得到C(E|S)，从而根据CP公式可求得 P(H|S)
若采用推理过程中得到的中间结论作为证据进行推理，则通过 EH 公式可求得 P(H|S)

《人工智能》之《非经典推理》

4.4 主观贝叶斯方法的优缺点

优点：

具有较坚实的理论基础。
知识的静态强度 LS 及LN 是由领域专家根据实践经验给出的，推出的结论有较准确的确定性。
主观Bayes方法是一种比较实用且较灵活的不确定性推理方法。

缺点：

要求领域专家在给出知识时，同时给出H的先验概率。
Bayes定理中关于事件独立性的要求使主观Bayes方法的应用受到了限制。

5 证据理论

证据理论(theory of evidence)：又称D-S理论，是德普斯特(A.P.Dempster)首先提出，沙佛(G.Shafer) 进一步发展起来的一种处理不确定性的理论。它将概率论中的单点赋值扩展为集合赋值，比主观Bayes方法有着更大的灵活性。1981年巴纳特(J. A. Barnett)把该理论引入专家系统，同年卡威(J. Garvey)等人用它实现不确定性推理。