【计算理论】正则语言 ( 正则表达式原子定义 | 正则表达式递归定义 | 正则表达式语言原子定义 | 正则表达式语言结构归纳 | 正则表达式语言示例

文章目录

I . 正则表达式定义
II . 正则表达式语言原子定义
III . 正则表达式语言结构归纳定义
IV . 正则表达式语言示例
V . 空集 $\varnothing$ 与空字符 $\varepsilon$ 差别
VI . 正则表达式定理
VII . 根据正则表达式语言构造自动机 ( 定理正向证明 )
VIII . 构造原子自动机
IX . 使用原子自动机拼装正则表达式对应的自动机

I . 正则表达式定义

1 . 正则表达式原子定义 :

如果 $R$ 是

字符集 $\Sigma$ 中的 $1$ 个字符 ,
空字符串 $\varepsilon$ , 或
空集 $\{ \varnothing \}$ ,

那么称 $R$ 是正则表达式 ;

2 . 正则表达式递归定义 :

如果 $R_1 , R_2$ 是正则表达式 , 那么

$R_1 \cup R_2$ 是正则表达式 ;
$R_1 \circ R_2$ 是正则表达式 ;
$R_1^*$ 是正则表达式 ;

上述是正则表达式的定义 , 这是一个结构归纳定义 ;

II . 正则表达式语言原子定义

正则表达式语言表示方式 : $R$ 是正则表达式 , $L(R)$ 是正则表达式代表的语言 ;

1 . 单个字符代表的语言 :

$L(a) = \{a\}$

$a$ 是字符集中的字符 , 那么其所代表的的语言是 $\{a\}$ 单元集 , 是由一个元素的字符构成的 ;

2 . 空字符串代表的语言 :

$L(\varepsilon) = \{ \varepsilon \}$

如果 $\varepsilon$ 是正则表达式 , 其所代表的的语言 $L(\varepsilon)$ , 是由空字符串组成的集合 $\{ \varepsilon \}$ ;

3 . 空集代表的语言 :

$L(\varnothing) = \varnothing$

空集 $\varnothing$ 所代表的的语言 , 就是空集 ;

III . 正则表达式语言结构归纳定义

1 . 正则表达式并集的语言 :

$L(R_1 \cup R_2) = L(R_1) \cup L(R_2)$

$R_1 , R_2$ 是两个正则表达式 , 其并集的语言 , 就是其两个语言的并集 ;

2 . 正则表达式串联的语言 :

$L(R_1 \circ R_2) = L(R_1) \circ L(R_2)$

$R_1 , R_2$ 是两个正则表达式 , 其串联运算结果正则表达式的语言 , 就是其两个正则表达式语言的串联运算结果 ;

3 . 正则表达式星运算的语言 :

$L(R^*) = ( L(R) ) ^*$

$R$ 正则表达式星运算结果正则表达式的语言 , 就是 $R$ 正则表达式的语言进行星运算的结果 ;

IV . 正则表达式语言示例

字符集 : $\Sigma = \{0, 1\}$ ;

正则表达式 : $( 0 \cup 1 )^* 1 0 ( 0 \cup 1 )^*$ ;

正则表达式转化成语言 :

$\begin{array}{lcl} && L( ( 0 \cup 1 )^* 1 0 ( 0 \cup 1 )^* ) \\\\ &=& L( ( 0 \cup 1 )^* ) \circ L(1) \circ L(0) \circ L( ( 0 \cup 1 )^* ) \\\\ &=& \{0,1\}^* \circ \{ 1 \} \circ \{ 0 \} \circ \{ 0, 1 \}^* \end{array}$

上述 $\{0,1\}^*$ 就是 $0,1$ 有限个字符串组成的字符 ;

正则表达式表示的语言 , 刚好是自动机所识别的语言 ; 可以根据该语言将自动机设计出来 ;

V . 空集 $\varnothing$ 与空字符 $\varepsilon$ 差别

空集 $\varnothing$ 是正则表达式 , 类似于数中的 $0$ ;

空字符 $\varepsilon$ 是正则表达式 , 类似于数中的 $1$ ;

( 后续待补充 )

VI . 正则表达式定理

1 . 定理 : 一个语言如果是正则语言 , 当且仅当 , 该语言可以通过正则表达式表示出来 ;

2 . 有以下两层含义 :

① 正则表达式 -> 自动机识别 :正则表达式表达出的语言刚好能够被自动机识别 ;
② 自动机识别 -> 正则表达式 : 自动机识别某个语言 , 那么该语言可以被正则表达式表达出来 ;

3 . 定理证明 :

① 正则表达式 -> 自动机识别证明 : 给定一个正则表达式 , 设计一个自动机 , 该自动机所接受 ( 识别 / 认识 ) 的语言 , 刚好是该正则表达式所表达的语言 ;

下面的 " 根据正则表达式语言构造自动机 " 小节的示例 , 证明了正则表达式语言必有自动机识别 ;

② 自动机识别 -> 正则表达式证明 : 给定一个自动机 , 找到其所识别的正则表达式语言 ;

VII . 根据正则表达式语言构造自动机 ( 定理正向证明 )

1 . 需求 : 根据下面的正则表达式构造非确定性有限自动机 ( NFA ) , 刚好能识别上述正则表达式表示的语言 ;

$( ab \cup a )^*$

构造能识别 $( ab \cup a )^*$ 语言的自动机 ;

VIII . 构造原子自动机

构造原子自动机 : 先构造能接收单个字符的自动机 ;

① 接收 $a$ 字符的自动机 : 下面的自动机是可以识别 $a$ 字符串的 ;

② 接收 $b$ 字符的自动机 : 下面的自动机是识别 $b$ 字符串的 ;

IX . 使用原子自动机拼装正则表达式对应的自动机

拼装上述识别单个字符的自动机 :

1 . 摆放自动机位置 : 将 $2$ 个能识别 $a$ 字符串的自动机 , 与 $1$ 个能识别 $b$ 字符串的自动机 , 按照如下排列放置 ;

2 . $ab$ 对应自动机构造 :

① 自动机连接方式 : $a$ 正则表达式语言自动机与 $b$ 正则表达式语言自动机是串联在一起的 ;

② 串联两个自动机的状态 : 使用 $\varepsilon$ 箭头 , 串联 $a$ 对应自动机的接受状态 -> $b$ 对应自动机的开始状态 ;

③ 修改前者的状态 : 同时将 $a$ 对应自动机的接受状态改为非接受状态 ;

下面是 $ab$ 正则表达式表达的语言对应的自动机表示 :

3 . $ab \cup a$ 对应自动机构造 :

① 添加新开始状态 : 重新添加一个开始状态 ;

② 连接并运算前者 : 使用 $\varepsilon$ 箭头从这个新添加的开始状态指向 $ab$ 自动机开始状态 ;

③ 连接并运算后者 : 使用 $\varepsilon$ 箭头从这个新添加的开始状态指向 $a$ 自动机开始状态 ;

下面是 $ab \cup a$ 正则表达式表达的语言对应的自动机表示 :

4 . $( ab \cup a )^*$ 对应自动机构造 :

① 构造方法 : 就是在 $( ab \cup a )$ 对应自动机的基础上 , 使用 $\varepsilon$ 箭头 , 从接受状态指向开始状态 ;

② 连接个数 : 所有的接受状态 , 都使用 $\varepsilon$ 箭头指向开始状态 , 这里有两个接受状态 , 需要都指向开始状态 ;

【计算理论】正则语言 ( 正则表达式原子定义 | 正则表达式递归定义 | 正则表达式语言原子定义 | 正则表达式语言结构归纳 | 正则表达式语言示例 | 根据正则表达式构造自动机 )

文章目录

I . 正则表达式 定义

II . 正则表达式语言 原子定义

III . 正则表达式语言 结构归纳定义

IV . 正则表达式语言 示例

V . 空集 ∅\varnothing∅ 与 空字符 ε\varepsilonε 差别

VI . 正则表达式 定理

VII . 根据 正则表达式 语言 构造 自动机 ( 定理正向证明 )