《编译原理》学习总结--第七章

第七章 语义分析和中间代码产生

一 语义分析

    1.语义分析的任务:

       (1)审查每一个语法结构的静态语义,即验证语法正确的结构是否有意义。
                     如:赋值语句:x:=x+y,左边变量类型与右边变量类型是否一致。
       (2)在语义正确的基础上生成一种中间代码或目标代码。
    2.语义分析的范围:
        (1)确定类型:确定标识符所关联的数据类型。
        (2)类型检查:按语言的类型规则,检查运算的合法性与运算分量类型的一致性,必要时作类型转换。
        (3)识别含义:根据语言的语义定义(形式或非形式),识别程序中各构造成分组合到一起的含义,并作相应的语义处理(生成中间代或目标代码)。
        (4)控制流检查:控制流语句必须转移到合法的地方。如C中,break语句规定跳出最内层的循环或switch语句。
        (5)一致性检查:在很多场合要求对象只能被说明一次。如:pascal语言规定同一个标识符在一个分程序中只能被说明一次等。
        (6)相关名字检查:如:Ada,循环或块可以有一个名字,它出现在这些结构的开头或结尾。编译程序必须检查这两个地方用的名字是否相同。
        其它:如名字的作用域分析等也是语义分析的工作。
    3 无循环有向图:
        DAG与抽象语法树基本上一样,对表达式中的每个子表达式,DAG中都有一个结点。一个内部结点表示一个操作符,它的孩子表示操作数
二 中间代码产生
    1 逆波兰表示
        波兰表示是一种既不须考虑优先关系、又不用括号的一种表示表达式的方法(前缀式)。
  现在我们要介绍的刚好是另一种波兰表示形式,称为后缀式,即运算符在后。
    2 抽象树表示
《编译原理》学习总结--第七章
    3 dag

《编译原理》学习总结--第七章

    4 三元式
        (1)三元式由三个部分组成:
               算符:OP
              第一运算分量:ARG1
              第二运算分量:ARG2
        (2)各种语句都可表示成一组三元式                
    5 四元式

            一个四元式是一个带有四个域的记录结构:op,arg1,arg2及result。它实际上就是一条三地址的指令。
    例:A+B*(C-D)-E/F↑G的四元式为:
          OP   ARG1  ARG2  RESULT
      ①  -     C     D      T1
      ②  *     B     T1     T2 
      ③  +     A     T2     T3
      ④ ↑     F     G      T4  
      ⑤  /     E     T4     T5 
      ⑥  -     T3    T5     T6

    有时将四元式表示成更直观的形式-三地址代码

    三地址代码形式:
     x:=a op b         (赋值形式)
    与赋值语句的区别:其右边最多只能有一个运算符。如:四元式(<,B,D, T1),三地址码T1:=B<D

三 学习感悟
    作为编译原理的最后一章,这一张的内容还是比较简单的。抽象树 dag都比较简单 逆波兰的表示方式比较难 由三地址码转换成三元式 四元式也不是很难 总的来说比较好学习。