Class文件结构

Class文件是一组以8位字节为基础单位的二进制字节流,各个数据项目按照严格顺序紧凑地排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全部是程序运行的必要数据,没有间隙存在。当遇到需要占用8位字节以上空间的数据项时,则会按照高位在前的方式分割成若干个8位字节进行存储。

存储格式:

Class文件采用一种类似于C语言结构体的伪结构来存储数据,这种伪结构中只有两种数据类型:无符号数和表

无符号数:
  • 无符号数属于基本数据类型,以u1、u2、u4、u8来分别代表1个字节、2个字节、4个字节、8个字节的无符号数。
  • 无符号数用来描述数字、索引引用、数量值或者按照UTF-8编码构成的字符串值。
表:
  • 表是由多个无符号数或者其它表作为数据项构成的复合数据类型,所有表都习惯性的以“_info”结尾。整个Class文件本质上也是一张表

注意:
任何一个Class文件都对应着唯一一个类或接口的定义信息,但反过来说,类或接口并不一定都得定义在文件中(也可以通过类加载器直接生成)

下图是Class文件格式:
Class文件结构

1、Magic与Class版本

Magic:
每个Class文件的头4个字节称为魔数(Magic Number),它的唯一作用就是确定这个Class文件能否被虚拟机识别。固定值为0xCAFEBABE。

Class版本:
紧接着魔数的4个字节存储Class文件的版本号。
第5、6个字节是次版本号(Minor Version)
第7、8个字节是主版本号(Major Version)

2、常量池

紧接着主次版本号之后是常量池入口,常量池可以理解为Class文件中的资源仓库。
特点:

  • 它是Class文件结构中与其它项目关联最多的数据类型
  • 占用Class文件空间最大的数据项目之一
  • Class文件中第一个出现的表类型的数据项目

constant_pool_count: 常量池容量计数值
由于常量池中常量的数量是不固定的,所以在常量池的入口需要放置u2类型的数据,代表常量池容量计数值(constant_pool_count)。只有常量池中计数器的值从1开始,不是0

constant_pool: 常量池
常量池中主要存储两大类型常量:字面量(Literal)和符号引用(Symbolic References)

字面量:
     字面量比较接近于Java语言层面的常量概念,如文本字符串、声明为final的常量值等。

符号引用:
    符号引用属于编译原理方面的概念,包括了下面3类常量:

  • 类和接口的全限定包名
  • 字段的名称和描述符
  • 方法名称和描述符
3、访问标志

access_flags:
在常量池结束之后,紧接着两个字节代表访问标志(access_flags),这个类用于识别一些类或者接口层次的访问信息,包括:这个Class是类还接口;是否定义为public类型;是否定义为abstract类型;如果是类的话,是否被声明为final等。

4、类索引、父类索引与接口索引集合

this_class:类索引:确定这个类的全限定名
super_class:父类索引:确定这个类的父类的全限定名
interfaces_count:接口计数器:表示索引表容量
interfaces:接口索引集合

作用:
Class文件中通过这三项来确定这个类的集成关系

5、字段表集合

field_info:用于描述接口或类中声明的变量
包括了访问标志(access_flags)、名称索引(name_index)、描述符索引(descriptor_index)、属性集合表(attributes)几项

6、方法表集合

method_info:
方法表结构和字段表结构一样,依次包括了访问标志(access_flags)、名称索引(name_index)、描述符索引(descriptor_index)、属性集合表(attributes)几项。

7、属性表集合

attribute_info:calss文件、字段和方法拥有的属性表集合,其中code属性代表的是程序代码编译后的字节码形式指令,在code中this是默认参数