2020.11.23.实验室602(堆的概念C表述、栈在程序中的应用、栈溢出)

堆的概念C表述

栈在程序中的应用

我的理解
在程序运行过程中,当要调用某个子函数时:
将主函数的相关参数压入栈中、将call指令的下一条指令的地址作为返回地址压入栈中、将当前ebp入栈、使ebp指向esp所指的位置(重新定位栈底)、将esp指向的地址+xxxH(在栈上分配xxx字节的空间)(可选)、将某些寄存器中的值入栈(可选)、将某些寄存器中的值出栈(可选)、使esp指向ebp所指向的位置(恢复esp同时回收局部变量的空间)、弹出之前压入的ebp地址到ebp(恢复ebp)(弹出ebp地址时会使esp+4H指向返回地址即栈顶)、如果有返回值那么将返回值传入eax、执行ret指令回到主函数继续执行指令。
2020.11.23.实验室602(堆的概念C表述、栈在程序中的应用、栈溢出)
2020.11.23.实验室602(堆的概念C表述、栈在程序中的应用、栈溢出)

引用
堆栈帧也叫活动记录,保存的是一个函数调用所需要维护的所有信息。它主要包含三个内容:

1、函数的返回地址和参数

2、临时变量:包括函数的非静态局部变量以及编译器自动生成的其它临时变量

3、保存的上下文:包括在函数调用前后需要保存不变的寄存器值

在i386中,一个函数的活动记录用ebp和esp这两个寄存器来划定范围。esp始终指向栈的顶部,同时也指向当前活动记录的顶部。相对的,ebp指向函数活动记录的一个固定位置,ebp又被称为帧指针。一个很常见的活动记录如下:
2020.11.23.实验室602(堆的概念C表述、栈在程序中的应用、栈溢出)

参数及参数之后的数据是当前的活动记录,ebp固定在上图的位置,不随函数的执行而改变,相反地,esp始终指向栈顶,因此随着函数的执行,它总是变化的。ebp+4是这个函数的返回地址,ebp+8、ebp+12等是这个函数的参数。ebp指向的是调用该函数前ebp的值,这样在函数返回的时候,ebp就可以通过这个恢复到调用前的值。ebp下面的值是要保存的寄存器的值和函数中的局部变量,当然也可以不保存ebp的值,不过这样会减慢帧上寻址速度和无法准确定位函数的调用轨迹。之所以会形成这样的活动记录,是因为一个i386中函数总是这样调用的:

把所有或者部分参数压入栈中
把当前call调用指令的下一条指令地址压入栈中
跳转到call调用的函数去执行

后面两步由call指令自动完成,i386函数体的开头一般是这样的:

push ebp;保存调用前的ebp值
mov ebp,esp;ebp指向栈中保存调用前ebp值的位置
sub esp,xxx;在栈上分配xxx字节的空间,这个是可选的
push xxx;保存xxx寄存器的值,这个也是可选的

在函数返回时,一般是这样的:

pop xxx;恢复寄存器的值;如果开头有push xxx
mov esp,ebp;恢复esp,同时回收局部变量的空间
pop ebp;恢复调用前ebp的值
mov eax,xxx;如果函数有返回值,那么返回值一般放在eax中
ret;从栈中取回返回地址,并跳转到该位置

栈溢出

栈溢出指的是程序向栈中某个变量中写入的字节数超过了这个变量本身所申请的字节数,因而导致与其相邻的栈中的变量的值被改变。
因为在内存中写入数据是由低地址向高地址写入而栈是由高地址向低地址生长,所以当向栈中某个变量写入的字节数超过这个变量本身所申请的字节数时会覆盖该变量后面的数据,当覆盖的是main函数的ebp时会修改ebp使得栈不平衡、改变了栈底,当覆盖的是返回地址时会使得程序执行非原指令、可使覆盖返回地址的数据是攻击代码的地址来获取shell。
2020.11.23.实验室602(堆的概念C表述、栈在程序中的应用、栈溢出)