缓冲区溢出攻击相关知识

本文是coursera软件安全课程学习总结，算是梳理知识，细节太多，只写了要点。

0. 内存模型

缓冲区溢出攻击相关知识

0.1 内存分配

使用malloc函数分配的内存在heap区域，stack从高地址向低地址生长，heap相反。

缓冲区溢出攻击相关知识

0.2 函数调用时的堆栈变化

每当使用call指令进行函数调用时，都会将原来的eip寄存器中的值压栈，然后，将新的函数指针写入eip寄存器，这是由机器自动执行的，保存原eip的同时，将新的执行地址写入eip.详细过程可以关注我的博客中一篇详细描述堆栈变化的博文click here。

这里我们知道，一旦函数调用完毕，返回地址如果被修改（比如被修改成为恶意程序的入口地址），那么后果不堪设想。使用缓冲区溢出可以实现攻击，我们会在例子中给出解释。

接下来我们使用一个例子来形象的表示出函数调用时堆栈的变化

{
     local1;
     local2;
    ...
}
{
    ...
    f(,,);
    ...
}

缓冲区溢出攻击相关知识

1. 代码注入

如何进行代码注入？首先，我们需要把代码放入内存。其次，需要让eip指向我们的代码起始位置，才能执行它。

1.1 将代码加载到内存

（1）代码必须是已编译的可执行机器码
（2）代码不能包括零，否则，零之后I/O函数将停止拷贝
（3）不能使用loder

我们的目标是执行一个我们可以操纵的shell,加载shell的代码被称为shellcode。

 main( ) {
     *name[];
   name[] = “/bin/sh”;
   name[] = ;
   execve(name[], name, );
}

1.2 让已经加载的代码运行起来

由于在函数调用的末尾，需要将原eip值取出加载到eip寄存器，那么，如果我们修改了原eip的值，使其变为我们shellcode代码执行地址，那么函数返回后就执行shellcode。

可是，怎么知道我们的shellcode指令开始地址呢？因为如果地址不正确，CPU就故障了。

如果我们没有权限获取代码，我们当让不知道缓冲区距离ebp有多远，那么，我们怎么办呢？

（1）尝试！不停尝试（这个看运气，而且几率不高）
（2）如果没有地址随机优化，那么每次堆栈都从一个固定的地址开始执行，而且堆栈一般不会很深，那么，可以知道esp大体在某个区间。可以使用 nop sleds 提高我们的命中几率。

nop sleds:

缓冲区溢出攻击相关知识

以上我们讨论的就是所谓的stack smashing。

2. 其他内存攻击

2.1 堆溢出

把缓冲区溢出的原理用在堆上，就是所谓的堆溢出。

2.2 整数溢出

2.3 读溢出

读取了不该读取的内存

the Heartbleed bug 通过发送特定的消息，拥有bug的ssl服务器没有检查长度就将攻击者指定的返回字符串返回攻击者。因此，攻击者可以通过增大字符串长度，非法读取其他数据。

2.4 被释放的指针再次使用

3.格式化字符串攻击

3.1 正常情况下的printf函数

3.2 不安全时

读取了调用者的数据！

举例：

(“% dave”);
Prints stack entry  byes above saved  
(“”); 
Prints bytes pointed to by that stack entry 
(“    …”);
Prints a series of stack entries as integers 
(“    …”);
 Same, but nicely formatted  
(“%  way!”)"
//WRITES the number 3 to address pointed to by stack entry

3.3 例子解释





 greeting[] = ;
 prompt[] = ;
 pat[] = ;
 secret[] = ;

 infd = ; 
 outfd = ; 



  _WisdomList {
    _WisdomList *next;
      data[DATA_SIZE];
} WisdomList; 

 _WisdomList  *head = NULL;

;

{
  write(outfd, secret, (secret));
  ;
}

{
  write(outfd, pat, (pat));
  ;
}

{
   buf[] = ;
  (head == NULL) {
    write(outfd, buf, (buf)-());
  }  {
    WisdomList  *l = head;
    (l != NULL) {
      write(outfd, l->data, (l->data));
      write(outfd, , );
      l = l->next;
    }
  }
  ;
}

{
    wis[DATA_SIZE] = {}; 
     r;

  r = write(outfd, prompt, (prompt)-());
  (r < ) {
    ;
  }

  r = ()gets(wis); 
   (r == )
    ;

  WisdomList  *l = ((WisdomList));

  (l != NULL) {
    (l, , (WisdomList));
    (l->data, wis);
    (head == NULL) {
      head = l;
    }  {
      WisdomList  *v = head;
      (v->next != NULL) {
        v = v->next;
      }
      v->next = l;
    }
  }

  ;
}

fptr  ptrs[] = { NULL, get_wisdom, put_wisdom };

{

  () {
        buf[] = {};
       r;
      fptr p = pat_on_back;
      r = write(outfd, greeting, (greeting)-());
      (r < ) {
        ;
      }
      r = read(infd, buf, (buf)-());
      (r > ) {
        buf[r] = ;
         s = atoi(buf);
        fptr tmp = ptrs[s];
        tmp();
      }  {
        ;
      }
  }

   ;
}

本实验所有材料来自coursera软件安全课程。

这个例子包含两个缓冲区溢出攻击。主函数中包含一个全局缓冲区攻击，函数put_wisdom中的wis缓冲区是一个栈上的缓冲区溢出。

执行过程：

（1）编译程序，gcc -fno-stack-protector -ggdb -m32 wisdom-alt.c -o wisdom-alt
（2）使用bash打开一个终端，运行./runbin.sh
（3）打开另一个终端，使用命令 gdb -p `pgrep wisdom-alt`调试

缓冲区溢出攻击相关知识

（1）ptrs输入超过2的索引出现错误

回想之前的缓冲区溢出，如果我们输入的索引值恰好能到达fptr p = pat_on_back;中p的存储区域，那么就能读取到pat_on_back，进而执行该函数！

首先，确定p的地址：在启动运行gdb中print &p和print buf:

缓冲区溢出攻击相关知识

通过计算，知道p在buf之前771675416个内存位置处，我们输入该数字：

缓冲区溢出攻击相关知识

发现我们获取到了到了pat_on_back函数指针！

（2）void put_wisdom(void)函数中的栈上缓冲区溢出

同样的原理，我们通过找到函数void put_wisdom(void) 被调用时缓冲区wis的地址和返回地址在内存中的差，用同样的方法，将我们函数指针write_secret的地址写入保存返回地址的内存区域，那么函数put_wisdom调用结束后，就会执行write_secret函数。

本文转自 chengxuyonghu 51CTO博客，原文链接：http://blog.51cto.com/6226001001/1623316，如需转载请自行联系原作者

缓冲区溢出攻击相关知识

0. 内存模型

0.1 内存分配

0.2 函数调用时的堆栈变化

1. 代码注入

1.1 将代码加载到内存

1.2 让已经加载的代码运行起来

2. 其他内存攻击

2.1 堆溢出

2.2 整数溢出

2.3 读溢出

2.4 被释放的指针再次使用

3.格式化字符串攻击

3.1 正常情况下的printf函数

3.2 不安全时

3.3 例子解释

（1）ptrs输入超过2的索引出现错误

（2）void put_wisdom(void)函数中的栈上缓冲区溢出

相关推荐