我应该如何解读这些数据/这些字符串
目前我正在试图通过一个老蟒蛇CTF挑战的工作,提供了服务器的脚本,这个想法是正确的数据发送到该服务器,我应该如何解读这些数据/这些字符串
#!/usr/bin/env python3
# from dis import dis
import socketserver
import types
class RequestHandler(socketserver.BaseRequestHandler):
def handle(self):
self.request.sendall(b'PyDRM Proof of Concept version 0.7\n')
self.request.sendall(
b'Submit the secret password to retrieve the flag:\n')
user_input_bytes = self.request.recv(4096).strip()
user_input = user_input_bytes.decode('utf-8', 'ignore')
if validate_password(user_input):
self.request.sendall(read_flag())
else:
self.request.sendall(b'Invalid password\n')
class RequestServer(socketserver.ThreadingMixIn, socketserver.TCPServer):
pass
def read_flag():
with open('flag.txt', 'rb') as fh:
return fh.read()
def generate_validation_function():
code_obj = types.CodeType(
1,
0,
5,
32,
67,
b'd\x01\x00d\x02\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05\x00d\x07'
b'\x00d\x08\x00d\x05\x00d\t\x00d\x08\x00d\n\x00d\x01\x00d\x07\x00d\x07'
b'\x00d\x01\x00d\x0b\x00d\x08\x00d\x07\x00d\x0c\x00d\r\x00d\x0e\x00d'
b'\x08\x00d\x05\x00d\x0f\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05'
b'\x00d\x07\x00g \x00}\x01\x00g\x00\x00}\x02\x00x+\x00|\x01\x00D]#\x00'
b'}\x03\x00|\x02\x00j\x00\x00t\x01\x00t\x02\x00|\x03\x00\x83\x01\x00d'
b'\x10\x00\x18\x83\x01\x00\x83\x01\x00\x01qs\x00Wd\x11\x00j\x03\x00|'
b'\x02\x00\x83\x01\x00}\x04\x00|\x00\x00|\x04\x00k\x02\x00r\xb9\x00d'
b'\x12\x00Sd\x13\x00S',
(None, '\x87', '\x9a', '\x92', '\x8e', '\x8b', '\x85', '\x96', '\x81',
'\x95', '\x84', '\x94', '\x8a', '\x83', '\x90', '\x8f', 34, '', True,
False),
('append', 'chr', 'ord', 'join'),
('a', 'b', 'c', 'd', 'e'),
'drm.py',
'validate_password',
5,
b'\x00\x01$\x01$\x01\x1e\x01\x06\x01\r\x01!\x01\x0f\x01\x0c\x01\x04'
b'\x01',
(),
()
)
func_obj = types.FunctionType(code_obj, globals())
return func_obj
def main():
setattr(__import__(__name__), 'validate_password',
generate_validation_function())
server = RequestServer(('0.0.0.0', 8765), RequestHandler)
try:
server.serve_forever()
except (SystemExit, KeyboardInterrupt):
server.shutdown()
server.server_close()
if __name__ == '__main__':
main()
编辑
我明白了,是怎么回事到如此地步,一个validate_password功能通过使用CODETYPE和函数类型对象创建。我也明白,如果validate_password(user_input)评估为True,该标志将被发送。这意味着返回类型必须是布尔值。 CodeType的文档以及服务器脚本也显示validate_password只有一个参数。
我的实际问题
源包含编译蟒蛇字节码。例如,b'd\x01\x00d\x02\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05\x00d\x07'
。我尝试了许多方法来解码/编码这些字符串以获取一些有意义的数据,我设法提取的唯一数据是十六进制数据。
如何将此数据转换为实际代码,因此能够重建validate_password
函数。
我曾尝试
- 我试图基本上做这样的回答表明,但在倒车时,我要么不理解正确的话,还是这不起作用
binascii。 b2a_hex() - 这是我如何设法将字符串转换为十六进制,就像我之前说过的那样,我不能从这个十六进制产生utf-8数据。
struct.unpack() - 这个方法已经取得了一些成功,但是在validate_password函数的上下文中数据意味着什么,我只能用这个方法获得整数。 (除非我误解)
对das-g的回答嗤之以鼻,这段代码起作用。八九不离十。
import uncompyle6
import types
code_obj = types.CodeType(
1, 0, 5, 32, 67, b'd\x01\x00d\x02\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05\x00d\x07'
b'\x00d\x08\x00d\x05\x00d\t\x00d\x08\x00d\n\x00d\x01\x00d\x07\x00d\x07'
b'\x00d\x01\x00d\x0b\x00d\x08\x00d\x07\x00d\x0c\x00d\r\x00d\x0e\x00d'
b'\x08\x00d\x05\x00d\x0f\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05'
b'\x00d\x07\x00g \x00}\x01\x00g\x00\x00}\x02\x00x+\x00|\x01\x00D]#\x00'
b'}\x03\x00|\x02\x00j\x00\x00t\x01\x00t\x02\x00|\x03\x00\x83\x01\x00d'
b'\x10\x00\x18\x83\x01\x00\x83\x01\x00\x01qs\x00Wd\x11\x00j\x03\x00|'
b'\x02\x00\x83\x01\x00}\x04\x00|\x00\x00|\x04\x00k\x02\x00r\xb9\x00d'
b'\x12\x00Sd\x13\x00S',
(None, '\x87', '\x9a', '\x92', '\x8e', '\x8b', '\x85', '\x96', '\x81',
'\x95', '\x84', '\x94', '\x8a', '\x83', '\x90', '\x8f', 34, '', True,
False),
('append', 'chr', 'ord', 'join'),
('a', 'b', 'c', 'd', 'e'),
'drm.py',
'validate_password',
5,
b'\x00\x01$\x01$\x01\x1e\x01\x06\x01\r\x01!\x01\x0f\x01\x0c\x01\x04'
b'\x01',
freevars=(),
cellvars=()
)
import sys
uncompyle6.main.uncompyle(3.5, code_obj, sys.stdout)
这里缺少的是这段代码实际上被封装在一个带有“a”参数的函数中。
我不会破坏给出答案的乐趣。相反:
- 运行上述程序。
- 裹在类似的输出:
def drm(a): # Output from run above.
开始交互式Python 3会话。如果您如果您使用IPython的使用普通的Python解释器,键入
import types
help(types.CodeType)
,你可以写
import types
types.CodeType?
你会了解到types.CodeType
是那里
Create a code object. Not for the faint of heart.
呃胡。什么是代码对象?我们来看看Python documentation。
The type for code objects such as returned by
compile()
.
所以字节字符串参数可能,至少部分是二进制数据(或二进制指令),而不是(文字)串莫名其妙编码。
的help
或?
调用也告诉我们,这种类型的初始化的签名:
code(argcount, kwonlyargcount, nlocals, stacksize, flags, codestring, constants, names, varnames, filename, name, firstlineno, lnotab[, freevars[, cellvars]])
就这样,我们可以写出建设更多的自描述性:
code_obj = types.CodeType(
argcount=1,
kwonlyargcount=0,
nlocals=5,
stacksize=32,
flags=67,
codestring=b'd\x01\x00d\x02\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05\x00d\x07'
b'\x00d\x08\x00d\x05\x00d\t\x00d\x08\x00d\n\x00d\x01\x00d\x07\x00d\x07'
b'\x00d\x01\x00d\x0b\x00d\x08\x00d\x07\x00d\x0c\x00d\r\x00d\x0e\x00d'
b'\x08\x00d\x05\x00d\x0f\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05'
b'\x00d\x07\x00g \x00}\x01\x00g\x00\x00}\x02\x00x+\x00|\x01\x00D]#\x00'
b'}\x03\x00|\x02\x00j\x00\x00t\x01\x00t\x02\x00|\x03\x00\x83\x01\x00d'
b'\x10\x00\x18\x83\x01\x00\x83\x01\x00\x01qs\x00Wd\x11\x00j\x03\x00|'
b'\x02\x00\x83\x01\x00}\x04\x00|\x00\x00|\x04\x00k\x02\x00r\xb9\x00d'
b'\x12\x00Sd\x13\x00S',
constants=(None, '\x87', '\x9a', '\x92', '\x8e', '\x8b', '\x85', '\x96', '\x81',
'\x95', '\x84', '\x94', '\x8a', '\x83', '\x90', '\x8f', 34, '', True,
False),
names=('append', 'chr', 'ord', 'join'),
varnames=('a', 'b', 'c', 'd', 'e'),
filename='drm.py',
name='validate_password',
firstlineno=5,
lnotab=b'\x00\x01$\x01$\x01\x1e\x01\x06\x01\r\x01!\x01\x0f\x01\x0c\x01\x04'
b'\x01',
freevars=(),
cellvars=()
)
(这只是因为types.CodeType()
预计所有参数都是通过位置而不是关键字参数传递的。)
现在这意味着什么?
可以拆卸代码对象来接近这个问题:
import dis
dis.dis(code_obj)
(输出:)
6 0 LOAD_CONST 1 ('\x87')
3 LOAD_CONST 2 ('\x9a')
6 LOAD_CONST 3 ('\x92')
9 LOAD_CONST 4 ('\x8e')
12 LOAD_CONST 5 ('\x8b')
15 LOAD_CONST 6 ('\x85')
18 LOAD_CONST 5 ('\x8b')
21 LOAD_CONST 7 ('\x96')
24 LOAD_CONST 8 ('\x81')
27 LOAD_CONST 5 ('\x8b')
30 LOAD_CONST 9 ('\x95')
33 LOAD_CONST 8 ('\x81')
7 36 LOAD_CONST 10 ('\x84')
39 LOAD_CONST 1 ('\x87')
42 LOAD_CONST 7 ('\x96')
45 LOAD_CONST 7 ('\x96')
48 LOAD_CONST 1 ('\x87')
51 LOAD_CONST 11 ('\x94')
54 LOAD_CONST 8 ('\x81')
57 LOAD_CONST 7 ('\x96')
60 LOAD_CONST 12 ('\x8a')
63 LOAD_CONST 13 ('\x83')
66 LOAD_CONST 14 ('\x90')
69 LOAD_CONST 8 ('\x81')
8 72 LOAD_CONST 5 ('\x8b')
75 LOAD_CONST 15 ('\x8f')
78 LOAD_CONST 3 ('\x92')
81 LOAD_CONST 4 ('\x8e')
84 LOAD_CONST 5 ('\x8b')
87 LOAD_CONST 6 ('\x85')
90 LOAD_CONST 5 ('\x8b')
93 LOAD_CONST 7 ('\x96')
96 BUILD_LIST 32
99 STORE_FAST 1 (b)
9 102 BUILD_LIST 0
105 STORE_FAST 2 (c)
10 108 SETUP_LOOP 43 (to 154)
111 LOAD_FAST 1 (b)
114 GET_ITER
>> 115 FOR_ITER 35 (to 153)
118 STORE_FAST 3 (d)
11 121 LOAD_FAST 2 (c)
124 LOAD_ATTR 0 (append)
127 LOAD_GLOBAL 1 (chr)
130 LOAD_GLOBAL 2 (ord)
133 LOAD_FAST 3 (d)
136 CALL_FUNCTION 1
139 LOAD_CONST 16 (34)
142 BINARY_SUBTRACT
143 CALL_FUNCTION 1
146 CALL_FUNCTION 1
149 POP_TOP
150 JUMP_ABSOLUTE 115
>> 153 POP_BLOCK
12 >> 154 LOAD_CONST 17 ('')
157 LOAD_ATTR 3 (join)
160 LOAD_FAST 2 (c)
163 CALL_FUNCTION 1
166 STORE_FAST 4 (e)
13 169 LOAD_FAST 0 (a)
172 LOAD_FAST 4 (e)
175 COMPARE_OP 2 (==)
178 POP_JUMP_IF_FALSE 185
14 181 LOAD_CONST 18 (True)
184 RETURN_VALUE
15 >> 185 LOAD_CONST 19 (False)
188 RETURN_VALUE
见the meaning of the bytecode operations的dis
文档(LOAD_CONST
,BUILD_LIST
,等等)。
为了更好地掌握函数的功能,可以尝试将其反编译回Python代码。虽然我没有设法做到这一点。 (试用uncompyle6。)
组件的第一行是等效为:b = [1,2,3,4,5,6,5,7,8,9 ,8(换行)10,1,...]; c = []和for循环累积到c然后e =''.join(c),并且如果a == e则返回true或false。 (A先前被传入或设置?) – rocky
@rocky你是怎么找到这个的?可能值得自己回答。 –
快速检查代码。看更多的c是通过chr(ord(d))构建的,它是循环迭代器的地方。您可以让uncompyle6完成这项工作如果您提供了一个Python版本号,例如3.5或2.7。请参阅https://github.com/rocky/python-uncompyle6/blob/master/uncompyle6/main.py#L12 – rocky
谢谢你帮助我解决这个问题。没有必要道歉,很高兴有一个有价值的工具仍然保持,通过点成功更新,所以一切都已完成,以保持包最新:) @ das-g提供了丰富的答案,有大量的证据等,但是,这方法基本上自动化了我为其方法执行的步骤。 – RandomHash
为了澄清,上述方法奏效。我不会破坏它为通过这个CTF的其他人。但仔细看看PEP文档也会给你密码:) – RandomHash