从AWS圣杯的multipart/form-data的http请求raw_body解析

问题描述:

我有以下简单AWS圣杯路线:从AWS圣杯的multipart/form-data的http请求raw_body解析

@app.route('/submit', methods=['POST'], 
      content_types=['multipart/form-data']) 
def submit(): 
    request_info = app.current_request.raw_body 

    return request_info 

我然后用一种简单的形式与多部分数据,包括一个DOCX文件上载:

<form enctype="multipart/form-data" method="POST" action="http://localhost:8000/submit"> 
    <input name='foo' type="text"> 
    <br> 
    <input name="bar" type="file"> 
    <br> 
    <button type='submit'> 
    Submit 
    </button> 
</form> 

请求的raw_body属性只是http请求的字节,我在寻找一个预先存在的Python库,它可以让我提取每个表单字段并将docx文件的字节写入磁盘(在这种情况下,AWS Lambda中为tmp文件夹)。是否有一个库将以raw_body作为参数,并允许我解析各个字段,以便我不必自己编写这样的解析器?试图谷歌这是很困难的,因为大部分返回的结果都与使用python来使用web API,这不是我想要的。

Bellow是一个示例lambda代码,它将采用multipart/form-data并解析它并获取文件并获取文件类型。

import magic 
from io import BytesIO 
import json 
import cgi 

def lambda_handler(event, context): 
    content_type_obj = event['params']['header']['content-type'] 
    content_type, property_dict = cgi.parse_header(content_type_obj) 
    form_data = cgi.parse_multipart(BytesIO(event['body-json'].decode('base64')), property_dict) 
    form_file = form_data['file'][0] 
    file_type = magic.from_buffer(form_file, mime=True) 
    file_name = "new_file." + file_type.split('/')[-1] or "txt" 
    # process your file 
    # file_type will give you mime type of the file like "image/png" 
    print file_type 

    return {'statusCode': 200, 
      'body': json.dumps({"status": "success", 
           "message": "your request for uploading has been accepted."}), 
      'headers': { 
      'Content-Type': 'application/json', 
      }} 

添加魔法拉姆达指包装

http://docs.aws.amazon.com/lambda/latest/dg/lambda-python-how-to-create-deployment-package.html

+0

的CGI库的作品,即使它的气质。对于阅读这个使用Chalice的人来说,我的实际解决方案是在路由功能定义中对base64进行编码和解码。这会以一定百分比增加数据传输,但更容易排除故障。 –

+0

@JoeStech你可以使用zappa烧瓶,上传的文件将在request.files中可用,因为我们通常在烧瓶中得到。那么它更容易调试。没有提到你将拥有文件的所有属性mimetype,内容长度等。 – Anurag