python wsgi 简介

http://python.jobbole.com/87361/


基础知识

Python 知识

  • iterator 和 generator
  • 函数的高级用法:嵌套函数,作为参数传递等等
  • 了解 decorator 会对理解 wsgi 有很大的帮助
  • python 的 callable 概念
  • classmethod 和 staticmethod 的概念
  • web 编程的基础

HTTP 基础

python wsgi 简介

对于 web 应用程序来说,最基本的概念就是客户端发送请求(request),收到服务器端的响应(response)。

下面是简单的 HTTP 请求:

内容包括了 method、 url、 protocol version 以及头部的信息。而 HTTP 响应(不包括数据)可能是如下的内容:

实际生产中,python 程序是放在服务器的 http server(比如 apache, nginx 等)上的。现在的问题是 服务器程序怎么把接受到的请求传递给 python 呢,怎么在网络的数据流和 python 的结构体之间转换呢?这就是 wsgi 做的事情:一套关于程序端和服务器端的规范,或者说统一的接口。

python wsgi 简介

WSGI

我们先看一下面向 http 的 python 程序需要关心哪些内容:

  • 请求
    • 请求的方法 method
    • 请求的地址 url
    • 请求的内容
    • 请求的头部 header
    • 请求的环境信息
  • 响应
    • 状态码 status_code
    • 响应的数据
    • 响应的头部

WSGI(Web Server Gateway Interface) 的任务就是把上面的数据在 http server 和 python 程序之间简单友好地传递。它是一个标准,被定义在PEP 333。需要 http server 和 python 程序都要遵守一定的规范,实现这个标准的约定内容,才能正常工作。

python wsgi 简介

应用程序端

WSGI 规定每个 python 程序(Application)必须是一个可调用的对象(实现了__call__函数的方法或者类),接受两个参数 environ(WSGI 的环境信息) 和 start_response(开始响应请求的函数),并且返回 iterable。几点说明:

  1. environ 和 start_response 由 http server 提供并实现
  2. environ 变量是包含了环境信息的字典
  3. Application 内部在返回前调用 start_response
  4. start_response也是一个 callable,接受两个必须的参数,status(HTTP状态)和 response_headers(响应消息的头)
  5. 可调用对象要返回一个值,这个值是可迭代的。

说了这么多的概念,再来看看代码的实现:

服务器程序端

上面已经说过,标准要能够确切地实行,必须要求程序端和服务器端共同遵守。上面提到, envrion 和 start_response 都是服务器端提供的。下面就看看,服务器端要履行的义务。

  • 准备 environ 参数
  • 定义 start_response 函数
  • 调用程序端的可调用对象

PEP 333 里给出了一个 wsgi server 的简单实现,我又简化了一下——去除一些异常处理和判断,添加了一点注释:

中间层 middleware

有些程序可能处于服务器端和程序端两者之间:对于服务器程序,它就是应用程序;而对于应用程序,它就是服务器程序。这就是中间层 middleware。middleware 对服务器程序和应用是透明的,它像一个代理/管道一样,把接收到的请求进行一些处理,然后往后传递,一直传递到客户端程序,最后把程序的客户端处理的结果再返回。如下图所示:

python wsgi 简介

middleware 做了两件事情:

  1. 被服务器程序(有可能是其他 middleware)调用,返回结果回去
  2. 调用应用程序(有可能是其他 middleware),把参数传递过去

PEP 333 上面给出了 middleware 的可能使用场景:

  • 根据 url 把请求给到不同的客户端程序(url routing)
  • 允许多个客户端程序/web 框架同时运行,就是把接到的同一个请求传递给多个程序。
  • 负载均衡和远程处理:把请求在网络上传输
  • 应答的过滤处理

那么简单地 middleware 实现是怎么样的呢?下面的代码实现的是一个简单地 url routing 的 middleware:

怎么在程序里面使用呢?