python爬虫知识梳理——HTTP协议(请求)


二、HTTP请求

1、一个完整的请求可以分为请求行、请求头 、请求数据(非必要)

    1.1、请求行

      请求行位于整个请求的开头,请求行自身又可以分为请求方式、请求的URI、请求采用的HTTP协议版本号, 相互之间以空格划分。

     目前HTTP协议版本为HTTP1.1、HTTP1.0、HTTP0.9,主流版本为1.1 。

      HTTP1.1版本中支持的请求方式有GET、POST、OPTIONS、HEAD、PUT、DELETE、TRACE、CONNECT,其中GET、POST为实践中应用最多的请求方式。

      下图为请求百度首页的请求行

python爬虫知识梳理——HTTP协议(请求)


    1.2、请求头

        请求头为浏览器添加在请求行之后的标记一些请求信息的key-value,可以有多个,每个占一行

        下图为请求百度首页的请求头

python爬虫知识梳理——HTTP协议(请求)

    1.3、请求数据

       请求数据常用POST请求方式, 会被被添加在请求的尾部,同请求头之间以回车换行(\r\n)分割,也是以key-value方式出现,常见的应用场景为提交登录信息。

2、完整的GET请求

python爬虫知识梳理——HTTP协议(请求)

3、完整的POST请求

python爬虫知识梳理——HTTP协议(请求)