HTTP基础:请求报文

HTTP之请求报文(Request)

 

报文格式

客户端发送一个HTTP请求到服务器的请求消息包括以下格式:

请求行(request line)、请求头部(header)、空行和请求数据(请求主体body)四个部分组成。

HTTP基础:请求报文
备注:
1、header与body之间有个空行
2、请求行以一个方法符号开头,以空格分开,后面跟着请求的URL和协议的版本

 

Get请求例子

使用Fiddler抓取的request

HTTP基础:请求报文
说明:
1、第一部分(第一行):请求行。用来说明请求类型,要访问的资源以及所使用的HTTP版本

2、第二部分(第二行至第九行Host->Cookie):请求头部。紧接着请求行(即第一行)之后的部分,用来说明服务器要使用的附加信息。HOST将指出请求的目的地。User-Agent,服务器端和客户端脚本都能访问它,它是浏览器类型检测逻辑的重要基础,该信息由你的浏览器来定义,并且在每个请求中自动发送等等

3、第三部分:空行。请求头部后面的空行是必须的,即使第四部分的请求数据为空,也必须有空行。

4、第四部分:请求数据也叫主体。可以添加任意的其他数据。这个例子的请求数据为空。

 

POST请求例子

使用Fiddler抓取的request
HTTP基础:请求报文

1、第一部分(第一行):请求行,第一行说明了是post请求,以及http1.1版本。

2、第二部分(第二行至第十四行Host->Cookie):请求头部

3、第三部分(第十五行):空行

4、第四部分(第十六行):请求数据

 

请求报文中Headers的属性

使用Fiddler抓取任意请求报文,点击Inspectors tab->Request tab->headers
HTTP基础:请求报文

说明:

1、Cache头域:

在Cache头域中,通常会出现以下属性
    ⑴Cache-Control:用来指定Response-Request遵循的缓存机制,各个指令含义如下
        ①Cache-Control:Public:可以被任何缓存所缓存 
        ②Cache-Control:Private:指示响应信息的全部或部分用于单个用户,而不能用一个共享缓存还缓存。(这个可以让源服务器指示,响应的特定部分只用于一个用户,而对其他用户的请求则是一个不可靠的响应)
        ③Cache-Control:no-cache:所有内容都不会被缓存,请求头里的no-cache表示浏览器不想读取缓存,并不是说没有缓存。(一般在浏览器按Ctrl+F5键强制刷新时,请求头里也会有这个no-cache,也就是跳过强缓存和协商缓存阶段,直接请求服务器)
        ④Cache-Control:max-age=0:指示客户端愿意接收其绝对时间不大于指定的时间,以秒计。如果直接按F5键的话,请求头是max-age=0,只是跳过强缓存,但会进行协商缓存
    ⑵If-Modified-Since:
        ①作用: 把浏览器端缓存页面的最后修改时间发送到服务器去,服务器会把这个时间与服务器上实际文件的最后修改时间进行对比。如果时间一致(说明文件没有被修改),那么返回304,客户端就直接使用本地缓存文件。如果时间不一致,就会返回200和新的文件内容。客户端接到之后,会丢弃旧文件,把新文件缓存起来,并显示在浏览器中
HTTP基础:请求报文


    ⑶If-None-Match
        ①作用: If-None-Match和ETag一起工作,工作原理是在HTTP Response中添加ETag信息。 当用户再次请求该资源时,将在HTTP Request 中加入If-None-Match信息(ETag的值)。如果服务器验证资源的ETag没有改变(该资源没有更新),将返回一个304状态告诉客户端使用本地缓存文件。否则将返回200状态和新的资源和Etag.  使用这样的机制将提高网站的性能
HTTP基础:请求报文
    
    ④Pragma
        ①作用:防止页面被缓存, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一样
        ②Pargma只有一个用法, 例如: Pragma: no-cache。注意: 在HTTP/1.0版本中,只实现了Pragema:no-cache, 没有实现Cache-Control


 2、Client头域

Client头域中,通常会出现以下属性
    ⑴Accept
    作用:浏览器端可以接受的媒体类型,
        ①text/html类型。例如:Accept: text/html代表浏览器可以接受服务器回发的类型为text/html 也就是我们常说的html文档,如果服务器无法返回text/html类型的数据,服务器应该返回一个406错误(non acceptable)
        ②通配符 * 代表任意类型。例如Accept: */* 代表浏览器可以处理所有类型,(一般浏览器发给服务器都是发这个)
        ③Accept-Encoding浏览器声明自己接受的编码方法。例如Accept-Encoding:gzip.deflate,通常指压缩方法,是否支持压缩,支持什么压缩方法(注意:这不是只字符编码)
        ④Accept-Language浏览器申明自己接收的语言。语言跟字符集的区别:中文是语言,中文有多种字符集,比如big5,gb2312,gbk等等;例如: Accept-Language: en-us

    ⑵User-Agent
        ①作用:告诉HTTP服务器,客户端使用的操作系统和浏览器的名称和版本.User-Agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器。
        ②例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

    ⑶Accept-Charset
        ①作用:浏览器申明自己接收的字符集,这就是本文前面介绍的各种字符集和字符编码,如gb2312,utf-8(通常我们说Charset包括了相应的字符编码方案);

3、Cookie头域

Cookie头域中,通常会出现以下属性
    ⑴Cookie
        ①作用: 最重要的header, 将cookie的值发送给HTTP服务器

4、Miscellaneous头域

Miscellaneous头域中,通常会出现以下属性
    ⑴Referer
        ①作用:提供了Request的上下文信息的服务器,告诉服务器我是从哪个链接过来的。有些统计数据需要用到此头域,比如从我的主页上链接到统计服务器那里,该服务器就能够从HTTP Referer中统计出每天有多少用户点击我主页上的链接访问他的网站。
        ②例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT
    
             
5、Entity头域

Entity头域中,通常会出现以下属性
    ⑴Content-Length
        ①作用:发送给HTTP服务器数据的长度。
        ②例如: Content-Length: 338 
    ⑵Content-Type
        ①作用:表示具体请求中的媒体信息(媒体格式信息)
        ②例如:Content-Type: application/x-www-form-urlencoded 

6、Transport头域
    ⑴Connection
        例如:Connection: keep-alive,当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接
        例如: Connection: close,代表一个Request完成后,客户端和服务器之间用于传输HTTP数据的TCP连接会关闭, 当客户端再次发送Request,需要重新建立TCP连接。

7、Host(发送请求时,该报头域是必需的)
        ①作用: 请求报头域主要用于指定被请求资源的Internet主机和端口号,它通常从HTTP URL中提取出来的
        ②例如: 我们在浏览器中输入:http://www.guet.edu.cn/index.html浏览器发送的请求消息中,就会包含Host请求报头域,如下:Host:http://www.guet.edu.cn此处使用缺省端口号80,若指定了端口号,则变成:Host:指定端口号

 

请求报文的方法

1、请求的起始行以方法作为开始,方法用来告诉服务器要如何做

2、Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE。URL全称是资源描述符,我们可以这样认为:一个URL地址,它用于描述一个网络上的资源,而HTTP中的GET,POST,PUT,DELETE就对应着对这个资源的查,改,增,删4个操作。到这里,大家应该有个大概的了解了,GET一般用于获取/查询资源信息,而POST一般用于更新资源信息。

方法说明

GET方法:
    ①是以实体的方式得到由请求URL所指定资源的信息,如果请求URL只是一个数据产生的方式,那么最终要在响应实体中返回处理的最终结果(指定的资源),而不是处理过程的描述
    ②用于信息获取,而且应该是安全的和幂等的

POST方法:
    ①用来向目的服务器发出请求,要求它接收被附在请求后的实体,并把它当做请求队列请求URL所指定资源的附加新子项,所以post请求可能会导致新的资源的建立或已有资源的修改
    ②向指定的资源提交要被处理的数据,可能会修改服务器上资源的请求
    
 HEAD方法:
    ①与GET相同,但只返回HTTP报头,不返回文档主体(返回的响应中没有具体的内容)
PUT方法:
    ①上传指定的URI表示
DELETE方法:
    ①请求服务器删除指定的资源
OPTIONS方法:
    ①允许客户端查看服务器性能
CONNECT方法:
    ①把请求连接转换到透明的TCP/IP通道
TRACE方法:
    ①回显服务器收到的请求,主要用于测试或调试


备注:
1、GET方法
请注意,查询字符串(名称/值对)是在GET请求的URL中发送的,利用一个问号(“?”)代表URL的结尾与请求参数的开始,传递参数长度受限制,各个变量之间使用“&”连接

/test/demo_form.php?name1=value1&name2=value2

2、POST方法
请注意,查询字符串(名称/值对)是在POST请求的HTTP消息主体中发送的:

POST /test/demo_form.php HTTP/1.1
Host: runoob.com
name1=value1&name2=value2

3、URL不存在参数上限的问题,HTTP协议规范没有对URL长度进行限制(一客户端浏览器会对URL上有一些限制)

4、POST是没有大小限制的,HTTP协议规范也没有进行大小限制

 

HTTP 协议中的GET和POST方法。二者主要区别如下:

1、Get是用来从服务器上获得数据,而Post是用来向服务器上传递数据(这一点争议有点多,后面详解)

2、参数的传递方式不同:get请求的数据会附在URL之后(把数据放置在HTTP协议头中)以?分隔,以&连接参数;post请求就是把提交的数据放置在HTTP包的Body中

3、缓存方式不同:GET请求可被缓存;POST请求不会被缓存

 

备注:
1、我们可以从两个角度来看待get请求
    ①从发送请求的角度:get请求相当于我们在数据库中做了查询操作,这样的操作不会影响到数据本身的数据
    ②从接收返回的数据角度:幂等的含义简单的说就是发送get请求不改变返回数据的内容
    ③例如:发送get请求获取测试论坛的首页信息。首页信息并不会因为你发了请求而改变。因为get用于不改变返回信息内容的请求,就像对数据库不做增删改操作,只做查询操作一样

2、Post请求
    ①post请求表示会改变服务器上资源的请求,相当于我们在数据库中做了修改操作,会影响到数据库本身的数据
    ②例如:在测试论坛上发了帖子,做了评论,得到了积分。这种情况下,资源状态被改变了,所以HTTP规范定义post请求是可能会改变服务资源的请求


拓展:

常见的媒体格式类型如下:

   text/html HTML格式
    text/plain 纯文本格式      
    text/xml  XML格式
    text/x-markdown markdown格式
   image/gif gif图片格式    
    image/jpeg jpg图片格式 
    image/png png图片格式

以application开头的媒体格式类型:

    application/xhtml+xml XHTML格式
   application/xml XML数据格式
   application/atom+xml   Atom XML聚合格式    
   application/json JSON数据格式
  application/pdf pdf格式  
   application/msword Word文档格式
   application/octet-stream 二进制流数据(如常见的文件下载)
   application/x-www-form-urlencoded <form encType=””>中默认的encType,form表单数据被编码