HTTP基础：请求报文

HTTP之请求报文(Request)

报文格式

客户端发送一个HTTP请求到服务器的请求消息包括以下格式：

请求行（request line）、请求头部（header）、空行和请求数据(请求主体body)四个部分组成。

备注：
1、header与body之间有个空行
2、请求行以一个方法符号开头，以空格分开，后面跟着请求的URL和协议的版本

Get请求例子

使用Fiddler抓取的request

HTTP基础：请求报文
说明：
1、第一部分(第一行)：请求行。用来说明请求类型,要访问的资源以及所使用的HTTP版本

2、第二部分(第二行至第九行Host->Cookie)：请求头部。紧接着请求行（即第一行）之后的部分，用来说明服务器要使用的附加信息。HOST将指出请求的目的地。User-Agent，服务器端和客户端脚本都能访问它，它是浏览器类型检测逻辑的重要基础，该信息由你的浏览器来定义，并且在每个请求中自动发送等等

3、第三部分：空行。请求头部后面的空行是必须的，即使第四部分的请求数据为空，也必须有空行。

4、第四部分：请求数据也叫主体。可以添加任意的其他数据。这个例子的请求数据为空。

POST请求例子

使用Fiddler抓取的request
HTTP基础：请求报文

1、第一部分(第一行)：请求行，第一行说明了是post请求，以及http1.1版本。

2、第二部分(第二行至第十四行Host->Cookie)：请求头部

3、第三部分(第十五行)：空行

4、第四部分(第十六行)：请求数据

请求报文中Headers的属性

使用Fiddler抓取任意请求报文，点击Inspectors tab->Request tab->headers
HTTP基础：请求报文

说明：

1、Cache头域：

在Cache头域中，通常会出现以下属性
   ⑴Cache-Control：用来指定Response-Request遵循的缓存机制，各个指令含义如下
       ①Cache-Control:Public：可以被任何缓存所缓存
       ②Cache-Control:Private:指示响应信息的全部或部分用于单个用户，而不能用一个共享缓存还缓存。(这个可以让源服务器指示，响应的特定部分只用于一个用户，而对其他用户的请求则是一个不可靠的响应)
       ③Cache-Control:no-cache：所有内容都不会被缓存，请求头里的no-cache表示浏览器不想读取缓存，并不是说没有缓存。(一般在浏览器按Ctrl+F5键强制刷新时，请求头里也会有这个no-cache，也就是跳过强缓存和协商缓存阶段，直接请求服务器)
       ④Cache-Control:max-age=0：指示客户端愿意接收其绝对时间不大于指定的时间，以秒计。如果直接按F5键的话，请求头是max-age=0，只是跳过强缓存，但会进行协商缓存
   ⑵If-Modified-Since:
       ①作用： 把浏览器端缓存页面的最后修改时间发送到服务器去，服务器会把这个时间与服务器上实际文件的最后修改时间进行对比。如果时间一致(说明文件没有被修改)，那么返回304，客户端就直接使用本地缓存文件。如果时间不一致，就会返回200和新的文件内容。客户端接到之后，会丢弃旧文件，把新文件缓存起来，并显示在浏览器中
HTTP基础：请求报文

   ⑶If-None-Match
       ①作用: If-None-Match和ETag一起工作，工作原理是在HTTP Response中添加ETag信息。当用户再次请求该资源时，将在HTTP Request 中加入If-None-Match信息(ETag的值)。如果服务器验证资源的ETag没有改变（该资源没有更新），将返回一个304状态告诉客户端使用本地缓存文件。否则将返回200状态和新的资源和Etag. 使用这样的机制将提高网站的性能
HTTP基础：请求报文

   ④Pragma
       ①作用：防止页面被缓存，在HTTP/1.1版本中，它和Cache-Control:no-cache作用一模一样
       ②Pargma只有一个用法，例如： Pragma: no-cache。注意: 在HTTP/1.0版本中，只实现了Pragema:no-cache, 没有实现Cache-Control

2、Client头域

在Client头域中，通常会出现以下属性
   ⑴Accept
   作用：浏览器端可以接受的媒体类型,
       ①text/html类型。例如：Accept: text/html代表浏览器可以接受服务器回发的类型为text/html 也就是我们常说的html文档,如果服务器无法返回text/html类型的数据,服务器应该返回一个406错误(non acceptable)
       ②通配符 * 代表任意类型。例如Accept: */* 代表浏览器可以处理所有类型,(一般浏览器发给服务器都是发这个)
       ③Accept-Encoding浏览器声明自己接受的编码方法。例如Accept-Encoding：gzip.deflate,通常指压缩方法，是否支持压缩，支持什么压缩方法（注意：这不是只字符编码）
       ④Accept-Language浏览器申明自己接收的语言。语言跟字符集的区别：中文是语言，中文有多种字符集，比如big5，gb2312，gbk等等；例如： Accept-Language: en-us

   ⑵User-Agent
       ①作用：告诉HTTP服务器，客户端使用的操作系统和浏览器的名称和版本.User-Agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器。
       ②例如： User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

⑶Accept-Charset
①作用：浏览器申明自己接收的字符集，这就是本文前面介绍的各种字符集和字符编码，如gb2312，utf-8（通常我们说Charset包括了相应的字符编码方案）；

3、Cookie头域

在Cookie头域中，通常会出现以下属性
⑴Cookie
①作用：最重要的header, 将cookie的值发送给HTTP服务器

4、Miscellaneous头域

在Miscellaneous头域中，通常会出现以下属性
   ⑴Referer
       ①作用：提供了Request的上下文信息的服务器，告诉服务器我是从哪个链接过来的。有些统计数据需要用到此头域，比如从我的主页上链接到统计服务器那里，该服务器就能够从HTTP Referer中统计出每天有多少用户点击我主页上的链接访问他的网站。
       ②例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT


5、Entity头域

在Entity头域中，通常会出现以下属性
   ⑴Content-Length
       ①作用：发送给HTTP服务器数据的长度。
       ②例如： Content-Length: 338
   ⑵Content-Type
       ①作用：表示具体请求中的媒体信息(媒体格式信息)
       ②例如：Content-Type: application/x-www-form-urlencoded

6、Transport头域
   ⑴Connection
       例如：Connection: keep-alive，当一个网页打开完成后，客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭，如果客户端再次访问这个服务器上的网页，会继续使用这一条已经建立的连接
       例如： Connection: close，代表一个Request完成后，客户端和服务器之间用于传输HTTP数据的TCP连接会关闭，当客户端再次发送Request，需要重新建立TCP连接。

7、Host（发送请求时，该报头域是必需的）
①作用: 请求报头域主要用于指定被请求资源的Internet主机和端口号，它通常从HTTP URL中提取出来的
②例如: 我们在浏览器中输入：http://www.guet.edu.cn/index.html浏览器发送的请求消息中，就会包含Host请求报头域，如下：Host：http://www.guet.edu.cn此处使用缺省端口号80，若指定了端口号，则变成：Host：指定端口号

请求报文的方法

1、请求的起始行以方法作为开始，方法用来告诉服务器要如何做

2、Http定义了与服务器交互的不同方法，最基本的方法有4种，分别是GET，POST，PUT，DELETE。URL全称是资源描述符，我们可以这样认为：一个URL地址，它用于描述一个网络上的资源，而HTTP中的GET，POST，PUT，DELETE就对应着对这个资源的查，改，增，删4个操作。到这里，大家应该有个大概的了解了，GET一般用于获取/查询资源信息，而POST一般用于更新资源信息。

方法说明

GET方法：
①是以实体的方式得到由请求URL所指定资源的信息，如果请求URL只是一个数据产生的方式，那么最终要在响应实体中返回处理的最终结果(指定的资源)，而不是处理过程的描述
②用于信息获取，而且应该是安全的和幂等的

POST方法：
   ①用来向目的服务器发出请求，要求它接收被附在请求后的实体，并把它当做请求队列请求URL所指定资源的附加新子项，所以post请求可能会导致新的资源的建立或已有资源的修改
   ②向指定的资源提交要被处理的数据，可能会修改服务器上资源的请求

HEAD方法：
   ①与GET相同，但只返回HTTP报头，不返回文档主体(返回的响应中没有具体的内容)
PUT方法：
   ①上传指定的URI表示
DELETE方法：
   ①请求服务器删除指定的资源
OPTIONS方法：
   ①允许客户端查看服务器性能
CONNECT方法：
   ①把请求连接转换到透明的TCP/IP通道
TRACE方法：
   ①回显服务器收到的请求，主要用于测试或调试

备注：
1、GET方法
请注意，查询字符串（名称/值对）是在GET请求的URL中发送的，利用一个问号（“?”）代表URL的结尾与请求参数的开始，传递参数长度受限制，各个变量之间使用“&”连接

/test/demo_form.php?name1=value1&name2=value2

2、POST方法
请注意，查询字符串（名称/值对）是在POST请求的HTTP消息主体中发送的：

POST /test/demo_form.php HTTP/1.1
Host: runoob.com
name1=value1&name2=value2

3、URL不存在参数上限的问题，HTTP协议规范没有对URL长度进行限制(一客户端浏览器会对URL上有一些限制)

4、POST是没有大小限制的，HTTP协议规范也没有进行大小限制

HTTP 协议中的GET和POST方法。二者主要区别如下：

1、Get是用来从服务器上获得数据，而Post是用来向服务器上传递数据(这一点争议有点多，后面详解)

2、参数的传递方式不同：get请求的数据会附在URL之后(把数据放置在HTTP协议头中)以?分隔，以&连接参数;post请求就是把提交的数据放置在HTTP包的Body中

3、缓存方式不同：GET请求可被缓存；POST请求不会被缓存

备注：
1、我们可以从两个角度来看待get请求
   ①从发送请求的角度：get请求相当于我们在数据库中做了查询操作，这样的操作不会影响到数据本身的数据
   ②从接收返回的数据角度：幂等的含义简单的说就是发送get请求不改变返回数据的内容
   ③例如：发送get请求获取测试论坛的首页信息。首页信息并不会因为你发了请求而改变。因为get用于不改变返回信息内容的请求，就像对数据库不做增删改操作，只做查询操作一样

2、Post请求
①post请求表示会改变服务器上资源的请求，相当于我们在数据库中做了修改操作，会影响到数据库本身的数据
②例如：在测试论坛上发了帖子，做了评论，得到了积分。这种情况下，资源状态被改变了，所以HTTP规范定义post请求是可能会改变服务资源的请求

拓展：

常见的媒体格式类型如下：

text/html	HTML格式
text/plain	纯文本格式
text/xml	XML格式
text/x-markdown	markdown格式
image/gif	gif图片格式
image/jpeg	jpg图片格式
image/png	png图片格式

以application开头的媒体格式类型：

application/xhtml+xml	XHTML格式
application/xml	XML数据格式
application/atom+xml	Atom XML聚合格式
application/json	JSON数据格式
application/pdf	pdf格式
application/msword	Word文档格式
application/octet-stream	二进制流数据（如常见的文件下载）
application/x-www-form-urlencoded	<form encType=””>中默认的encType，form表单数据被编码