HTTP基础:请求报文
HTTP之请求报文(Request)
报文格式
客户端发送一个HTTP请求到服务器的请求消息包括以下格式:
请求行(request line)、请求头部(header)、空行和请求数据(请求主体body)四个部分组成。
备注:
1、header与body之间有个空行
2、请求行以一个方法符号开头,以空格分开,后面跟着请求的URL和协议的版本
Get请求例子
使用Fiddler抓取的request
说明:
1、第一部分(第一行):请求行。用来说明请求类型,要访问的资源以及所使用的HTTP版本
2、第二部分(第二行至第九行Host->Cookie):请求头部。紧接着请求行(即第一行)之后的部分,用来说明服务器要使用的附加信息。HOST将指出请求的目的地。User-Agent,服务器端和客户端脚本都能访问它,它是浏览器类型检测逻辑的重要基础,该信息由你的浏览器来定义,并且在每个请求中自动发送等等
3、第三部分:空行。请求头部后面的空行是必须的,即使第四部分的请求数据为空,也必须有空行。
4、第四部分:请求数据也叫主体。可以添加任意的其他数据。这个例子的请求数据为空。
POST请求例子
使用Fiddler抓取的request
1、第一部分(第一行):请求行,第一行说明了是post请求,以及http1.1版本。
2、第二部分(第二行至第十四行Host->Cookie):请求头部
3、第三部分(第十五行):空行
4、第四部分(第十六行):请求数据
请求报文中Headers的属性
使用Fiddler抓取任意请求报文,点击Inspectors tab->Request tab->headers
说明:
1、Cache头域:
在Cache头域中,通常会出现以下属性
⑴Cache-Control:用来指定Response-Request遵循的缓存机制,各个指令含义如下
①Cache-Control:Public:可以被任何缓存所缓存
②Cache-Control:Private:指示响应信息的全部或部分用于单个用户,而不能用一个共享缓存还缓存。(这个可以让源服务器指示,响应的特定部分只用于一个用户,而对其他用户的请求则是一个不可靠的响应)
③Cache-Control:no-cache:所有内容都不会被缓存,请求头里的no-cache表示浏览器不想读取缓存,并不是说没有缓存。(一般在浏览器按Ctrl+F5键强制刷新时,请求头里也会有这个no-cache,也就是跳过强缓存和协商缓存阶段,直接请求服务器)
④Cache-Control:max-age=0:指示客户端愿意接收其绝对时间不大于指定的时间,以秒计。如果直接按F5键的话,请求头是max-age=0,只是跳过强缓存,但会进行协商缓存
⑵If-Modified-Since:
①作用: 把浏览器端缓存页面的最后修改时间发送到服务器去,服务器会把这个时间与服务器上实际文件的最后修改时间进行对比。如果时间一致(说明文件没有被修改),那么返回304,客户端就直接使用本地缓存文件。如果时间不一致,就会返回200和新的文件内容。客户端接到之后,会丢弃旧文件,把新文件缓存起来,并显示在浏览器中
⑶If-None-Match
①作用: If-None-Match和ETag一起工作,工作原理是在HTTP Response中添加ETag信息。 当用户再次请求该资源时,将在HTTP Request 中加入If-None-Match信息(ETag的值)。如果服务器验证资源的ETag没有改变(该资源没有更新),将返回一个304状态告诉客户端使用本地缓存文件。否则将返回200状态和新的资源和Etag. 使用这样的机制将提高网站的性能
④Pragma
①作用:防止页面被缓存, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一样
②Pargma只有一个用法, 例如: Pragma: no-cache。注意: 在HTTP/1.0版本中,只实现了Pragema:no-cache, 没有实现Cache-Control
2、Client头域
在Client头域中,通常会出现以下属性
⑴Accept
作用:浏览器端可以接受的媒体类型,
①text/html类型。例如:Accept: text/html代表浏览器可以接受服务器回发的类型为text/html 也就是我们常说的html文档,如果服务器无法返回text/html类型的数据,服务器应该返回一个406错误(non acceptable)
②通配符 * 代表任意类型。例如Accept: */* 代表浏览器可以处理所有类型,(一般浏览器发给服务器都是发这个)
③Accept-Encoding浏览器声明自己接受的编码方法。例如Accept-Encoding:gzip.deflate,通常指压缩方法,是否支持压缩,支持什么压缩方法(注意:这不是只字符编码)
④Accept-Language浏览器申明自己接收的语言。语言跟字符集的区别:中文是语言,中文有多种字符集,比如big5,gb2312,gbk等等;例如: Accept-Language: en-us
⑵User-Agent
①作用:告诉HTTP服务器,客户端使用的操作系统和浏览器的名称和版本.User-Agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器。
②例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)
⑶Accept-Charset
①作用:浏览器申明自己接收的字符集,这就是本文前面介绍的各种字符集和字符编码,如gb2312,utf-8(通常我们说Charset包括了相应的字符编码方案);
3、Cookie头域
在Cookie头域中,通常会出现以下属性
⑴Cookie
①作用: 最重要的header, 将cookie的值发送给HTTP服务器
4、Miscellaneous头域
在Miscellaneous头域中,通常会出现以下属性
⑴Referer
①作用:提供了Request的上下文信息的服务器,告诉服务器我是从哪个链接过来的。有些统计数据需要用到此头域,比如从我的主页上链接到统计服务器那里,该服务器就能够从HTTP Referer中统计出每天有多少用户点击我主页上的链接访问他的网站。
②例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT
5、Entity头域
在Entity头域中,通常会出现以下属性
⑴Content-Length
①作用:发送给HTTP服务器数据的长度。
②例如: Content-Length: 338
⑵Content-Type
①作用:表示具体请求中的媒体信息(媒体格式信息)
②例如:Content-Type: application/x-www-form-urlencoded
6、Transport头域
⑴Connection
例如:Connection: keep-alive,当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接
例如: Connection: close,代表一个Request完成后,客户端和服务器之间用于传输HTTP数据的TCP连接会关闭, 当客户端再次发送Request,需要重新建立TCP连接。
7、Host(发送请求时,该报头域是必需的)
①作用: 请求报头域主要用于指定被请求资源的Internet主机和端口号,它通常从HTTP URL中提取出来的
②例如: 我们在浏览器中输入:http://www.guet.edu.cn/index.html浏览器发送的请求消息中,就会包含Host请求报头域,如下:Host:http://www.guet.edu.cn此处使用缺省端口号80,若指定了端口号,则变成:Host:指定端口号
请求报文的方法
1、请求的起始行以方法作为开始,方法用来告诉服务器要如何做
2、Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE。URL全称是资源描述符,我们可以这样认为:一个URL地址,它用于描述一个网络上的资源,而HTTP中的GET,POST,PUT,DELETE就对应着对这个资源的查,改,增,删4个操作。到这里,大家应该有个大概的了解了,GET一般用于获取/查询资源信息,而POST一般用于更新资源信息。
方法说明
GET方法:
①是以实体的方式得到由请求URL所指定资源的信息,如果请求URL只是一个数据产生的方式,那么最终要在响应实体中返回处理的最终结果(指定的资源),而不是处理过程的描述
②用于信息获取,而且应该是安全的和幂等的
POST方法:
①用来向目的服务器发出请求,要求它接收被附在请求后的实体,并把它当做请求队列请求URL所指定资源的附加新子项,所以post请求可能会导致新的资源的建立或已有资源的修改
②向指定的资源提交要被处理的数据,可能会修改服务器上资源的请求
HEAD方法:
①与GET相同,但只返回HTTP报头,不返回文档主体(返回的响应中没有具体的内容)
PUT方法:
①上传指定的URI表示
DELETE方法:
①请求服务器删除指定的资源
OPTIONS方法:
①允许客户端查看服务器性能
CONNECT方法:
①把请求连接转换到透明的TCP/IP通道
TRACE方法:
①回显服务器收到的请求,主要用于测试或调试
备注:
1、GET方法
请注意,查询字符串(名称/值对)是在GET请求的URL中发送的,利用一个问号(“?”)代表URL的结尾与请求参数的开始,传递参数长度受限制,各个变量之间使用“&”连接
/test/demo_form.php?name1=value1&name2=value2
2、POST方法
请注意,查询字符串(名称/值对)是在POST请求的HTTP消息主体中发送的:
POST /test/demo_form.php HTTP/1.1
Host: runoob.com
name1=value1&name2=value2
3、URL不存在参数上限的问题,HTTP协议规范没有对URL长度进行限制(一客户端浏览器会对URL上有一些限制)
4、POST是没有大小限制的,HTTP协议规范也没有进行大小限制
HTTP 协议中的GET和POST方法。二者主要区别如下:
1、Get是用来从服务器上获得数据,而Post是用来向服务器上传递数据(这一点争议有点多,后面详解)
2、参数的传递方式不同:get请求的数据会附在URL之后(把数据放置在HTTP协议头中)以?分隔,以&连接参数;post请求就是把提交的数据放置在HTTP包的Body中
3、缓存方式不同:GET请求可被缓存;POST请求不会被缓存
备注:
1、我们可以从两个角度来看待get请求
①从发送请求的角度:get请求相当于我们在数据库中做了查询操作,这样的操作不会影响到数据本身的数据
②从接收返回的数据角度:幂等的含义简单的说就是发送get请求不改变返回数据的内容
③例如:发送get请求获取测试论坛的首页信息。首页信息并不会因为你发了请求而改变。因为get用于不改变返回信息内容的请求,就像对数据库不做增删改操作,只做查询操作一样
2、Post请求
①post请求表示会改变服务器上资源的请求,相当于我们在数据库中做了修改操作,会影响到数据库本身的数据
②例如:在测试论坛上发了帖子,做了评论,得到了积分。这种情况下,资源状态被改变了,所以HTTP规范定义post请求是可能会改变服务资源的请求
拓展:
常见的媒体格式类型如下:
text/html | HTML格式 |
text/plain | 纯文本格式 |
text/xml | XML格式 |
text/x-markdown | markdown格式 |
image/gif | gif图片格式 |
image/jpeg | jpg图片格式 |
image/png | png图片格式 |
以application开头的媒体格式类型:
application/xhtml+xml | XHTML格式 |
application/xml | XML数据格式 |
application/atom+xml | Atom XML聚合格式 |
application/json | JSON数据格式 |
application/pdf | pdf格式 |
application/msword | Word文档格式 |
application/octet-stream | 二进制流数据(如常见的文件下载) |
application/x-www-form-urlencoded | <form encType=””>中默认的encType,form表单数据被编码 |