Http协议学习

HTTP简介

  • WEB浏览器与WEB服务器之间的一问一答的交互过程必须遵循一定的规则,这个规则就是HTTP协议。
  • HTTP是HyperText Transfer Protocol(超文本传输协议)的简写,它是TCP/IP协议的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程及数据本身的格式
  • HTTP协议的版本:HTTP/1.0、HTTP/1.1
  • HTTP协议是学习JavaWEB开发的基石,不深入了解HTTP协议,就不能说掌握了WEB开发,更无法管理和维护一些复杂的WEB站点。

HTTP1.0的基本运行方式

  • 基于HTTP协议的客户/服务器模式的信息交换过程,如图所示,它分四个过程,建立连接、发送请求信息、发送响应信息、关闭连接。

                 Http协议学习

  • 浏览器与WEB服务器的连接过程是短暂的,每次连接只处理一个请求和响应。对每一个页面的访问,浏览器与WEB服务器都要建立一次单独的连接。
  • 浏览器到WEB服务器之间的所有通讯都是完全独立分开的请求和响应。
  • 无状态

HTTP1.1与HTTP1.0的比较

    HTTP1.1的特点:

  • 在一个TCP连接上可以传送多个HTTP请求和响应
  • 多个请求和响应过程可以重叠
  • 增加了更多的请求头和响应头,比如Host、If-Unmodified-Since请求头等

           Http协议学习

HTTP请求消息

客户端连上服务器后,向服务器请求某个web资源,称之为客户端向服务器发送了一个HTTP请求。

一个完整的HTTP请求包括如下内容: 一个请求行、若干消息头、以及请求正文,其中的一些消息头和正文都是可选的,消息头和正文内容之间要用空行隔开。

     Http协议学习

HTTP响应消息

一个HTTP响应代表服务器向客户端回送的数据。

一个完整的HTTP响应包括如下内容: 一个状态行、若干消息头、以及响应正文,其中的一些消息头和正文都是可选的,消息头和正文内容之间要用空行隔开。

      Http协议学习

HTTP消息头(请求和响应共性)

  • 使用消息头,可以实现HTTP客户机与服务器之间的条件请求和应答,消息头相当于服务器和浏览器之间的一些暗号指令。
  • 每个消息头包含一个头字段名称,然后依次是冒号、空格、值、回车和换行符     如: Accept-Encoding: gzip, deflate
  • 消息头字段名是不区分大小写的,但习惯上讲每个单词的第一个字母大写。
  • 整个消息头部分中的各行消息头可按任何顺序排列。 消息头又可分为通用信息头、请求头、响应头、实体头等四类 许多请求头字段都允许客户端在值部分指定多个可接受的选项,多个选项之间以逗号分隔。
  • 有些头字段可以出现多次,例如,响应消息中可以包含有多个”Warning”头字段。

HTTP请求的细节——请求行 

请求行 格式:请求方式 资源路径 HTTP版本号<CRLF>

    举例:GET /temp3o116.shtml HTTP/1.1

    请求方式:GETPOST、HEAD、OPTIONS、DELETE、TRACE、PUT

    用户如没有设置,默认情况下浏览器向服务器发送的都是get请求,例如在浏览器直接输地址访问,点超链接访问等都是get,用户如想把请求方式改为post,可通过更改表单的提交方式实现。 不管POST或GET,都用于向服务器请求某个WEB资源,这两种方式的区别主要表现在数据传递上。 GET方式 如请求方式为GET方式,则可以在请求的URL地址后以?的形式带上交给服务器的数据,多个数据之间以&进行分隔,例如: GET /mail/1.html?name=abc&password=xyz HTTP/1.1

GET方式的特点:在URL地址后附带的参数是有限制的,其数据容量通常不能超过1K。

POST方式 如请求方式为POST方式,则可以在请求的正文内容中向服务器发送数据,Post方式的特点:传送的数据量无限制。

 

HTTP响应的细节——状态行

状态行     

格式: HTTP版本号 状态码 原因叙述<CRLF>     

举例:HTTP/1.1 200 OK

状态码用于表示服务器对请求的各种不同处理结果和状态,它是一个三位的十进制数。响应状态码分为5类,使用最高位为1到5来进行分类如下所示:

Http协议学习

常用状态码:

200(正常) 表示一切正常,返回的是正常请求结果

302/307(临时重定向) 指出被请求的文档已被临时移动到别处,此文档的新的URL在Location响应头中给出。

304(未修改) 表示客户机缓存的版本是最新的,客户机可以继续使用它,无需到服务器请求。

404(找不到) 服务器上不存在客户机所请求的资源。

500(服务器内部错误) 服务器端的程序发生错误

请求头细节

请求头字段用于客户端在请求消息中向服务器传递附加信息,主要包括客户端可以接受的数据类型(MIME类型)、压缩方法、语言以及发出请求的超链接所属页面的URL地址等信息。 常用请求头:

Accept:浏览器可接受的MIME类型

Accept-Charset: 浏览器通过这个头告诉服务器,它支持哪种字符集

Accept-Encoding:浏览器能够进行解码的数据编码方式,比如gzip

Accept-Language:浏览器所希望的语言种类,当服务器能够提供一种以上的语言版本时要用到。 可以在浏览器中进行设置。

Host:初始URL中的主机和端口

Referer:包含一个URL,用户从该URL代表的页面出发访问当前请求的页面

Content-Type:内容类型

If-Modified-Since: Wed, 02 Feb 2011 12:04:56 GMT利用这个头与服务器的文件进行比对,如果一致,则从缓存中直接读取文件。

User-Agent:浏览器类型.

Content-Length:表示请求消息正文的长度

Connection:表示是否需要持久连接。如果服务器看到这里的值为“Keep -Alive”,或者看到请求使用的是HTTP 1.1(HTTP 1.1默认进行持久连接

Cookie:这是最重要的请求头信息之一

Date:Date: Mon, 22 Aug 2011 01:55:39 GMT请求时间GMT

响应头细节

Location: http://www.it315.org/index.jsp指示新的资源的位置

Server:apache tomcat指示服务器的类型

Content-Encoding: gzip服务器发送的数据采用的编码类型

Content-Length: 80 告诉浏览器正文的长度

Content-Language: zh-cn服务发送的文本的语言

Content-Type: text/html; charset=GB2312服务器发送的内容的MIME类型

Last-Modified: Tue, 11 Jul 2000 18:23:51 GMT文件的最后修改时间

Refresh: 1;url=http://www.it315.org指示客户端刷新频率。单位是秒

Content-Disposition: attachment; filename=aaa.zip指示客户端下载文件

Set-Cookie:SS=Q0=5Lb_nQ; path=/search服务器端发送的

Cookie Expires: -1 Cache-Control: no-cache (1.1)  

Pragma: no-cache   (1.0) Connection: close/Keep-Alive   Date: Tue, 11 Jul 2000 18:23:51 GMT

说明:cookie的信息都是放置在头中的。

表单提交涉及到的Http请求响应分析

在Form元素的语法中,EncType表明提交数据的格式 用 Enctype 属性指定将数据回发到服务器时浏览器使用的编码类型。 例如:

application/x-www-form-urlencoded: 窗体数据被编码为名称/值对。这是标准的编码格式。

multipart/form-data: 窗体数据被编码为一条消息,页上的每个控件对应消息中的一个部分,这个一般文件上传时用。

text/plain: 窗体数据以纯文本形式进行编码,其中不含任何控件或格式字符。 

form的enctype属性为编码方式,常用有两种:application/x-www-form-urlencoded和multipart/form-data,默认为application/x-www-form-urlencoded。

1.x-www-form-urlencoded

当action为get时候,浏览器用x-www-form-urlencoded的编码方式把form数据转换成一个字串(name1=value1&name2=value2…),然后把这个字串append到url后面,用?分割,加载这个新的url。

当action为post时候,就是将数据封装到当前请求的请求体当中。

2.multipart/form-data

当action为post时候,浏览器把form数据封装到http body中,然后发送到server。 如果没有type=file的控件,用默认的application/x-www-form-urlencoded就可以了。 但是如果有type=file的话,就要用到multipart/form-data了。浏览器会把整个表单以控件为单位分割,并为每个部分加上Content-Disposition(form-data或者file),Content-Type(默认为text/plain),name(控件name)等信息,并加上分割符(boundary)。

另外,文件下载也是需要设置响应头中的Content-Disposition这个消息头

 

转载于:https://my.oschina.net/whling/blog/1782846