Python -- 网络模型 -- 传输层基础

运输层协议概述:

  • 从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,也是用户功能中的最低层。
  • 当网络的边缘部分中的两个主机使用网络的核心部分的功能进行端到端的通信时,只有位于网络边缘部分的主机的协议栈才有运输层,而网络核心部分中的路由器在转发分组时都只用到下三层的功能。
  • 两个主机进行通信实际上就是两个主机中的应用进程互相通信。  应用进程之间的通信又称为端到端的通信
  • 运输层的一个很重要的功能就是复用分用。应用层不同进程的报文通过不同的端口交到运输层,再往下就共用网络层提供的服务。
  • 运输层提供应用进程间的逻辑通信”。“逻辑通信”的意思是:运输层之间的通信好像是沿水平方向传送数据。但事实上这两个运输层之间并没有一条水平方向的物理连接。
     

Python -- 网络模型 -- 传输层基础

运输层的主要功能 :

  • 运输层为应用进程之间提供端到端的逻辑通信(但网络层是为主机之间提供逻辑通信)。
  • 运输层还要对收到的报文进行差错检测。
  • 运输层需要有两种不同的运输协议,即面向连接的 TCP 和无连接的 UDP   

两种不同的运输协议:

  • 运输层向高层用户屏蔽了下面网络核心的细节(如网络拓扑、所采用的路由选择协议等),它使应用进程看见的就是好像在两个运输层实体之间有一条端到端的逻辑通信信道。
  • 当运输层采用面向连接的 TCP 协议时,尽管下面的网络是不可靠的(只提供尽最大努力服务),但这种逻辑通信信道就相当于一条全双工的可靠信道
  • 当运输层采用无连接的 UDP 协议时,这种逻辑通信信道是一条不可靠信道

运输层的两个主要协议 :用户数据报协议 UDP (User Datagram Protocol) 和 传输控制协议 TCP  (Transmission Control Protocol):

  • 两个对等运输实体在通信时传送的数据单位叫作运输协议数据单元 TPDU (Transport Protocol Data Unit)TCP 传送的数据单位协议是 TCP 报文段(segment)UDP 传送的数据单位协议是 UDP 报文用户数据报
  • UDP 在传送数据之前不需要先建立连接。对方的运输层在收到 UDP 报文后,不需要给出任何确认。虽然 UDP 不提供可靠交付,但在某些情况下 UDP 是一种最有效的工作方式。
  • TCP 则提供面向连接的服务。TCP 不提供广播或多播服务。由于 TCP 要提供可靠的、面向连接的运输服务,因此不可避免地增加了许多的开销。这不仅使协议数据单元的首部增大很多,还要占用许多的处理机资源。 
  • 运输层的 UDP 用户数据报与网际层的IP数据报有很大区别。IP 数据报要经过互连网中许多路由器的存储转发,但 UDP 用户数据报是在运输层的端到端抽象的逻辑信道中传送的。
  • TCP 报文段是在运输层抽象的端到端逻辑信道中传送,这种信道是可靠的全双工信道。但这样的信道却不知道究竟经过了哪些路由器,而这些路由器也根本不知道上面的运输层是否建立了 TCP 连接。

运输层的端口 :

  • 运行在计算机中的进程是用进程标识符来标志的。而不同的操作系统又使用不同格式的进程标识符。为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须用统一的方法TCP/IP 体系的应用进程进行标志。
  • 由于进程的创建和撤销都是动态的,发送方几乎无法识别其他机器上的进程。有时我们会改换接收报文的进程,但并不需要通知所有发送方。我们往往需要利用目的主机提供的功能来识别终点,而不需要知道实现这个功能的进程。
  • 解决这个问题的方法就是在运输层使用协议端口号(protocol port number),或通常简称为端口(port)虽然通信的终点是应用进程,但我们可以把端口想象是通信的终点,因为我们只要把要传送的报文交到目的主机的某一个合适的目的端口,剩下的工作(即最后交付目的进程)就由 TCP 来完成。
  • 在协议栈层间的抽象的协议端口是软件端口路由器或交换机上的端口是硬件端口硬件端口是不同硬件设备进行交互的接口,而软件端口是应用层的各种协议进程与运输实体进行层间交互的一种地址。
  • 端口用一个 16 位端口号进行标志。端口号只具有本地意义,即端口号只是为了标志本计算机应用层中的各进程。在因特网中不同计算机的相同端口号是没有联系的。

三类端口:

  • 熟知端口,数值一般为 0~1023。是系统使用的端口。
  • 登记端口号,数值为1024~49151,为没有熟知端口号的应用程序使用的。使用这个范围的端口号必须在 IANA 登记,以防止重复。
  • 客户端口号短暂端口号,数值为49152~65535,留给客户进程选择暂时使用。当服务器进程收到客户进程的报文时,就知道了客户进程所使用的动态端口号。通信结束后,这个端口号可供其他客户进程以后使用。

用户数据报协议 UDP:

  • UDP 只在 IP 的数据报服务之上增加了很少一点的功能,即端口的功能和差错检测的功能。虽然 UDP 用户数据报只能提供不可靠的交付,但 UDP 在某些方面有其特殊的优点。
  • UDP 是无连接的,即发送数据之前不需要建立连接。
  • UDP 使用尽最大努力交付,即不保证可靠交付,同时也不使用拥塞控制。UDP 是面向报文的。UDP 没有拥塞控制,很适合多媒体通信的要求。
  • UDP 支持一对一、一对多、多对一和多对多的交互通信。UDP 的首部开销小,只有 8 个字节。
  • 发送方 UDP 对应用程序交下来的报文,在添加首部后就向下交付 IP 层。UDP 对应用层交下来的报文,既不合并,也不拆分,而是保留这些报文的边界。
  • 应用层交给 UDP 多长的报文,UDP 就照样发送,即一次发送一个报文。
  • 接收方 UDP IP 层交上来的 UDP 用户数据报,在去除首部后就原封不动地交付上层的应用进程,一次交付一个完整的报文。所以,应用程序必须选择合适大小的报文。

Python -- 网络模型 -- 传输层基础

UDP 的首部格式:

Python -- 网络模型 -- 传输层基础

UDP 基于端口的分用 :

Python -- 网络模型 -- 传输层基础

传输控制协议 TCP 概述 :

  • TCP 面向连接的运输层协议。每一条 TCP 连接只能有两个端点(endpoint),每一条 TCP 连接只能是点对点的(一对一)。 TCP 提供可靠交付的服务。提供全双工通信。面向字节流。 
  • TCP 对应用进程一次把多长的报文发送到TCP 的缓存中是不关心的。TCP 根据对方给出的窗口值和当前网络拥塞的程度来决定一个报文段应包含多少个字节(UDP 发送的报文长度是应用进程给出的)。TCP 可把太长的数据块划分短一些再传送。TCP 也可等待积累有足够多的字节后再构成报文段发送出去。
  • 每一条 TCP 连接有两个端点。连接的端点不是主机,不是主机的IP 地址,不是应用进程,也不是运输层的协议端口。TCP 连接的端点叫做套接字(socket)插口端口号拼接到(contatenated with) IP 地址即构成了套接字。  
  • 套接字 socket = (IP地址: 端口号) ,每一条 TCP 连接唯一地被通信两端的两个端点(即两个套接字)所确定。
  • 即:TCP 连接 ::= {socket1, socket2}= {(IP1: port1), (IP2: port2)}    

TCP 面向流的概念 :

Python -- 网络模型 -- 传输层基础

可靠传输的工作原理:停止等待协议。

Python -- 网络模型 -- 传输层基础

  • 在发送完一个分组后,必须暂时保留已发送的分组的副本。
  • 分组和确认分组都必须进行编号。
  • 超时计时器的重传时间应当比数据在分组传输的平均往返时间更长一些。

确认丢失和确认迟到 :

Python -- 网络模型 -- 传输层基础

  • 使用上述的确认和重传机制,我们就可以在不可靠的传输网络上实现可靠的通信
  • 这种可靠传输协议常称为自动重传请求ARQ (Automatic Repeat reQuest)
  • ARQ 表明重传的请求是自动进行的。接收方不需要请求发送方重传某个出错的分组 。

停止等待协议的优点是简单,但缺点是信道利用率太低。

发送方可连续发送多个分组,不必每发完一个分组就停顿下来等待对方的确认。由于信道上一直有数据不间断地传送,这种传输方式可获得很高的信道利用率。

接收方一般采用累积确认的方式。即不必对收到的分组逐个发送确认,而是对按序到达的最后一个分组发送确认,这样就表示:到这个分组为止的所有分组都已正确收到了

累积确认有的优点是:容易实现,即使确认丢失也不必重传。缺点是:不能向发送方反映出接收方已经正确收到的所有分组的信息。

如果发送方发送了前 5 个分组,而中间的第 3 个分组丢失了。这时接收方只能对前两个分组发出确认。发送方无法知道后面三个分组的下落,而只好把后面的三个分组都再重传一次。这就叫做 Go-back-N(回退 N),表示需要再退回来重传已发送过的 N 个分组。可见当通信线路质量不好时,连续 ARQ 协议会带来负面的影响。

TCP 可靠通信的具体实现 :

  • TCP 连接的每一端都必须设有两个窗口——一个发送窗口和一个接收窗口
  • TCP 的可靠传输机制用字节的序号进行控制。TCP 所有的确认都是基于序号而不是基于报文段。
  • TCP 两端的四个窗口经常处于动态变化之中。
  • TCP连接的往返时间 RTT 不是固定不变的。需要使用特定的算法估算较为合理的重传时间。 

TCP 报文段的首部格式 :

Python -- 网络模型 -- 传输层基础

  • 源端口和目的端口字段——各占 2 字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现。 
  • 序号字段——4 字节。TCP 连接中传送的数据流中的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。
  • 确认号字段——4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。
  • 数据偏移(即首部长度)——4 位,它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远。“数据偏移”的单位是 32 位字(以 4 字节为计算单位)。 
  • 保留字段——6 位,保留为今后使用,但目前应置为 0
  • 紧急 URG —— URG = 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)
  • 确认 ACK —— 只有当 ACK = 1 时确认号字段才有效。当 ACK = 0 时,确认号无效。
  • 推送 PSH (PuSH接收 TCP 收到 PSH = 1 的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了后再向上交付。 
  • 复位 RST (ReSeT) —— RST = 1 时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。
  • 同步 SYN —— 同步 SYN = 1 表示这是一个连接请求或连接接受报文。
  • 终止 FIN (FINis) —— 用来释放一个连接。FIN = 1 表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。
  • 窗口字段 —— 2 字节,用来让对方设置发送窗口的依据,单位为字节。
  • 检验和 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加 12 字节的伪首部。
  • 紧急指针字段 —— 16 位,指出在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)。  
  • 选项字段 —— 长度可变。TCP 最初只规定了一种选项,即最大报文段长度 MSSMSS 告诉对方 TCP:“我的缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节。”
  • MSS (Maximum Segment Size)是 TCP 报文段中的数据字段的最大长度。数据字段加上 TCP 首部才等于整个的 TCP 报文段。
  • 其他选项:窗口扩大选项 ——3 字节,时间戳选项——10 字节。。。。。
  • 填充字段 —— 这是为了使整个首部长度是 4 字节的整数倍。

三次握手:

Python -- 网络模型 -- 传输层基础

  • TCP 连接的建立都是采用客户服务器方式。主动发起连接建立的应用进程叫做客户(client)被动等待连接建立的应用进程叫做服务器(server)
  • TCP 的连接建立,用三次握手建立 TCP 连接
  • A TCP B 发出连接请求报文段,其首部中的同步位 SYN=1,并选择序号seq=x,表明传送数据时的第一个数据字节的序号是x
  • B TCP 收到连接请求报文段后,如同意,则发回确认。B 在确认报文段中应使 SYN = 1,使 ACK = 1其确认号ack = x + 1,自己选择的序号 seq = y
  • A 收到此报文段后向 B 给出确认,其 ACK = 1确认号 ack = y + 1A TCP 通知上层应用进程,连接已经建立。  
  • B TCP 收到主机 A 的确认后,也通知其上层应用进程:TCP 连接已经建立。

TCP 的连接释放 :

  • 数据传输结束后,通信的双方都可释放连接。现在 A 的应用进程先向其 TCP 发出连接释放报文段,并停止再发送数据,主动关闭 TCP 连接。A 把连接释放报文段首部的 FIN = 1,其序号 seq = u,等待 B 的确认。
  • B 发出确认,确认号 ack = u + 1而这个报文段自己的序号 seq = vTCP 服务器进程通知高层应用进程。A B 这个方向的连接就释放了,TCP 连接处于半关闭状态。B 若发送数据,A 仍要接收。
  • B 已经没有要向 A 发送的数据,其应用进程就通知 TCP 释放连接。
  • A 收到连接释放报文段后,必须发出确认。 在确认报文段中 ACK = 1,确认号 ack = w + 1自己的序号 seq = u + 1
  • TCP 连接必须经过时间 2MSL 后才真正释放掉。一是为了保证 A 发送的最后一个 ACK 报文段能够到达 B二是防止 “已失效的连接请求报文段”出现在本连接中。A 在发送完最后一个 ACK 报文段后,再经过时间 2MSL,就可以使本连接持续的时间内所产生的所有报文段,都从网络中消失。这样就可以使下一个新的连接中不会出现这种旧的连接请求报文段。

Python -- 网络模型 -- 传输层基础