计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

记录网络基础协议的学习,参考1,CyC2018

UDP 和 TCP 的特点

  • 用户数据报协议 UDP(User Datagram Protocol)是无连接的(减少开销),尽最大可能交付没有拥塞控制面向报文(对于应用程序传下来的报文不合并也不拆分,只是添加 UDP 首部,适合一次性传输少量数据的网络应用),支持一对一、一对多、多对一和多对多的交互通信。(适合视频,画面等传输)
  • 传输控制协议 TCP(Transmission Control Protocol)是面向连接的提供可靠交付有流量控制拥塞控制提供全双工通信面向字节流(把应用层传下来的报文看成字节流,把字节流组织成大小不等的数据块),每一条 TCP 连接只能是点对点的(一对一)。TCP 连接的端点不是主机,不是主机的 IP 地址,不是应用进程,也不是传输层的协议端口。TCP 连接的端点叫做套接字(socket)
    • 套接字(Scoket = IP 地址 + 端口号)

UDP首部格式

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

首部字段只有 8 个字节,包括源端口、目的端口、长度、检验和。12 字节的伪首部是为了计算检验和临时添加的。


TCP首部格式

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

  • 序号(seq):在一个 TCP 连接中传送的字节流中的每一个字节都按顺序编号,本字段表示本报文段所发送数据的第一个字节的序号;例如序号为 301,表示第一个字节的编号为 301,如果携带的数据长度为 100 字节,那么下一个报文段的序号应为 401;
  • 确认号(ack):期望收到对方下一个报文段的第一个数据字节的序号。若确认号为 N,则证明到序号 N-1 为止的所有数据都已正
    确收到。例如:B 正确收到 A 发送来的一个报文段,序号为 501,携带的数据长度为 200 字节,因此 B 期望下一个报文段的序号为 701,B 发送给 A 的确认报文段中确认号就为 701;
  • 数据偏移(首部长度):指的是数据部分距离报文段起始处的偏移量,实际上指的是首部的长度。
  • 六个控制位
    • 紧急位 URG:URG=1 时, 标明此报文段中有紧急数据,是高优先级的数据,应尽快传送,不用在缓存里排队,配合紧
      急指针字段使用;
    • 确认位 ACK:当 ACK=1 时确认号字段有效,否则无效。TCP 规定,在连接建立后所有传送的报文段都必须把 ACK 置 1
    • 推送位 PSH:PSH=1 时,接收方尽快交付接收应用进程,不再等到缓存填满再向上交付;
    • 复位 RST:RST=1 时, 表明 TCP 连接中出现严重差错,必须释放连接,然后再重新建立传输链接;
    • 同步位 SYN:当 SYN=1,ACK=0 时表示这是一个连接请求报文。若对方同意建立连接,则响应报文中 SYN=1,ACK=1,这就是一个连接接收报文
    • 终止位 FIN:FIN=1 时,表示此报文段的发送方的数据已发送完毕,并要求释放连接
  • 窗口:指的是发送本报文段的一方的接收窗口,即现在允许对方发送的数据量;

TCP 三次握手

三个阶段:连接建立,数据传送,连接释放

TCP 连接的建立采用客户服务器方式,主动发起连接建立的应用进程叫做客户,而被动等待连接建立的应用进程叫服务器;

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

假设 A 位客户端,B 为服务器端

  1. 首先 B 处于 LISTEN(监听)状态,等待客户的连接请求;
  2. A 向 B 发送连接请求报文SYN=1,ACK=0,选择一个初始的序号 seq=x(随机)
  3. B 收到连接请求报文,如果同意建立连接,则向 A 发送连接接收报文SYN=1,ACK=1,确认号 ack=x+1,同时也选择一个初始的序号 seq=y(随机)
  4. A 收到 B 的连接确认报文后,还要向 B 发出确认,SYN=0,ACK=1,序号 seq=x+1,确认号 ack=y+1
  5. B 收到 A 的确认后,连接建立;

三次握手的原因

第三次握手是为了防止失效的连接请求到达服务器,让服务器错误打开连接

客户端发送的连接请求如果在网络中滞留,那么就会隔很长一段时间才能收到服务器端发回的连接确认。客户端等待一个超时重传时间之后,就会重新请求连接。但是这个滞留的连接请求最后还是会到达服务器,如果不进行三次握手,那么服务器就会打开两个连接。如果有第三次握手,客户端会忽略服务器之后发送的对滞留连接请求的连接确认,不进行第三次握手,因此就不会再次打开连接。


TCP 四次挥手

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

以下描述不讨论 ACK,因为 ACK 在连接建立之后都为 1;

  1. A 发送连接释放报文,终止位 FIN=1,序号 seq=u
  2. B 收到之后发出确认,此时 TCP 属于半关闭状态B 能向 A 发送数据但是 A 不能向 B 发送数据,此时会有,ACK=1,seq=v,ack=u+1;
  3. 当 B 不再需要连接时,发送连接释放报文,终止位 FIN=1,序号 seq=w,确认号 ack=u+1;
  4. A 收到后会发出确认,进入 TIME-WAIT 状态,等待 2 MSL(最大报文存活时间)后释放连接,此时会有,序号 seq=u+1,确认号 ack=w+1;
  5. B 收到 A 的确认后释放连接;

TCP 可靠传输

TCP 实现可靠传输机制有四种:

  1. 校验
  2. 序号
  3. 确认
  4. 重传

TCP 使用超时重传来实现可靠传输:如果一个已经发送的报文段在超时时间内没有收到确认,那么就重传这个报文段;

一个报文段从发送再到接收到确认所经过的时间称为往返时间 RTT,加权平均往返时间 RTTs 计算如下:
RTTs=(1a)(RTTs)+aRTT RTTs=(1-a)*(RTTs)+a*RTT
其中,0 ≤ a < 1,RTTs 随着 a 的增加更容易受到 RTT 的影响。

超时时间 RTO 应该略大于 RTTs,TCP 使用的超时时间计算如下:
RTO=RTTs+4RTTd RTO=RTTs+4*RTT_d

无差错和超时重传:

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

确认丢失和确认迟到:

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

使用上述的确认和重传机制,我们就可以在不可靠的传输网络上实现可靠的通信。

但是这种方式的话信道利用率太低,每下一次的发送数据包要等到一个确认后才能够发送一下个,因此,大多数时间全部用在了等待上面,如下图:

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

流水线传输:

因此,发送方可连续发送多个分组,不必每发完一个分组就停顿下来等待对方的确认。由于信道上一直有数据不间断地传送,这种传输方式可获得很高的信道利用率;

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

而在流水线传输时,使用的就是滑动窗口技术来实现的,如下图,可以看出,5 数据后面的数据在收到确认后已经全部从 TCP 缓存中删除,数据 9 之前的数据尚未发送,目前下图的状态是:9 数据正准备发送,5 数据正准备接收,一旦 5 数据确认后,窗口就会继续向前滑动,继续发送数据包,那么就实现了流水线式的传输数据

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)


TCP 流量控制

流量控制是为了控制发送方发送速率,保证接收方来得及接收

TCP 提供一种机制可以让「发送方」根据「接收方」的实际接收能力控制发送的数据量,这就是所谓的流量控制

接收方发送的确认报文中的窗口字段可以用来控制发送方窗口大小,从而影响发送方的发送速率将窗口字段设置为 0,则发送方不能发送数据


TCP 滑动窗口

窗口是缓存的一部分,用来暂时存放字节流。窗口大小就是指无需等待确认应答,而可以继续发送数据的最大值

发送方和接收方各有一个窗口,接收方通过 TCP 报文段中的窗口字段告诉发送方自己的窗口大小,发送方根据这个值和其它信息设置自己的窗口大小

发送窗口内的字节都允许被发送,接收窗口内的字节都允许被接收。如果发送窗口左部的字节已经发送并且收到了确认,那么就将发送窗口向右滑动一定距离,直到左部第一个字节不是已发送并且已确认的状态接收窗口的滑动类似,接收窗口左部字节已经发送确认并交付主机,就向右滑动接收窗口

接收窗口只会对窗口内最后一个按序到达的字节进行确认,例如接收窗口已经收到的字节为 {31, 34, 35},其中 {31} 按序到达,而 {34, 35} 就不是,因此只对字节 31 进行确认。发送方得到一个字节的确认之后,就知道这个字节之前的所有字节都已经被接收。

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)


TCP 拥塞控制

出现拥塞的条件:对资源需求的总和 > 可用资源

如果网络出现拥塞,分组将会丢失,此时发送方会继续重传,从而导致网络拥塞程度更高。因此当出现拥塞时,应当控制发送方的速率。这一点和流量控制很像,但是出发点不同。流量控制是为了让接收方能来得及接收,而拥塞控制是为了降低整个网络的拥塞程度

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

TCP 主要通过四个算法来进行拥塞控制:慢开始,拥塞避免,拥塞发生,快恢复

假定:

  1. 数据单方向传送,而另一个方向只传送确认;

  2. 接收方总是有足够大的缓存空间,因而发送窗口大小取决于拥塞程度

    发送窗口 = Min{接收窗口rwnd,拥塞窗口cwnd}

接收窗口:接收方根据接受缓存设置的值,并告知给发送方,反映接收方容量

拥塞窗口发送方根据自己估算的网络拥塞程度而设置的窗口值反映网络当前容量

发送方需要维护一个叫做**拥塞窗口(cwnd)**的状态变量,注意拥塞窗口与发送方窗口的区别:拥塞窗口只是一个状态变量,实际决定发送方能发送多少数据的是发送方窗口


慢开始和拥塞避免

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

发送的最初执行慢开始,令 cwnd = 1,发送方只能发送 1 个报文段;当收到确认后,将 cwnd 加倍,因此之后发送方能够发送的报文段数量为:2,4,8 …,呈指数增长

注意到慢开始每个轮次都将 cwnd 加倍,这样会让 cwnd 增长速度非常快,从而使得发送方发送的速度增长速度过快,网络拥塞的可能性也就更高。设置一个慢启动门限 ssthresh=16当 cwnd >= ssthresh 时,进入拥塞避免每个轮次只将的 cwnd 呈线性增长


快重传和快恢复

当网络出现拥塞,也就是会发生数据包重传,重传机制主要有两种:

  • 超时重传

    如果出现了超时,则令 ssthresh = cwnd / 2,然后重新执行慢开始(拥塞窗口恢复到初始值 1)

  • 快速重传

    cwnd = cwnd/2,也就是设置为原来的一半,ssthresh = cwnd,然后进入快速恢复算法

下图为快速重传:

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)

在接收方,要求每次接收到报文段都应该对最后一个已收到的有序报文段进行确认。例如已经接收到 M1 和 M2,此时收到 M4,应当发送对 M2 的确认。

在发送方,如果收到三个重复确认,那么可以知道下一个报文段丢失,此时执行快重传,立即重传下一个报文段。例如收到三个 M2,则 M3 丢失,立即重传 M3


当出现快速重传时,只是丢失个别报文段,而不是网络拥塞。因此执行快恢复,令 ssthresh = cwnd / 2 ,cwnd = ssthresh,注意到此时直接进入拥塞避免

慢开始和快恢复的快慢指的是 cwnd 的设定值,而不是 cwnd 的增长速率。慢开始 cwnd 设定为 1,而快恢复 cwnd 设定为 ssthresh

接着,拥塞窗口 cwnd = ssthresh + 33 的意思是确认有 3 个数据包被收到了),如果收到新数据的 ACK(确认位) 后,设置 cwnd 为 ssthresh,接着就进入了拥塞避免算法

计算机网络-传输层(TCP和UDP,三次握手,拥塞控制)