TCP/IP协议学习(二)-IP与UDP


本文主要摘抄自书籍《TCP/IP详解卷一:协议》与TCP协议相关内容的学习笔记。

链路层

在TCP/IP协议族中,链路层主要有三个目的:

(1)为IP模块发送和接收IP数据报;

(2)为ARP模块发送ARP请求和接收ARP应答;

(3)为RARP发送RARP请求和接收RARP应答。

TCP/IP支持多种不同的链路层协议,这取决于网络所使用的硬件,如以太网、令牌环网、FDDI(光纤分布式数据接口)及RS-232串行线路等。

最大传输单元MTU

正如在图2-00(几种常见的最大传输单元(MTU))看到的那样,以太网和802.3对数据帧的长度都有一个限制,其最大值分别是1500和1492字节

链路层的这个特性称作MTU,最大传输单元。不同类型的网络大多数都有一个上限。

TCP/IP协议学习(二)-IP与UDP

如果IP层有一个数据报要传,而且数据的长度比链路层的MTU还大,那么IP层就需要进行分片(fragmentation),把数据报分成若干片,这样每一片都小于MTU。在IP分片章节中讨论IP分片的过程。

点到点的链路层(如SLIP和PPP)的MTU并非指的是网络媒体的物理特性。相反,它是一个逻辑限制,目的是为交互使用提供足够快的响应时间。

路径MTU

当在同一个网络上的两台主机互相进行通信时,该网络的MTU是非常重要的。但是如果两台主机之间的通信要通过多个网络,那么每个网络的链路层就可能有不同的MTU。

重要的不是两台主机所在网络的MTU的值,重要的是两台通信主机路径中的最小MTU,它被称作路径MTU

两台主机之间的路径MTU不一定是个常数。它取决于当时所选择的路由。而选路不一定是对称的(从A到B的路由可能与从B到A的路由不同),因此路径MTU在两个方向上不一定是一致的

IP(网际协议)

IP是TCP/IP协议族中最为核心的协议。所有的TCP、UDP、ICMP及IGMP数据都以IP数据报格式传输。IP提供不可靠、无连接的数据报传送服务

不可靠(unreliable)的意思是它不能保证IP数据报能成功地到达目的地。IP仅提供最好的传输服务。

如果发生某种错误时,如某个路由器暂时用完了缓冲区,IP有一个简单的错误处理算法:丢弃该数据报,然后发送ICMP消息报给信源端。任何要求的可靠性必须由上层来提供(如TCP)。

无连接(connectionless)这个术语的意思是IP并不维护任何关于后续数据报的状态信息。每个数据报的处理是相互独立的。这也说明,IP数据报可以不按发送顺序接收

如果一信源向相同的信宿发送两个连续的数据报(先是A,然后是B),每个数据报都是独立地进行路由选择,可能选择不同的路线,因此B可能在A到达之前先到达。

IP首部

IP数据报的格式如图2-1(IP数据报格式及首部中的各字段)所示。普通的IP首部长为20个字节,除非含有选项字段。

TCP/IP协议学习(二)-IP与UDP

分析图2-1中的首部。最高位在左边,记为0bit;最低位在右边,记为31bit。

4个字节的32bit值以下面的次序传输:首先是07bit,其次815bit,然后1623bit,最后是2431bit。这种传输次序称作bigendian字节序。

由于TCP/IP首部中所有的二进制整数在网络中传输时都要求以这种次序,因此它又称作网络字节序。以其他形式存储二进制整数的机器,如littleendian格式,则必须在传输数据之前把首部转换成网络字节序。

目前的协议版本号是4,因此IP有时也称作IPv4。

* 首部长度指的是首部占32bit字的数目,包括任何选项。由于它是一个4比特字段,因此首部最长为60个字节。普通IP数据报(没有任何选择项)字段的值是5。

* 服务类型(TOS)字段包括一个3bit的优先权子字段(现在已被忽略)、4bit的TOS子字段和1bit未使用位(必须置为0)。4bit的TOS分别代表:最小时延、最大吞吐量、最高可靠性和最小费用。4bit中只能置其中1bit。如果所有4bit均为0,那么就意味着是一般服务。

图2-2(服务类型字段推荐值)列出了对不同应用建议的TOS值。在最后一列中给出的是十六进制值。

TCP/IP协议学习(二)-IP与UDP

Telnet和Rlogin这两个交互应用要求最小的传输时延,因为人们主要用它们来传输少量的交互数据。另一方面,FTP文件传输则要求有最大的吞吐量。最高可靠性被指明给网络管理(SNMP)和路由选择协议。用户网络新闻(Usenetnews,NNTP)是唯一要求最小费用的应用。

现在大多数的TCP/IP实现都不支持TOS特性,但是自4.3BSDReno以后的新版系统都对它进行了设置。另外,新的路由协议如OSPF和IS-IS都能根据这些字段的值进行路由决策。

* 总长度字段是指整个IP数据报的长度,以字节为单位。利用首部长度字段和总长度字段,就可以知道IP数据报中数据内容的起始位置和长度。由于该字段长16比特,所以IP数据报最长可达65535字节。当数据报被分片时,该字段的值也随着变化。

尽管可以传送一个长达65535字节的IP数据报,但是大多数的链路层都会对它进行分片。而且,主机也要求不能接收超过576字节的数据报。由于TCP把用户数据分成若干片,因此一般来说这个限制不会影响TCP。

大量使用UDP的应用(RIP,TFTP,BOOTP,DNS,以及SNMP),它们都限制用户数据报长度为512字节,小于576字节。但是,事实上现在大多数的实现(特别是那些支持网络文件系统NFS的实现)允许超过8192字节的IP数据报。

总长度字段是IP首部中必要的内容,因为一些数据链路(如以太网)需要填充一些数据以达到最小长度。

尽管以太网的最小帧长为46字节,但是IP数据可能会更短。如果没有总长度字段,那么IP层就不知道46字节中有多少是IP数据报的内容。

* 标识字段唯一地标识主机发送的每一份数据报。通常每发送一份报文它的值就会加1。

IP分片章节介绍分片和重组时再详细讨论它。同样,在讨论分片时再来分析标志字段和片偏移字段。

* TTL(time-to-live)生存时间字段设置了数据报可以经过的最多路由器数。它指定了数据报的生存时间

TTL的初始值由源主机设置(通常为32或64),一旦经过一个处理它的路由器,它的值就减去1。当该字段的值为0时,数据报就被丢弃,并发送ICMP报文通知源主机。

* 首部检验和字段是根据IP首部计算的检验和码。它不对首部后面的数据进行计算

ICMP、IGMP、UDP和TCP在它们各自的首部中均含有同时覆盖首部和数据检验和码

  1. 为了计算一份数据报的IP检验和,首先把检验和字段置为0。然后,对首部中每个16bit进行二进制反码求和(整个首部看成是由一串16bit的字组成),结果保存在检验和字段中;

  2. 当收到一份IP数据报后,同样对首部中每个16bit进行二进制反码的求和;

  3. 由于接收方在计算过程中包含了发送方存在首部中的检验和,因此,如果首部在传输过程中没有发生任何差错,那么接收方计算的结果应该为全1。如果结果不是全1(即检验和错误),那么IP就丢弃收到的数据报。但是不生成差错报文,由上层去发现丢失的数据报并进行重传。

ICMP、IGMP、UDP和TCP都采用相同的检验和算法,尽管TCP和UDP除了本身的首部和数据外,在IP首部中还包含不同的字段。

在RFC1071[Braden,BormanandPatridge1988]中有关于如何计算Internet检验和的实现技术。

由于路由器经常只修改TTL字段(减1),因此当路由器转发一份报文时可以增加它的检验和,而不需要对IP整个首部进行重新计算。

* 每一份IP数据报都包含源IP地址和目的IP地址,它们都是32bit的值。

* 最后一个字段是任选项,是数据报中的一个可变长的可选信息。目前,这些任选项定义如下:

  • 安全和处理限制(用于军事领域,详细内容参见RFC1108[Kent1991])
  • 记录路径(让每个路由器都记下它的IP地址,见7.3节)
  • 时间戳(让每个路由器都记下它的IP地址和时间,见7.4节)
  • 宽松的源站选路(为数据报指定一系列必须经过的IP地址,见8.5节)
  • 严格的源站选路(与宽松的源站选路类似,但是要求只能经过指定的这些地址,不能经过其他的地址)。

这些选项很少被使用,并非所有的主机和路由器都支持这些选项。

选项字段一直都是以32bit作为界限,在必要的时候插入值为0的填充字节。这样就保证IP首部始终是32bit的整数倍(这是首部长度字段所要求的)。

其他

IP(网际协议)其他内容还包括IP路由选择、子网寻址、子网掩码等,不做详细说明,简单总结内容如下:

IP路由选择:如果目的主机在直接相连的网络上,那么就把数据报直接传给目的主机,否则传给默认路由器。

在进行路由选择决策时,主机和路由器都使用路由表。在表中有三种类型的路由特定主机型、特定网络型和默认路由型

路由表中的表目具有一定的优先级。在选择路由时,主机路由优先于网络路由,最后在没有其他可选路由存在时才选择默认路由。

IP路由选择是通过逐跳来实现的。数据报在各站的传输过程中目的IP地址始终不变,但是封装和目的链路层地址在每一站都可以改变。

大多数的主机和许多路由器对于非本地网络的数据报都使用默认的下一站路由器。

A类和B类地址一般都要进行子网划分。用于子网号的比特数通过子网掩码来指定。子网的划分缩小了Internet路由表的规模,因为许多网络经常可以通过单个表目就可以访问了。

UDP(用户数据报协议)

UDP是一个简单的面向数据报的传输层协议:进程的每个输出操作都正好产生一个UDP数据报,并组装成一份待发送的IP数据报。

这与面向流字符的协议不同,如TCP,应用程序产生的全体数据与真正发送的单个IP数据报可能没有什么联系。

UDP数据报封装成一份IP数据报的格式,如图2-3(UDP封装)所示。

TCP/IP协议学习(二)-IP与UDP

UDP不提供可靠性:它把应用程序传给IP层的数据发送出去,但是并不保证他们能到达目的地。

应用程序必须关心IP数据报的长度。如果它超过网络的MTU,那么就要对IP数据报进行分片。如果需要,源端到目的端之间的每个网络都要进行分片,并不只是发送端主机连接第一个网络才这样做。

UDP首部

UDP首部的各字段如图2-4所示。

TCP/IP协议学习(二)-IP与UDP

端口号表示发送进程和接收进程。由于IP层已经把IP数据报分配给TCP或UDP(根据IP首部中协议字段值),因此TCP端口号由TCP来查看,而UDP端口号由UDP来查看。TCP端口号与UDP端口号是相互独立的。

UDP长度字段指的是UDP首部和UDP数据的字节长度。该字段的最小值为8字节(发送一份0字节的UDP数据报是OK)。这个UDP长度是有冗余的。

IP数据报长度指的是数据报全长,因此UDP数据报长度是全长减去IP首部的长度(该值在首部长度字段中指定)。

UDP校验和

UDP检验和覆盖UDP首部和UDP数据。回想IP首部的检验和,它只覆盖IP的首部,并不覆盖IP数据报中的任何数据。

UDP和TCP在首部中都有覆盖它们首部和数据的检验和。UDP的检验和是可选的,而TCP的检验和是必需的

尽管UDP检验和的基本计算方法与IP首部检验和计算方法相类似(16bit字的二进制反码和),但是它们之间存在不同的地方。

首先,UDP数据报的长度可以为奇数字节,但是检验和算法是把若干个16bit字相加。解决方法是必要时在最后增加填充字节0,这只是为了检验和的计算(也就是说,可能增加的填充字节不被传送)。

其次,UDP数据报和TCP段都包含一个12字节长的伪首部,它是为了计算检验和而设置的。伪首部包含IP首部一些字段。其目的是让UDP两次检查数据是否已经正确到达目的地(例如,IP没有接受地址不是本主机的数据报,以及IP没有把应传给另一高层的数据报传给UDP)。UDP数据报中的伪首部格式如图2-5(UDP检验和计算过程中使用的各个字段)所示。

TCP/IP协议学习(二)-IP与UDP

在该图中,我们特地举了一个奇数长度的数据报例子,因而在计算检验和时需要加上填充字节。注意,UDP数据报的长度在检验和计算过程中出现两次。

如果检验和的计算结果为0,则存入的值为全1(65535),这在二进制反码计算中是等效的。如果传送的检验和为0,说明发送端没有计算检验和。

如果发送端没有计算检验和而接收端检测到检验和有差错,那么UDP数据报就要被悄悄地丢弃。不产生任何差错报文(当IP层检测到IP首部检验和有差错时也这样做)。

UDP检验和是一个端到端的检验和。它由发送端计算,然后由接收端验证。其目的是为了发现UDP首部和数据在发送端到接收端之间发生的任何改动。

IP分片

物理网络层一般要限制每次发送数据帧的最大长度,任何时候IP层接收到一份要发送的IP数据报时,它要判断向本地哪个接口发送数据(选路),并查询该接口获得其MTU。IP把MTU与数据报长度进行比较,如果需要则进行分片。

分片可以发生在原始发送端主机上,也可以发生在中间路由器上。

把一份IP数据报分片以后,只有到达目的地才进行重新组装(这里的重新组装与其他网络协议不同,它们要求在下一站就进行进行重新组装,而不是在最终的目的地)。重新组装由目的端的IP层来完成,其目的是使分片和重新组装过程对运输层(TCP和UDP)是透明的,除了某些可能的越级操作外。

已经分片过的数据报有可能会再次进行分片(可能不止一次)。IP首部中包含的数据为分片和重新组装提供了足够的信息。

IP分片过程

回忆IP首部,下面这些字段用于分片过程:

对于发送端发送的每份IP数据报来说,其标识字段都包含一个唯一值。该值在数据报分片时被复制到每个片中(我们现在已经看到这个字段的用途)。

标志字段用其中一个比特来表示“更多的片”。除了最后一片外,其他每个组成数据报的片都要把该比特置1。

片偏移字段指的是该片偏移原始数据报开始处的位置。

另外,当数据报被分片后,每个片的总长度值要改为该片的长度值。

最后,标志字段中有一个比特称作“不分片”位。如果将这一比特置1,IP将不对数据报进行分片。相反把数据报丢弃并发送一个ICMP差错报文(“需要进行分片但设置了不分片比特”)给起始端。

当IP数据报被分片后,每一片都成为一个分组,具有自己的IP首部,并在选择路由时与其他分组独立。这样,当数据报的这些片到达目的端时有可能会失序,但是在IP首部中有足够的信息让接收端能正确组装这些数据报片。

尽管IP分片过程看起来是透明的,但有一点让人不想使用它:即使只丢失一片数据也要重传整个数据报

为什么会发生这种情况呢?因为IP层本身没有超时重传的机制----由更高层来负责超时和重传(TCP有超时和重传机制,但UDP没有。一些UDP应用程序本身也执行超时和重传)。当来自TCP报文段的某一片丢失后,TCP在超时后会重发整个TCP报文段,该报文段对应于一份IP数据报。没有办法只重传数据报中的一个数据报片。

事实上,如果对数据报分片的是中间路由器,而不是起始端系统,那么起始端系统就无法知道数据报是如何被分片的。就这个原因,经常要避免分片。

几个术语:IP数据报是指IP层端到端的传输单元(在分片之前和重新组装之后),分组是指在IP层和链路层之间传送的数据单元。一个分组可以是一个完整的IP数据报,也可以是IP数据报的一个分片。

TCP/IP协议学习(二)-IP与UDP

最大UDP数据报长度

理论上,IP数据报的最大长度是65535字节,这是由IP首部16比特总长度字段所限制的。去除20字节的IP首部和8个字节的UDP首部,UDP数据报中用户数据的最长长度为65507字节。但是,大多数实现所提供的长度比这个最大值小。

我们将遇到两个限制因素:

第一,应用程序可能会受到其程序接口的限制。socketAPI提供了一个可供应用程序调用的函数,以设置接收和发送缓存的长度。对于UDPsocket,这个长度与应用程序可以读写的最大UDP数据报的长度直接相关。现在的大部分系统都默认提供了可读写大于8192字节的UDP数据报(使用这个默认值是因为8192是NFS读写用户数据数的默认值)。

第二个限制来自于TCP/IP的内核实现。可能存在一些实现特性(或差错),使IP数据报长度小于65535字节。

ICMP源站抑制差错

我们同样也可以使用UDP产生ICMP“源站抑制(sourcequench)”差错。当一个系统(路由器或主机)接收数据报的速度比其处理速度快时,可能产生这个差错。注意限定词“可能”。即使一个系统已经没有缓存并丢弃数据报,也不要求它一定要发送源站抑制报文。

路由器不应该产生源站抑制差错报文,由于源站抑制要消耗网络带宽,且对于拥塞来说是一种无效而不公平的调整,因此现在人们对于源站抑制差错的态度是不支持的。

还需要指出的是,程序要么没有接收到源站抑制差错报文,要么接收到却将它们忽略了。结果是如果采用UDP协议,那么通常忽略其接收到的源站抑制报文。其部分原因在于,在接收到源站抑制差错报文时,导致源站抑制的进程可能已经中止了。

实际上,很可能程序只运行了大约0.5秒时间,但在发送第一份数据报过后0.7秒才接收到一些源站抑制,而此时该进程已经中止。其原因是我们的程序写入了100个数据报然后中止了。但是所有的100个数据报都已发送出去—有一些数据报在输出队列中。

这重申了UDP是一个非可靠的协议,它说明了端到端的流量控制。尽管程序成功地将100个数据报写入其网络,但只有26个数据报真正发送到了目的端。其他74个数据报可能被中间路由器丢弃。除非在应用程序中建立一些应答机制,否则发送端并不知道接收端是否收到了这些数据。

总结

  • MTU是什么。

MTU是最大传输单元,其是数据帧长度的一个限制,不同类型的网络大多数都有一个上限,最大值分别是1500和1492字节。

  • IP首部有多长,包含哪些字段。

IP首部一般20字节,除非增加了选项字段内容。

IP首部包含版本字段、首部长度、服务类型(TOS)、总长度字段、标识字段、标志字段、片偏移字段、生存时间(TTL)、协议字段、首部校验和、源IP地址、目的IP地址、选项字段(可选)。

每一份IP数据报都包含源IP地址和目的IP地址,它们都是32bit的值。

  • UDP是什么。

UDP(用户数据报协议)是一个简单的面向数据报的传输层协议,不提供可靠性。

  • UDP首部包含哪些字段。

源端口号、目的端口号、UDP长度、UDP校验和。

  • 为什么UDP不可靠。

物理网络层一般要限制每次发送数据帧的最大长度,如果需要则进行分片。数据报发送过程中即使只丢失一片数据也要重传整个数据报。UDP协议,通常忽略其接收到的源站抑制报文,因为很可能在收到源站抑制报文时UDP程序已经终止了,所以不可靠。

简单地说,UDP协议并未对返回状态进行捕捉、发送的UDP数据报很可能在发送过程中由于路由器等设备造成分片、网络波动、处理压力等原因导致部分分片丢失,而目的端收到不完整数据,进行反馈后UDP发送程序并未处理或已结束进程,从而导致其不可靠。

小结

本次梳理了IP协议和UDP协议内容,以及部分MTU相关知识。整体来看UDP是一个相对简单的协议,虽然其不可靠,但在某些应用场景有其特定用处。

IP协议及首部信息等各方面内容贯穿整个网络知识,TCP、UDP、ICMP及IGMP数据都以IP数据报格式传输,了解IP协议是必经之路,从而学习UDP、TCP等协议内容。