应用层

概念

    每个应用层协议都是为了解决某一类应用问题,而问题的解决又往往是通过位于不同主机中的多个应用进程之间的通信和协同工作来完成的。应用层的具体内容就是规定应用进程在通信时所遵循的协议。应用层的许多协议都是基于客户服务器方式。客户(client)和服务器(server)都是指通信中所涉及的两个应用进程。客户服务器方式所描述的是进程之间服务和被服务的关系。客户是服务请求方,服务器是服务提供方。  


一 域名系统 DNS

1.  域名系统概述

    许多应用层软件经常直接使用域名系统 DNS (Domain Name System),但计算机的用户只是间接而不是直接使用域名系统。 
    互联网采用层次结构的命名树作为主机的名字,并使用分布式的域名系统 DNS。
    名字到 IP 地址的解析是由若干个域名服务器程序完成的。域名服务器程序在专设的结点上运行,运行该程序的机器称为域名服务器。  

2.  互联网的域名结构

  互联网采用了层次树状结构的命名方法。任何一个连接在互联网上的主机或路由器,都有一个唯一的层次结构的名字,即域名。

  域名的结构由标号序列组成,各标号之间用点隔开   … . 三级域名 . 二级域名 . *域名

应用层

  *域名 TLD(Top Level Domain)
  (1) 国家*域名 nTLD:
  .cn 表示中国,
  .us 表示美国,
  .uk 表示英国
  (2) 通用*域名 gTLD:
  .com(公司和企业)
  .net (网络服务机构
  .org (非赢利性组织)
  .edu(美国专用的教育机构)
  .gov(美国专用的*部门)
  .mil (美国专用的军事部门)
  .int (国际组织)
(3) 基础结构域名 (infrastructure domain)
  这种*域名只有一个,即 arpa,用于反向域名解析,因此又称为反向域名。 

3. 域名服务器

(1)概念

  1)一个服务器所负责管辖的范围叫做区。每一个区设置相应的权限域名服务器,用来保存该区中的所有主机的域名到 IP 地址的映射。DNS 服务器的管辖范围不是以“域”为单位,而是以“区”为单位。  

应用层

  2)DNS服务负责解析域名,将域名解析成IP。
(2)域名服务器的类型 
     1)根域名服务器 
  根域名服务器是最高层次的域名服务器。所有的根域名服务器都知道所有的*域名服务器的域名和 IP 地址。
  不管是哪一个本地域名服务器,若要对互联网上任何一个域名进行解析,只要自己无法解析,就首先求助于根域名服务器。
  在互联网上共有 13 个不同 IP 地址的根域名服务器,(根域名服务器共有 13 套装置,不是 13 个机器。)它们的名字是用一个英文字母命名,从 a 一直到 m(例:a.rootservers.net)。
  根域名服务器并不直接把域名直接转换成 IP 地址。在使用迭代查询时,根域名服务器把下一步应当找的*域名服务器的 IP 地址告诉本地域名服务器。
     2)*域名服务器 
  *域名服务器(即 TLD 服务器)负责管理在该*域名服务器注册的所有二级域名。
  当收到 DNS 查询请求时,就给出相应的回答(可能是最后的结果,也可能是下一步应当找的域名服务器的 IP 地址)。 
     3)权限域名服务器 
  负责一个区的域名服务器。
  当一个权限域名服务器还不能给出最后的查询回答时,就会告诉发出查询请求的 DNS 客户,下一步应当找哪一个权限域名服务器。
     4)本地域名服务器 (默认域名服务器)
  当一个主机发出 DNS 查询请求时,这个查询请求报文就发送给本地域名服务器。
  每一个互联网服务提供者 ISP,或一个大学,甚至一个大学里的系,都可以拥有一个本地域名服务器。

4.域名解析的过程

主机向本地域名服务器的查询一般都是采用递归查询。如果主机所询问的本地域名服务器不知道被查询域名的 IP 地址,那么本地域名服务器就以 DNS 客户的身份,向其他根域名服务器继续发出查询请求报文。
本地域名服务器向根域名服务器的查询通常是采用迭代查询。当根域名服务器收到本地域名服务器的迭代查询请求报文时,要么给出所要查询的 IP 地址,要么告诉本地域名服务器:“你下一步应当向哪一个域名服务器进行查询”。然后让本地域名服务器进行后续的查询。
*为保持高速缓存中的内容正确,域名服务器应为每项内容设置计时器。当权限域名服务器回答一个查询请求时,在响应中都指明绑定有效存在的时间值。增加此时间值可减少网络开销,而减少此时间值可提高域名转换的准确性。 
5.域名解析测试
 ping XXX
 nslookup XXX

二 文件传送协议 FTP (File Transfer Protocol) 

1. FTP 特点

 FTP 使用客户服务器方式,它使用 TCP 可靠的运输服务。一个 FTP 服务器进程可同时为多个客户进程提供服务。FTP 的服务器进程由两大部分组成:一个主进程,负责接受新的请求;另外有若干个从属进程,负责处理单个请求。

2. FTP 工作原理

(1)两个连接应用层
  TCP控制连接:控制连接在整个会话期间一直保持打开,FTP 客户发出的传送请求通过控制连接发送给服务器端的控制进程,但控制连接不用来传送文件。
  TCP数据连接:服务器端的控制进程在接收到 FTP 客户发送来的文件传输请求后就创建“数据传送进程”和“数据连接”,用来连接客户端和服务器端的数据传送进程。
(2)TCP数据连接建立的两种方式
1)主动模式
  当客户进程向服务器进程发出建立连接请求时,要寻找连接服务器进程的熟知端口 (21),同时还要告诉服务器进程自己的另一个端口号码,用于建立数据传送连接。
  接着,服务器进程用自己传送数据的熟知端口 (20) 与客户进程所提供的端口号码建立数据传送连接。
2)被动模式
  FTP服务器打开一个新的端口,等待TCP客户端的连接。
3. 简单文件传送协议 TFTP (Trivial File Transfer Protocol)
(1)概念
  TFTP 是一个很小且易于实现的文件传送协议。  TFTP 只支持文件传输而不支持交互。
  TFTP 使用客户服务器方式和使用 UDP 数据报,因此 TFTP 需要有自己的差错改正措施。
  TFTP 没有一个庞大的命令集,没有列目录的功能,也不能对用户进行身份鉴别。 
(2)TFTP 工作步骤
开始工作时,TFTP 客户进程发送一个读请求 PDU 或写请求 PDU 给 TFTP 服务器进程,其熟知端口号码为  69。
TFTP 服务器进程要选择一个新的端口和 TFTP 客户进程进行通信。
若文件长度恰好为 512 字节的整数倍,则在文件传送完毕后,还必须在最后发送一个只含首部而无数据的数据 PDU。
若文件长度不是 512 字节的整数倍,则最后传送数据 PDU 的数据字段一定不满 512 字节,这正好可作为文件结束的标志。


三 远程终端协议 TELNET

1.概念

用户用 TELNET 就可在其所在地通过 TCP 连接注册(即登录)到远地的另一个主机上(使用主机名或 IP 地址)。
TELNET 能将用户的击键传到远地主机,同时也能将远地主机的输出通过 TCP 连接返回到用户屏幕。这种服务是透明的,因为用户感觉到好像键盘和显示器是直接连在远地主机上。 
TELNET 也使用客户服务器方式。

2.过程

应用层

现在由于 PC 的功能越来越强,用户已较少使用 TELNET 了。


四 万维网 WWW (World Wide Web) 

1. 万维网概述

(1)概念

    万维网是一个大规模的、联机式的信息储藏所。万维网用链接的方法能非常方便地从互联网上的一个站点访问另一个站点,从而主动地按需获取丰富的信息。

应用层   应用层

(2)超媒体与超文本
    万维网是分布式超媒体系统,它是超文本系统的扩充。
    一个超文本由多个信息源链接成。利用一个链接可使用户找到另一个文档。这些文档可以位于世界上任何一个接在互联网上的超文本系统中。超文本是万维网的基础。
    超媒体与超文本的区别是文档内容不同。超文本文档仅包含文本信息,而超媒体文档还包含其他表示方式的信息,如图形、图像、声音、动画,甚至活动视频图像。
(3)万维网的工作方式 
    万维网以客户服务器方式工作。
    浏览器就是在用户计算机上的万维网客户程序。万维网文档所驻留的计算机则运行服务器程序,因此这个计算机也称为万维网服务器。
    客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所要的万维网文档。
    在一个客户程序主窗口上显示出的万维网文档称为页面 (page)。
(4)万维网必须解决的问题 
    1)怎样标志分布在整个互联网上的万维网文档? 
     使用统一资源定位符 URL 来标志万维网上的各种文档。使每一个文档在整个互联网的范围内具有唯一的标识符 URL。 
    2)用何协议实现万维网上各种超链的链接? 
     在万维网客户程序与万维网服务器程序之间进行交互所使用的协议,是超文本传送协议 HTTP。
     HTTP 是一个应用层协议,它使用 TCP 连接进行可靠的传送。 
    3)怎样使各种万维网文档都能在互联网上的各种计算机上显示出来,同时使用户清楚地知道在什么地方存在着超链? 
     超文本标记语言 HTML (HyperText Markup Language) 使得万维网页面的设计者可以很方便地用一个超链从本页面的某  处链接到互联网上的任何一个万维网页面,并且能够在自己的计算机屏幕上将这些页面显示出来。 
    4)怎样使用户能够很方便地找到所需的信息? 
     为了在万维网上方便地查找信息,用户可使用各种的搜索工具(即搜索引擎)。 

2,统一资源定位符 URL (Uniform Resource Locator)

(1)URL的概念
URL 是对可以从互联网上得到的资源的位置和访问方法的一种简洁表示。

URL 给资源的位置提供一种抽象的识别方法,并用这种方法给资源定位。

应用层

(2)URL的格式
应用层
://规定的格式
<主机> 是存放资源的主机在互联网中的域名
<端口>/<路径>有时可省略

**现在有些浏览器为了方便用户,在输入URL时,可以把最前面的“http://”甚至把主机名最前面的“www”省略,然后浏览器替用户把省略的字符添上。

3. 超文本传送协议 HTTP (HyperText Transfer Protocol)

(1)概念
为了使超文本的链接能够高效率地完成,需要用 HTTP 协议来传送一切必须的信息。
HTTP 是面向事务的应用层协议,它是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。 
(2)特点
HTTP 是面向事务的客户服务器协议。
HTTP 1.0 协议是无状态的 (stateless)。
HTTP 协议本身也是无连接的,虽然它使用了面向连接的 TCP 向上提供的服务。
*代理服务器 (proxy server) 又称为万维网高速缓存 (Web cache),它代表浏览器发出 HTTP 请求。
(3)HTTP 的报文结构 
请求报文——从客户向服务器发送请求报文。
响应报文——从服务器到客户的回答。
报文由三个部分组成,即开始行、首部行和实体主体。

1)请求报文

应用层

在请求报文中,开始行就是请求行。
“方法”就是对所请求的对象进行的操作,因此这些方法实际上也就是一些命令。因此,请求报文的类型是由它所采用的方法决定的。 
“URL”是所请求的资源的 URL。

“版本”是 HTTP 的版本。

应用层

2)响应报文

应用层

响应报文的开始行是状态行。
状态行包括三项内容,即 HTTP 的版本,状态码,以及解释状态码的简单短语。 
1xx 表示通知信息的,如请求收到了或正在进行处理。
2xx 表示成功,如接受或知道了。
3xx 表示重定向,表示要完成请求还必须采取进一步的行动。
4xx 表示客户的差错,如请求中有错误的语法或不能完成。
5xx 表示服务器的差错,如服务器失效无法完成请求。
3)在服务器上存放用户的信息
万维网站点使用 Cookie 来跟踪用户。
Cookie 表示在 HTTP 服务器和客户之间传递的状态信息。
使用 Cookie 的网站服务器为用户产生一个唯一的识别码。利用此识别码,网站就能够跟踪该用户在该网站的活动。  

4. 万维网的文档

(1)超文本标记语言 HTML
仅当 HTML 文档是以 .html 或 .htm 为后缀时,浏览器才对此文档的各种标签进行解释。
当浏览器从服务器读取 HTML 文档后,就按照 HTML 文档中的各种标签,根据浏览器所使用的显示器的尺寸和分辨率大小,重新进行排版并恢复出所读取的页面。
(2)两种不同的链接
HTML还规定了链接的设置方法。每个链接都有一个起点和终点。
远程链接:超链的终点是其他网点上的页面。
本地链接:超链指向本计算机中的某个文件。
(3)XML
XML (Extensible Markup Language)是可扩展标记语言,它和HTML很相似。
但XML的设计宗旨是传输数据,而不是显示数据(HTML是为了在浏览器上显示数据)。
XML 不是要替换 HTML,而是对 HTML 的补充。
(4)XHTML
XHTML (Extensible HTML) 是可扩展超文本标记语言,它与 HTML 4.01 几乎是相同的。
但 XHTML 是更严格的 HTML 版本,也是一个 W3C 标准(2000年1月),是作为一种 XML 应用被重新定义的 HTML,并将逐渐取代 HTML。
新的浏览器都支持 XHTML。
(5)动态万维网文档 
静态文档是指该文档创作完毕后就存放在万维网服务器中,在被用户浏览的过程中,内容不会改变。 
动态文档是指文档的内容是在浏览器访问万维网服务器时才由应用程序动态创建。
动态文档和静态文档之间的主要差别体现在服务器一端。这主要是文档内容的生成方法不同。而从浏览器的角度看,这两种文档并没有区别。  
(6)万维网服务器功能的扩充 
1)扩充
 应增加另一个应用程序,用来处理浏览器发来的数据,并创建动态文档。
 应增加一个机制,用来使万维网服务器把浏览器发来的数据传送给这个应用程序,然后万维网服务器能够解释这个应用程序的输出,并向浏览器返回 HTML 文档。
2)通用网关接口 CGI (Common Gateway Interface)
CGI 是一种标准,它定义了动态文档应如何创建,输入数据应如何提供给应用程序,以及输出结果应如何使用。CGI 程序的正式名字是 CGI 脚本 (script)。
“通用”:CGI 标准所定义的规则对其他任何语言都是通用的。
“网关”:CGI 程序的作用像网关。

“接口”:有一些已定义好的变量和调用等可供其他 CGI 程序使用。  

应用层

(7)活动万维网文档

活动文档 (active document) 技术把所有的工作都转移给浏览器端。每当浏览器请求一个活动文档时,服务器就返回一段程序副本在浏览器端运行。

应用层


5. 万维网的信息检索系统

在万维网中用来进行搜索的程序叫做搜索引擎。
(1)全文检索搜索引擎:它的工作原理是通过搜索软件到互联网上的各网站收集信息,找到一个网站后可以从这个网站再链接到另一个网站。然后按照一定的规则建立一个很大的在线数据库供用户查询。
(2)分类目录搜索:不采集网站的任何信息,而是利用各网站向搜索引擎提交的网站信息时填写的关键词和网站描述等信息,经过人工审核编辑后,如果认为符合网站登录的条件,则输入到分类目录的数据库中,供网上用户查询。

6. 博客和微博

(1)博客
博客是万维网日志 (web log) 的简称。在博客出现以前,网民是互联网上内容的消费者。但博客改变了这种情况,网民不仅是互联网上内容的消费者,而且还是互联网上内容的生产者 。  
(2)微博
微博就是微型博客 (micro blog)

7. 社交网络


五 电子邮件

1.电子邮件概述

1)电子邮件把邮件发送到收件人使用的邮件服务器,并放在其中的收件人邮箱中,收件人可随时上网到自己使用的邮件服务器进行读取。
2)发送邮件的协议:SMTP
    读取邮件的协议:POP3 和 IMAP
应用层
3)用户代理 UA 就是用户与电子邮件系统的接口,是电子邮件客户端软件。一个邮件服务器既可以作为客户,也可以作为服务器。
4)电子邮件地址的格式
TCP/IP 体系的电子邮件系统规定电子邮件地址的格式如下:
 收件人邮箱名@邮箱所在主机的域名     
 符号“@”读作“at”,表示“在”的意思。 

2.简单邮件传送协议 SMTP

1)SMTP 所规定的就是在两个相互通信的 SMTP 进程之间应如何交换信息。SMTP 规定了 14 条命令和 21 种应答信息
2)SMTP 通信的三个阶段 
   连接建立:连接是在发送主机的 SMTP 客户和接收主机的 SMTP 服务器之间建立的。SMTP不使用中间的邮件服务器。   
   邮件传送
   连接释放:邮件发送完毕后,SMTP 应释放 TCP 连接。 

3.电子邮件的信息格式

1)一个电子邮件分为信封和内容两大部分。
RFC 822 只规定了邮件内容中的首部 (header) 格式,而对邮件的主体 (body )部分则让用户*撰写。
2)首部
“To:” 后面填入一个或多个收件人的电子邮件地址。用户只需打开地址簿,点击收件人名字,收件人的电子邮件地址就会自动地填入到合适的位置上。
“Subject:” 是邮件的主题。它反映了邮件的主要内容,便于用户查找邮件。
“Cc:”  表示应给某某人发送一个邮件副本。
“From” 和 “Date” 表示发信人的电子邮件地址和发信日期。
“Reply-To” 是对方回信所用的地址。   

4.邮件读取协议 POP3 和 IMAP

IMAP 的缺点是如果用户没有将邮件复制到自己的 PC 上,则邮件一直是存放在 IMAP 服务器上。因此用户需要经常与 IMAP 服务器建立连接。  

5.基于万维网的电子邮件

6.通用互联网邮件扩充 MIME

(1)SMTP 有缺点——>MIME 增加了邮件主体的结构,并定义了传送非 ASCII 码的编码规则。  
(2)MIME 主要包括三个部分 
1)5 个新的邮件首部字段,这些字段提供了有关邮件主体的信息。
MIME-Version:标志 MIME 的版本。现在的版本号是 1.0。若无此行,则为英文文本。
Content-Description:这是可读字符串,说明此邮件是什么。和邮件的主题差不多。
Content-Id:邮件的唯一标识符。 
Content-Transfer-Encoding:在传送时邮件的主体是如何编码的。
Content-Type:说明邮件的性质。 
2)这些字段提供了有关邮件主体的信息。
MIME 着标准规定 Content-Type 说明必须含有两个标识符,即内容类型(type)和子类型(subtype),中间用“/”分开。 
3)定义了传送编码,可对任何内容格式进行转换,而不会被邮件系统改变。

六 动态主机配置协议 DHCP

概念

  互联网广泛使用的动态主机配置协议 DHCP (Dynamic Host Configuration Protocol) 提供了即插即用连网 (plug-and-play networking) 的机制。这种机制允许一台计算机加入新的网络和获取IP 地址而不用手工参与。

1.DHCP 客户服请求IP地址的过程

 需要 IP 地址的主机在启动时就向 DHCP 服务器广播发送发现报文(DHCPDISCOVER),这时该主机就成为 DHCP 客户。
 本地网络上所有主机都能收到此广播报文,但只有 DHCP 服务器才回答此广播报文。
 DHCP 服务器先在其数据库中查找该计算机的配置信息。若找到,则返回找到的信息。若找不到,则从服务器的 IP 地址池(address pool)中取一个地址分配给该计算机。DHCP 服务器的回答报文叫做提供报文(DHCPOFFER)。 

2.跨网段地址分配——>DHCP 中继代理(relay agent) 

并不是每个网络上都有 DHCP 服务器,这样会使 DHCP 服务器的数量太多。现在是每一个网络至少有一个 DHCP 中继代理,它配置了 DHCP 服务器的 IP 地址信息。
当 DHCP 中继代理收到主机发送的发现报文后,就以单播方式向 DHCP 服务器转发此报文,并等待其回答。收到 DHCP 服务器回答的提供报文后,DHCP 中继代理再将此提供报文发回给主机。

3.租用期 (lease period) 

DHCP 服务器分配给 DHCP 客户的 IP 地址的临时的。租用期的数值应由 DHCP 服务器自己决定。DHCP 客户也可在自己发送的报文中(例如,发现报文)提出对租用期的要求。  

七 简单网络管理协议 SNMP

1.网络管理的基本概念
2.管理信息结构 SMI
3.管理信息库 MIB
4.SNMP 的协议数据单元和报文


八 应用进程跨越网络的通信

1. 系统调用和应用编程接口

(1)大多数操作系统使用系统调用 (system call )的机制在应用程序和操作系统之间传递控制权。
应用层
(2)应用编程接口 API
当某个应用进程启动系统调用时,控制权就从应用进程传递给了系统调用接口。
此接口再将控制权传递给计算机的操作系统。操作系统将此调用转给某个内部过程,并执行所请求的操作。
内部过程一旦执行完毕,控制权就又通过系统调用接口返回给应用进程。
系统调用接口实际上就是应用进程的控制权和操作系统的控制权进行转换的一个接口,即应用编程接口  API (Application Programming Interface) 
(3)套接字的作用 
当应用进程需要使用网络进行通信时就发出系统调用,请求操作系统为其创建“套接字”,以便把网络通信所需要的系统资源分配给该应用进程。
操作系统为这些资源的总和用一个叫做套接字描述符的号码来表示,并把此号码返回给应用进程。应用进程所进行的网络操作都必须使用这个号码。

通信完毕后,应用进程通过一个关闭套接字的系统调用通知操作系统回收与该“号码”相关的所有资源。

应用层

2. 几种常用的系统调用

(1)连接建立阶段
当套接字被创建后,它的端口号和 IP 地址都是空的,因此应用进程要调用 bind(绑定)来指明套接字的本地地址。在服务器端调用 bind 时就是把熟知端口号和本地IP地址填写到已创建的套接字中。这就叫做把本地地址绑定到套接字。
服务器在调用 bind 后,还必须调用 listen(收听)把套接字设置为被动方式,以便随时接受客户的服务请求。UDP 服务器由于只提供无连接服务,不使用 listen 系统调用。
服务器紧接着就调用 accept(接受),以便把远地客户进程发来的连接请求提取出来。系统调用 accept 的一个变量就是要指明从哪一个套接字发起的连接。 
(2)客户和服务器都在 TCP 连接上使用 send 系统调用传送数据,使用 recv 系统调用接收数据。
通常客户使用 send 发送请求,而服务器使用 send 发送回答。
服务器使用 recv 接收客户用 send 调用发送的请求。客户在发完请求后用 recv 接收回答。
(3)一旦客户或服务器结束使用套接字,就把套接字撤消。这时就调用 close 释放连接和撤销套接字。
应用层

九 P2P 应用

1. 具有集中目录服务器的 P2P 工作方式
2. 具有全分布式结构的 P2P 文件共享程序
3. P2P 文件分发的分析
4. 在 P2P 对等方中搜索对象