Python网络编程(socket模块、缓冲区、http协议)

原文链接

摘要: Python网络编程

 

 

网络的概念:主机   端口  IP  协议

  •           服务器:
  •       localhost/127.0.0.1
  •   客户端:
  •       只是在本机启动客户端,用127.0.0.1访问

 

 

  •   服务器:
  •       0.0.0.0
  •   客户端:
  •       可以在本机用127.0.0.1、192.168.0.1

 

  •   服务器:
  •       192.168.0.1
  •   客户端:
  •       局域网内用192.168.0.1

 

 

socket(创建套接字) ---> bind(绑定地址) ---> listen(设置监听)---> accept(等待链接) ---> recv/send(收/发消息) ---> close ()

 

 

 

收发函数特性:

     recv特征:

  1. 如果建立的另一端链接被断开, 则recv立即返回空字符串
  2. recv接受缓冲区取出内容,当缓冲区为空则阻塞
  3. recv如果一次接受不完缓冲区的内容下次执行会自动接受

     send特征:

  1.         如果发送的另一端不存在则会产生Pipe Broken异常
  2. send发送缓冲区发送内容,缓冲为满则堵塞

 

网络的收发缓存区:

    在内存中开辟区域,用于发送和接受的缓冲

    作用:

  1.         协调数据的收发(接受和处理速度
  2.         减少磁盘的交互

sendall(date):

   功能:tcp套接字发送消息

   参数:同send

   返回值:如果发送成功返回None   否则返回异常

 

 

tcp粘包:

   产生原因:

        1.tcp传输以字节流的方式发送消息,消息之间没有边界

2.发送比接受的速度快

   影响:

        对每次发送的内容是一个独立的意识需要单独识别时 容易使用原文件被更改

   如何处理:

        1.每次发送后追加一个结尾标志,代表本次发送完毕

2.发送一个数据结构

3.每次发送有一个时间间隔

 

基于udp的服务端编程:

    1.创建套接字:

        sockfd = socket(AF_INET,SOCK_DGRAM)

    2.绑定地址:

        sockfd.bind()

    3.消息收发

        data, addr = sockfd.recvfrom(buffersize)

         功能:接受udp消息

 参数:接受消息的大小

 返回值:

     data 接受到的内容

     addr 消息发送的地址

        

recvfrom每次接受一个报文,如果没有接受到的内容则直接丢弃

        sockfd.sendto(data, addr)

  功能:udp消息发送

  参数:

      data 要发送的内容 bytes

      addr 目标地址

  返回:发送字节数

    4.关闭套接字:

        socket.close()

 

 

import sys

   sys.argv

   作用:

      获取从命令行获取的参数内容

      Python3 demo.py 参数1, 参数2.....

 

      sys.argv[0] 是命令本身(程序本身)

 

 

tcp流式套接字和udp数据报套接字区别:

  •     1.流式套接字采用字节流的方式进行传输,
  •        而数据报套接字使用数据报形式传输数据
  •     2.tcp套接字会产生粘包,udp不会
  •     3.tcp编程可以保证消息的完整性,udp则不一定
  •     4.tcp需要listen、accept、udp不用
  •     5.tcp消息的发送接收使用recv、send、sendall、
  •        udp使用recvfrom,sendto

 

 

 

socket模块套接字属性(s为套接字)

  •   s.type:表示套接字类型
  •   s.family地址类型

 

  套接字属性方法

    s.fileno()

    功能:

       获取套接字的文件描述符

  文件描述符:

     每一个IO事件 操作系统都会分配一个不同的的正整数,

     该正整数即为此IO操作的文件描述符

     默认开启的描述符:

  1.          sys.stdin      0
  2.          sys.stdout   1
  3.          sys.stderr    2

 

  s.getsockname()

     功能:

       获取套结字绑定的地址

  s.getpeername()

     功能:

       获取链接套接字客户端的地址

  s.setsockopt(level,optname, value)

       (# 设置端口可立即重用 必须在链接端口前设置

        s.setsockopt(SOL_SOcKET, SO_REUSEADDR))

     功能:设置套接字选项

     参数:

        level:设置选项的类型(大类型)  常用:SOL_SOCKET

optname:子类选项

value:要设置的值

 

  s.getsockoptlevel, optname)

     功能:获取套接字选项值

     参数:

        level:选项的类型

 

udp套接字应用--->  广播

    一点发送多点接收

    目标地址:广播地址 172.18.32.255

 

 

tcp应用---> http传输

 

http协议:

   超文本传输协议

   用途:

      网站中浏览器网页的获取,基于网站事物数据传输

      编写基于http协议的数据传输

   特点:

      1.应用层协议,传输层使用tcp服务

      2.简单、灵活,可以使用多种编程语言操作

      3.无状态的协议,既不用记录用户的输入内容

      4.http1.1  ---> http2.0(还没发布)  技术的成熟和稳定性

   http请求(request):

      请求格式:

         1.请求行:说明具体的请求类别和内容

          GET    /index.html    /HTTP/1.1

                请求类别   请求内容    协议版本

     请求类别:

    1. GET:              获取网络资源
    2. POST:           提交一定的附加数据
    3. HEAD:          获取响应头
    4. PUT:             更新服务器资源
    5. DELETE:        删除服务器资源
    6. CONNECT:   未使用
    7. TRACE:         用于测试
    8. OPTIONS:    获取服务器性能信息

 

 2.请求头:请求的具体描述

     Accept:text/html

        每一个键值对占一行,描述了一个特定信息

 3.空行

 4.请求体: 具体参数或提交的内容

    get参数或者post提交的内容

   http响应(response):

      响应格式:

         1.响应行:反馈具体的响应情况

          HTTP/1.1     20       OK

  版本协议   响应码   附加信息

    响应码:

  1.        1xx:提示信息,表示请求已接收
  2.        2xx:响应成功
  3.        3xx:响应需要定向(重新记载链接第三方链接)
  4.        4xx:客户端错误
  5.        5xx:服务器端错误

    常见响应码:

     200  成功

     404  请求内容不存在

     401  没有访问权限

     500  服务器未知错误

     503  服务器暂时无法执行

      2.响应头:对响应内容的具体描述

      3.空行

      4.响应体:

         将客户端请求内容进行返回

 

Python网络编程(socket模块、缓冲区、http协议)

 

Python网络编程(socket模块、缓冲区、http协议)

 

 

Python网络编程(socket模块、缓冲区、http协议)

 

这里这个图就看了一眼 没特意去记  凭印象画的  可能不对 但是大体逻辑应该没错 

我去百度搜了 什么也没搜到 不知道是不是我的打开方式不对还是什么

只搜到了上面的两张图..........

 

总结:

tcp,udp协议的区别和编程实现上的差异:

          tcp:

  •                tcp是一种可靠的、面向有链接数据传输服务
  •                tcp能够保证数据的完整性、顺序性、无重复以及无差错
  •                tcp是一种以文件流的形式传输数据的服务 文件流之间是没有边界
  •                的所以基友可能会产生粘包的情况 粘包是因为接受速度没有传输速度快
  •                导致缓存区的数据拥堵 下次取出数据时从而产生非独立数据的链接 这种情况
  •                叫做粘包  粘包只有传输多个数据时才会出现
  •                tcp的编程需要监听套接字 和 等待链接过程 只有链接成功才能发送数据
  •                这种情况叫做三次握手、还有断开时的四次挥手
  •                三次挥手:客户端请求链接、服务器返回报文、客户端完成链接
  •                四次挥手:客户端请求断开、服务器接受请求、服务器准备完毕可以断开、客户端断开
  •                tcp收发送消息需要使用recv、send、sendall方法
  •                sendall比特殊 功能和send一样 但sendall有事务  若发送成功返回None 否则触发异常
  •               链接时必须先运行服务器端后运行客户端

         udp:

  •              udp就比较简单了  是面向无连接的不可靠的数据传输服务
  •              udp没有数据流  接受大小取决于接收方
  •              若数据超出接收方接受范围则丢掉所有超出范围的内容
  •              udp不存在粘包的情况
  •              udp不需要等待链接 没有挥手过程 先发就发 想收就收 *度比较高
  •              udp编程时收发消息使用recvfrom、sendto方法
  •              udp可用于广播可以随时断开或链接
  •              客户端和服务器端可以随时运行

 

什么是http?

 

       http 是超文本传输协议

               一种网络数据传输的协议

              没错就是  协议

             并且所有的www文件都必须遵守这个标准

http作用是什么?

 

      可以用力来网站中浏览器网页获取,基于网站上的一些数据传输 例如目前我正在打的字......

      编写基于http协议的数据传输  

 

http协议 请求和响应的格式以及每一部分做什么

      请求部分:

               请求行:请求的具体类别和内容   比如说  类别、内容、版本协议

               请求头:请求具体描述

               空行:就是空行

               请求体:请求具体参数或内容

      响应部分:

               响应行:具体响应情况     比如说  版本协议 、响应码 、附加信息  

               响应头:响应具体描述

               空行

               响应体:响应具体参数或内容

http协议中请求的基本类型和作用:

        GET:获取网络资源

        POST:提交一定的附加数据

        HEAD:获取响应头 响应返回的文件信息

        PUT:更新服务器资源

        DELETE:删除服务器资源

        TRACE:用于测试

         OPIONS:获取服务器性能信息

        CONNECT:备用

http协议响应码的类型和表达含义:

          以1开头的表示请求已经链接

          以2开头的表示成功接收、提示

          以3开头的代表重新定向进一步处理 第三方

          以4开头的客户端错误

          以5开头的服务器错误

http协议请求网页的流程:

           建立连接、发送请求、响应请求、断开链接

           这样的一个过程称为一个事物