Python爬虫(二)

Python爬虫(二)

1.http协议

  • 概念:是服务器和客户端进行数据交互的一种形式。

2.常用请求头信息

  • User-Agent:请求载体的身份标识

3.获取User-Agent

  • 打开浏览器
  • 右击检查
  • 点击network

Python爬虫(二)

  • 点击刷新页面

Python爬虫(二)

  • 点击一个文件进入

Python爬虫(二)

4.Connection

  • 请求完毕后,是断开连接还是保持连接。

Python爬虫(二)

5.常用响应头信息

  • Content-Type:服务器响应会客户端的数据类型

Python爬虫(二)

6.https协议

  • 安全的http(超文本传输)协议:对传输的数据进行加密。

7.加密方式

  • 对称**加密

以一个具体例子来说明有助于真正理解对称加密这概念。假设A需要把一份明文为M的资料发给B,但是因为怕资料在传输的中途被窃听或者篡改,A用了对称加密法将M经过一个加密函数f处理后生成M’加密,而B接受到加密文后通过事先商定好的f 再次处理M’便可以还原成明文M,从而达到安全传输信息的目的。

  • 非对称**加密

与对称**加密相比,优点在于无需共享的通用**,解密的私钥不发往任何用户。即使公钥在网上被截获,如果没有与其匹配的私钥,也无法解密,所截获的公钥是没有任何用处的。

它可以很好地适应开放性的使用环境。因为**管理相对简单,可方便地实现数字签名和验证,对解决电子商务活动中的“瓶颈”,如对传输数据进行加密、数字签名、公证的方法等,很有实用价值。

  • 证书**加密

证书也叫CA(Certification Authority)证书;**就是用来加解密用的文件或者字符串;rsa即非对称加密算法。