python从入门到精通------ 编码的进阶---------
1.常见的密码本
如图所示
在其中的unicode的内容最多,且包含了全世界所有的文字,但同时unicode对于内存的消耗也是最大的,但是在计算机的数据中的代码全是由unicode的进行储存的,然后在将代码储存到计算机的硬盘中的时候必须是以非unicode的方式储存的,如(utf-8)
用图像所表示则是:
比如我们在传输 和储存str的时候,会先将str转化为bytes的数据类型后在进行传输和储存
如图所示:
str与byest的转化方法:(unicode转化为utf-8)
在转化的过程中你用什么数据类型转化过去,那么在转化回去的过程中你就怎么转化回来
不然的话就会报错
gbk与utf-8的转化
从上图中我们可以看到gbk和utf-8在转化的过程中都会经过unicode转化
那么gbk与utf-8的转化也就是从utf-8(gbk)转化为unicode的过程后,再转化
为utf-8(gbk)的过程
如图所示: