python笔记:IO编程-序列化

一、序列化和反序列化

序列化定义:我们把变量从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。

序列化作用:序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。

反序列化定义:把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。

二、序列化操作与反序列化操作

2.1序列化为byte

python笔记:IO编程-序列化

2.2序列化为byte并且存入dump.txt文件中

python笔记:IO编程-序列化

可以看到 文件夹中出现dump.txt文件,显示如下:

python笔记:IO编程-序列化

python笔记:IO编程-序列化

2.3读取dump.txt中的byte对其进行反序列化

python笔记:IO编程-序列化

注意此处:这个变量和原来的变量是完全不相干的对象,它们只是内容相同而已。

总结: 缺点:Pickle的问题和所有其他编程语言特有的序列化问题一样,就是它只能用于Python,并且可能不同版本的Python彼此都不兼容,因此,只能用Pickle保存那些不重要的数据,不能成功地反序列化也没关系。

三、json

    如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。

3.1将python对象变为json

实际就是将python对象变为字符串

python笔记:IO编程-序列化

3.2将python对象变为json,并写入dump1.txt

python笔记:IO编程-序列化

查看文件夹,显示如下

python笔记:IO编程-序列化

python笔记:IO编程-序列化

3.3JSON反序列化为Python对象

python笔记:IO编程-序列化

3.4将dump4.txt的JSON反序列化为Python对象,

python笔记:IO编程-序列化

四、json进阶

"三“中主要讲述的是Python的dict对象可以直接序列化为JSON的{},不过,很多时候,我们更喜欢用class表示对象,比如定义Student类,然后序列化,故”四“部分中将主要提到的是 类 序列化为JSON的方式

4.1类序列化为json

首先给出一个错误的举例为:

python笔记:IO编程-序列化

运行得到如下结果,显示该类型不是可以序列化为json的类型

python笔记:IO编程-序列化

解决方法:

步骤一:为Student专门写一个转换函数,再把函数传进去即可。这样的原理是:先将Student对象转化为dict,然后被序列化为json

步骤二:将json.dumps(s)改为json.dumps(s,deafult=student2dict),意思是将s首先被student2dict()函数转换成dict,然后再被顺利序列化为JSON:

修改完毕,显示如下:

python笔记:IO编程-序列化

运行,发现序列为json了,输出正确:

python笔记:IO编程-序列化

再引入一种更加简洁的解决方法如下:

无需用student2dict(std)函数将student对象转化为dict,直接将json.dumps(s,deafult=student2dict)修改为json.dumps(s, default=lambda obj: obj.__dict__)即可

原理:因为通常class的实例都有一个__dict__属性,它就是一个dict,用来存储实例变量。也有少数例外,比如定义了__slots__的class。

修改完毕代码显示为:

python笔记:IO编程-序列化

运行得到如下结果,显示同样正确

python笔记:IO编程-序列化

4.2JSON反序列化为一个类对象

同样的道理,如果我们要把JSON反序列化为一个Student对象实例,loads()方法首先转换出一个dict对象,然后,我们传入的object_hook函数负责把dict转换为Student实例:

代码如下:

python笔记:IO编程-序列化

运行如下,打印出的是反序列化的Student实例对象。

python笔记:IO编程-序列化

五、练习

python笔记:IO编程-序列化

可见,设置ensure_ascii=True可以将中文字符转化为byte

如果设置ensure_ascii=False,显示如下,dict的value依然是中文:

python笔记:IO编程-序列化