python数据分析 第7天 数据的加载,存储,与文件格式

数据的加载,存储,与文件格式

1  读取文本格式的数据

python数据分析 第7天 数据的加载,存储,与文件格式

这些函数的选项可划分为一下几类:

python数据分析 第7天 数据的加载,存储,与文件格式

JSON数据

已经成为,发送数据的标准格式之一

通过json.loads 可将JSON字符串转换成PYTHON形式

json.dumps    将python对象转换为 JSON形式

JSON必须为字符串


 向DataFrame传入一组JSON对象



XML  HTML   WEB信息收集

lxml 是python库,可以处理HTML  XML格式的文件

先用lxml.html处理HTML   然后用lxml.objectify 做一些XML处理

P185-P190


利用lxml.objectify解析XML


二进制数据格式

pandas对象   有一个用于将数据以pickle形式保存到磁盘上的save方法



使用HDF5格式

是一个C库

需要处理海量数据,学习PyTables 和 h5py

读取Microsoft Excel 文件

pandas的ExcelFile类 支持读取存储在Excel 中的表格数据

需要先安装 xlrd   openpyxl包

使用HTML和WebAPI

使用requests包

使用数据库


存取MongoDB中的数据