python数据分析 第7天 数据的加载,存储,与文件格式
数据的加载,存储,与文件格式
1 读取文本格式的数据
这些函数的选项可划分为一下几类:
JSON数据
已经成为,发送数据的标准格式之一
通过json.loads 可将JSON字符串转换成PYTHON形式
json.dumps 将python对象转换为 JSON形式
JSON必须为字符串
向DataFrame传入一组JSON对象
XML HTML WEB信息收集
lxml 是python库,可以处理HTML XML格式的文件
先用lxml.html处理HTML 然后用lxml.objectify 做一些XML处理
P185-P190
利用lxml.objectify解析XML
二进制数据格式
pandas对象 有一个用于将数据以pickle形式保存到磁盘上的save方法
使用HDF5格式
是一个C库
需要处理海量数据,学习PyTables 和 h5py
读取Microsoft Excel 文件
pandas的ExcelFile类 支持读取存储在Excel 中的表格数据
需要先安装 xlrd openpyxl包
使用HTML和WebAPI
使用requests包