pandas在Ipython Notebook工具下的数据的导入导出


读取的文件为.csv格式,通过文件的路径读取。

自动分配索引

pandas在Ipython Notebook工具下的数据的导入导出

人工分配索引

pandas在Ipython Notebook工具下的数据的导入导出
pandas在Ipython Notebook工具下的数据的导入导出

设置多级行索引

pandas在Ipython Notebook工具下的数据的导入导出

处理不规则分隔符

pandas在Ipython Notebook工具下的数据的导入导出
pandas在Ipython Notebook工具下的数据的导入导出

处理缺失值

指定缺失值
pandas在Ipython Notebook工具下的数据的导入导出
针对不同的列指定缺失值
pandas在Ipython Notebook工具下的数据的导入导出

大数据的模块化处理

分模块计数(每次读一千行),for循环实现
pandas在Ipython Notebook工具下的数据的导入导出
提取前十个
pandas在Ipython Notebook工具下的数据的导入导出

数据保存到磁盘中

pandas在Ipython Notebook工具下的数据的导入导出
指定写入几列数据,并指定分隔符
pandas在Ipython Notebook工具下的数据的导入导出
二进制数据的读取和保存
二进制数据优点:容量小,读取速度快,缺点:不同版本间不兼容,比如Pandas版本升级后,早期版本保存的二进制数据可能无法正常取出。