Pandas实战 电子书

在如今的互联网时代,数据成为了一座巨大的金矿。近年来的人工智能的发展更是以大量的数据为作为基础,任何机器学习项目中的大量时间都花费在了准备数据、分析基本趋势和模式上。面对如此多的数据,掌握数据获取、处理和分析技术已经成为了各个行业的必备的基本技能。

数据处理是数据分析的核心部分,通过爬虫或者实际生产过程中初步获取的数据通常具有很多的“垃圾数据”,比如重复数据或者值缺失,不连续数据等等。这时就需要对数据首先进行筛选,补全等“清洗”操作。除此之外,“清洗”好的数据也需要根据不同用途进行转换,以适应分析,预测或者可视化的需求。Pandas是一个十分成熟的数据处理包,熟练掌握可以高效并且方便地从海量数据中提取关键信息。

教程主要从数据的爬虫、清洗分析和可视化三个方面来逐步展开,实例与代码相结合,同时提供相应的数据文件。

本书最大的特点是简单易上手,每一章节都有相应的jupyter文件,可以直接放在带有jupyter notebook的python环境中运行。电子书包含了五大章节,分别从数据分析入门,导入与导出,分组与聚合,索引汇总与缺失处理四个维度详细介绍了Pandas的使用技巧,并且提供了大量的实战案例,带你从入门开始,一步步教你从数据分析小白进阶为Pandas能手。

章节梗概:

● 第一章简述如何入门,手把手带你安装Pandas;

● 第二章介绍Pandas操作的对象,常见数据格式的导入与导出;

● 第三章开始对数据进行实操,根据不同的分析需求对数据进行整合,包括从简单到复杂的分组方法,满足数据的多种分组需求,再根据需要对数据进行的求和、转换等操作;

● 第四章应对大量复杂的数据,介绍更高级的数据处理技术,对实操中常见的缺失数据进行缺失处理;

● 第五章系统的对Pandas的各个主要功能进行汇总介绍。

建议阅读顺序:初学者建议从第一章开始,循序渐进。已经有过编程经验的,则可以根据任务需要,到对应章节学习和使用。电子书的结构清晰明了,层次循序渐进,章节之间耦合较弱,配套有对应代码,非常适合新手小白入门,或者作为数据分析人员的工具书。

实战code:

担心看完就忘?介绍能看懂,就是不会写代码?学了这么多,不知道能做什么?这本电子书统统帮你解决!在每个章节,都提供了大量的代码示例,让你读完介绍,就能立马跑起来,亲眼见证Pandas数据分析工具的强大!

同时,电子书也为读者提供了大量的分析实例。可以从实践中练习电子书中的内容!

 

实例:电影分析

电影这么多,不知道哪个电影质量高,不用去豆瓣看评分,自己就可以搞定!华语篇,全球篇都有,赶紧去下载试试,看看你喜爱的电影,你的爱豆能排第几?通过对数据进行爬虫和分析,你还可以看到些年来的产量质量趋势、影片类型分布,以及哪些导演或演员是好片或烂片专业户。学了Pandas,妈妈再也不用担心我的片库了。

Pandas实战 电子书

实例:篮球数据

电子书还提供了其他一些分析实例,NBA的投篮数据分析,运筹学工作的薪资水平分析。近些年火爆的数据挖掘工程师,算法工程师,人工智能工程师薪资到底多少?用Pandas进行海量数据分析,你可以看到最真实的不同职业人员的薪资水平分布。甚至还可以看到不同国家的职业收入差异以及职业分布。只要是你感兴趣的话题数据,都可以用Pandas进行整理分析,得到第一手的信息。     

Pandas实战 电子书

获取电子书