## python计算生态概览

python计算生态概览

从数据处理到人工智能
数据表示->数据清洗-> 数据统->数据可视化->数据挖掘->人工智能
—数据表示:采用合适的方式用程序表达数据
—数据清洗:数据归一化、数据转换、异常值处理
—数据统计:数据的概要理解,数量、分布、中位数等
—数据可视化:直观展示数据的内涵的方式
—数据挖掘:从数据分析获取知识,产生数据外的价值
—人工智能:数据/语言/图像/视觉等方面深度分析与决策
python库之数据分析

python数据分析最基本的库是Numpy。
Numpy用于表达N维数组,它是众多数据分析库的基础,
—用C语言实现,python接口使用,计算速度优异
—几乎支撑力python数据分析与科学计算的所有其他库,比如最常用的pandas库等
—本身Numpy就提供了直接的矩阵运算、广播函数、线性代数等功能。
## python计算生态概览numpy可以将N维数组看作简单的数据对象,进行直接的操作和运算,这是numpy的最大价值。

Pandas:Python数据分析高层次应用库
—提供了简单易用的数据结构和数据分析工具
—理解数据类型与索引关系,操作索引及操作数据
—python最主要的数据分析功能库,基于Numpy开发
pandas库核心提供了两个数据结构
1、series=索引+一维数据
通过索引与一维数据关联,进而通过索引来操作数据
2、DataFrame=行列索引+二维数据

Scipy:数学、科学和工程计算功能库
—提供了一批数学算法及工程数据运算功能
—类似Matlab,可用于如傅立叶变换、信号处理等应用
—python最主要的科学计算功能库,基于Numpy开发,计算性能非常优异,在SciPy中提供了很多的优化算法
## python计算生态概览pyhton库之数据可视化

Matplolib:高质量的二维数据可视化功能库
—提供了超过100种数据可视化展示效果
—通过matlop.pylot子库调用可视化效果
— python最主要的数据可视化功能库,基于Numpy开发

Seaborn:统计类数据可视化功能库
—提供了一批高层次的统计类数据可视化展示效果
—主要展示数据空间分布、分类和线性关系等内容
—基于Matplotlib开发,支持Numpy和pandas

Mayavi:三维科学数据可视化功能库
—提供了一批简单易用的3D科学计算数据可视化效果
—目前版本是Mayavi2,三维可视化最主要的第三方库
—支持Numpy、TVTk、Trait、Envisage等第三方库