【Python】数据分析结课复习(随便复复)D1

前几天书到了,翻了几下,发现被坑了

【Python】数据分析结课复习(随便复复)D1【Python】数据分析结课复习(随便复复)D1

这两本书从目录来看几乎完全一样,真的是案例都是全部一样,无非就是把MATLAB换成了Python,真的没有诚意

说起来又非常想念徐圣兵老师,讲的数学模型课真的非常好,是我大学唯一有兴趣的课。

今天吃了感冒药特别困

不打字看,看了一二章

也就是差不多的内容。


第二章

Python的四种容器:

List , Tuple , Dictionary , Set

列表,元组,  字典 , 集合

List = [ ]

Tuple = ( )

Dict = { : } key~value

Set = { }

 

列表元组常用函数:

cmp(a,b) 比较

max/min(a,b) 返回最大/小

len(a,b)返回长度

sum(a)返回元素和

sorted(a)返回升序排列

 

列表常用方法:

a.ppend(1)     添加1至末尾

a.count(1)     统计1出现次数

a.extend([1,2])      将[1,2]追加至a末尾

a.index(1)      返回第一个1的索引

a.insert(2,1)   将1插入索引2的位置

a.pop(1)        移除索引为1的元素

 

函数式编程

b = [ i+2 for i in a]

  • b = map(lambda x: x+2 ,a)
  • b = list(b)

 

s = 1

for i in range(1,n+1)

       s = s+i

  • reduce(lambda x,y : x*y , range(1,n+1)

 

b = [i for i in range(10) if i > 5 and i < 8]

  • b = filter(lambda x:x > 5and x < 8 , range(10)
  • b = list(b)

Numpy

当列表数据特别大时,使用列表会非常慢;

所以使用速度非常快的,带有真正数组功能的Numpy。

 

Numpy基本操作(代码清单2-1)


##numpy test
import numpy as np
import pprint
a = np.array([2,3,4,5,7,3])
print(a)
print(a[:3])
print(a.min())
a.sort()
b = np.array([[1,2,4],[5,7,8],[2,0,5]])
pprint.pprint(b * b)

runfile('E:/PythonLearning/numpytest.py', wdir='E:/PythonLearning')
[2 3 4 5 7 3]
[2 3 4]
2
array([[ 1,  4, 16],
       [25, 49, 64],
       [ 4,  0, 25]])

常用拓展库

Numpy   数组支持和高效处理函数

Scipy      矩阵支持和矩阵计算模块

Matplotlib     数据可视化

Pandas          数分析工具

StatsModels  统计建模和计量经济学

Scikit-Learn   回归,聚类,分类等机器学习库

Keras             神经网络,深度学习库

Gensim          文本挖掘用