【Python】数据分析结课复习(随便复复)D1
前几天书到了,翻了几下,发现被坑了
这两本书从目录来看几乎完全一样,真的是案例都是全部一样,无非就是把MATLAB换成了Python,真的没有诚意
说起来又非常想念徐圣兵老师,讲的数学模型课真的非常好,是我大学唯一有兴趣的课。
今天吃了感冒药特别困
不打字看,看了一二章
也就是差不多的内容。
第二章
Python的四种容器:
List , Tuple , Dictionary , Set
列表,元组, 字典 , 集合
List = [ ]
Tuple = ( )
Dict = { : } key~value
Set = { }
列表元组常用函数:
cmp(a,b) 比较
max/min(a,b) 返回最大/小
len(a,b)返回长度
sum(a)返回元素和
sorted(a)返回升序排列
列表常用方法:
a.ppend(1) 添加1至末尾
a.count(1) 统计1出现次数
a.extend([1,2]) 将[1,2]追加至a末尾
a.index(1) 返回第一个1的索引
a.insert(2,1) 将1插入索引2的位置
a.pop(1) 移除索引为1的元素
函数式编程
b = [ i+2 for i in a]
- b = map(lambda x: x+2 ,a)
- b = list(b)
s = 1
for i in range(1,n+1)
s = s+i
- reduce(lambda x,y : x*y , range(1,n+1)
b = [i for i in range(10) if i > 5 and i < 8]
- b = filter(lambda x:x > 5and x < 8 , range(10)
- b = list(b)
Numpy
当列表数据特别大时,使用列表会非常慢;
所以使用速度非常快的,带有真正数组功能的Numpy。
Numpy基本操作(代码清单2-1)
##numpy test
import numpy as np
import pprint
a = np.array([2,3,4,5,7,3])
print(a)
print(a[:3])
print(a.min())
a.sort()
b = np.array([[1,2,4],[5,7,8],[2,0,5]])
pprint.pprint(b * b)
runfile('E:/PythonLearning/numpytest.py', wdir='E:/PythonLearning')
[2 3 4 5 7 3]
[2 3 4]
2
array([[ 1, 4, 16],
[25, 49, 64],
[ 4, 0, 25]])
常用拓展库
Numpy 数组支持和高效处理函数
Scipy 矩阵支持和矩阵计算模块
Matplotlib 数据可视化
Pandas 数分析工具
StatsModels 统计建模和计量经济学
Scikit-Learn 回归,聚类,分类等机器学习库
Keras 神经网络,深度学习库
Gensim 文本挖掘用