机器学习 第三节 第五课

[toc]

Numpy 读取数据

CSV: Comma-Separated Value, 逗号分隔文件

显示: 表格状态

源文件: 换行和逗号分隔行列的格式化文本, 每一行的数据表示一条记录

由于 csv 便于展示, 读取和写入, 所以很多地方也是用 csv 的格式存储和传输中小型的数据, 为了方便教学, 我们会经常操作 csv 格式的文件, 但是操作数据库中的数据也是很容易的实现的.

numpy 读取数据

参数                         解释

frame                       文件, 字符串或产生器, 可以.gz或bz2压缩文件

dtype                        数据类型, 可选, CSV 的字符串以什么数据类型读入数组中, 默认 np.float

delimiter                   分隔字符串, 默认是任何空格, 改为 逗号

skiprows                  跳过 x 行, 一般跳过第一行表头

upack                       如果 True, 读入属性将分别写入不同数组变量, False 读入数据只写入一个数组变量, 默认 Flase

numpy 读取和存储数据

现在这里有一个英国和各自 youtube 1000 多个视频的点击, 不喜欢, 评论数量 ( ["views","likes","dislikes","comment_total"] ) 的 csv, 运用刚刚所学习的只是, 我们尝试来对其进行操作

机器学习 第三节 第五课

执行结果:

机器学习 第三节 第五课

机器学习 第三节 第五课

执行结果:

机器学习 第三节 第五课