pandas-数据加载(read_csv)常用参数解析
1.CSV与TSV
C:逗号分隔的结构化文件
T:制表符分隔的文件
关于CSV已经形成了一种惯性认识:只要是普通的文本文件,并且是结构化的
所以不管是什么分隔符,都是CSV格式
狭义上,必须是逗号
但是现在一般都把结构化的普通文本文件,用CSV的方式来对待,区别仅仅是改一下分隔符而已
2.read_csv()
返回的是dataframe对象
2.1 header
2.2 names
2.3 index_col
2.3 usecol
3.小结
- sep或delimiter指定分隔符,默认是逗号。
- header=None指定不把第一行记录当作列名。
- names定义列名,如果指定了header=None,不指定names,则默认列名是0,1,2…
- index_col把某列当作行索引,例如数据表中的主键。
- usecols在读取文件的时候只选择读取部分列。