pandas-数据加载(read_csv)常用参数解析


1.CSV与TSV

C:逗号分隔的结构化文件
T:制表符分隔的文件

关于CSV已经形成了一种惯性认识:只要是普通的文本文件,并且是结构化的
所以不管是什么分隔符,都是CSV格式

狭义上,必须是逗号
但是现在一般都把结构化的普通文本文件,用CSV的方式来对待,区别仅仅是改一下分隔符而已

2.read_csv()

返回的是dataframe对象
pandas-数据加载(read_csv)常用参数解析

2.1 header

pandas-数据加载(read_csv)常用参数解析

2.2 names

pandas-数据加载(read_csv)常用参数解析

2.3 index_col

pandas-数据加载(read_csv)常用参数解析

2.3 usecol

pandas-数据加载(read_csv)常用参数解析

3.小结

  1. sep或delimiter指定分隔符,默认是逗号。
  2. header=None指定不把第一行记录当作列名。
  3. names定义列名,如果指定了header=None,不指定names,则默认列名是0,1,2…
  4. index_col把某列当作行索引,例如数据表中的主键。
  5. usecols在读取文件的时候只选择读取部分列。