如何在python中使用pandas读取csv文件的所有行?

问题描述:

我正在使用pandas模块来读取.csv文件中的数据。如何在python中使用pandas读取csv文件的所有行?

我可以写出下面的代码以提取属于一个单独的列中的数据如下:

import pandas as pd 

df = pd.read_csv('somefile.tsv', sep='\t', header=0) 
some_column = df.column_name 
print some_column # Gives the values of all entries in the column 

但是,我想读现在有超过5000列,写出来的文件声明

some_column = df.column_name 

现在不可行。我如何获得所有列值,以便可以使用索引访问它们?

例如,为提取存于第100行和第50列中的值,我应该能够编写这样的事:

df([100][50]) 

使用DataFrame.ilocDataFrame.iat,但蟒蛇计数从0,因此需要9949的选择100.行和列50.

df = df.iloc[99,49] 

样本 - 选择3.4.柱:

df = pd.DataFrame({'A':[1,2,3], 
        'B':[4,5,6], 
        'C':[7,8,9], 
        'D':[1,3,10], 
        'E':[5,3,6], 
        'F':[7,4,3]}) 

print (df) 
    A B C D E F 
0 1 4 7 1 5 7 
1 2 5 8 3 3 4 
2 3 6 9 10 6 3 

print (df.iloc[2,3]) 
10 

print (df.iat[2,3]) 
10 

组合由列名和行的位置选择,可以通过Series.ilocSeries.iat

print (df['D'].iloc[2]) 
10 

print (df['D'].iat[2]) 
10 
+0

谢谢。根据需要运行 –

+0

此外,如何找出df变量的列总数? –

+1

你认为'len(df.columns)'? – jezrael

大熊猫有dataframes索引,所以你可以使用

df.iloc[[index]]["column header"] 

索引位于列表中,因为您可以通过这种方式在一个索引处传递多个索引。