如何在python中使用pandas读取csv文件的所有行?
问题描述:
我正在使用pandas
模块来读取.csv
文件中的数据。如何在python中使用pandas读取csv文件的所有行?
我可以写出下面的代码以提取属于一个单独的列中的数据如下:
import pandas as pd
df = pd.read_csv('somefile.tsv', sep='\t', header=0)
some_column = df.column_name
print some_column # Gives the values of all entries in the column
但是,我想读现在有超过5000列,写出来的文件声明
some_column = df.column_name
现在不可行。我如何获得所有列值,以便可以使用索引访问它们?
例如,为提取存于第100行和第50列中的值,我应该能够编写这样的事:
df([100][50])
答
使用DataFrame.iloc
或DataFrame.iat
,但蟒蛇计数从0
,因此需要99
和49
的选择100.
行和列50.
:
df = df.iloc[99,49]
样本 - 选择3.
行4.
柱:
df = pd.DataFrame({'A':[1,2,3],
'B':[4,5,6],
'C':[7,8,9],
'D':[1,3,10],
'E':[5,3,6],
'F':[7,4,3]})
print (df)
A B C D E F
0 1 4 7 1 5 7
1 2 5 8 3 3 4
2 3 6 9 10 6 3
print (df.iloc[2,3])
10
print (df.iat[2,3])
10
组合由列名和行的位置选择,可以通过Series.iloc
或Series.iat
:
print (df['D'].iloc[2])
10
print (df['D'].iat[2])
10
答
大熊猫有dataframes索引,所以你可以使用
df.iloc[[index]]["column header"]
索引位于列表中,因为您可以通过这种方式在一个索引处传递多个索引。
谢谢。根据需要运行 –
此外,如何找出df变量的列总数? –
你认为'len(df.columns)'? – jezrael