如何更改分隔在逗号分隔的制表符

问题描述:

我不知道这是否可能。我试图将12个文件追加到一个文件中。其中一个文件是制表符分隔的,其余的逗号分隔。我将所有12个文件加载到数据框中,并将其附加到一个循环中的空白数据框中。如何更改分隔在逗号分隔的制表符

list_of_files = glob.glob('./*.txt') 
df = pd.DataFrame() 
for filename in list_of_files: 
    file = pd.read_csv(filename) 
    dfFilename = pd.DataFrame(file) 
    df = df.append(dfFilename, ignore_index=True) 

但是大文件不是我想要的格式。我认为问题在于制表符分隔的文件。我试图运行没有制表符分隔文件的代码,并且附加文件的格式很好。所以我在考虑是否可以将制表符分隔的格式更改为使用熊猫分隔的逗号。

谢谢您的帮助和建议

您需要告诉Pandas当您导入文件时,该文件是制表符分隔的。您可以将分隔符传递给read_csv方法,但在您的情况下,由于分隔符是按文件更改的,因此您希望传递无 - 这将使Pandas自动检测正确的分隔符。

更改您的read_csv行:

pd.read_csv(filename,sep=None) 
+0

这是完美的。谢谢亲爱的 – Same

这才是制表符分隔的文件,你应该使用:

file = pd.read_csv(filename, sep="\t") 

熊猫read_csv有相当多的参数,检查出来的docs