大熊猫read_csv引发ValueError异常
问题描述:
我想读通过分隔TXT数据 '' 和 '\ T',我用下面的代码:大熊猫read_csv引发ValueError异常
io_df = pd.read_csv('input_output.txt',sep='\D|\t',engine = 'python')
这引发了以下错误信息:
--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-38-5ab0138d93ac> in <module>() ----> 1 io_df = pd.read_csv('input_output.txt',sep='\D|\t',engine = 'python')
如何解决这个问题?
答
对我的作品sep=",|\t"
:
pd.read_csv('test.csv', sep=",|\t", engine = 'python')
样品:
import pandas as pd
df = pd.read_csv('https://dl.dropboxusercontent.com/u/84444599/test.csv',
sep=",|\t",
engine = 'python')
print (df)
col col1 col2
0 a d t
1 d u l
谢谢你,这是确定的来解决这个问题。但是如果我想通过** regex **表达式分开,它总是会引发错误,如何解决? – Stellera
这是非常难的帮助你,因为我没有你的文件。 – jezrael
我认为最好的方法是使用小文件样本,尝试找出导致错误的原因,然后找到解决方案。 – jezrael