用不同的分隔符(逗号)阅读熊猫的csv
问题描述:
我想读取一个CSV文件并将其保存为熊猫中的数据帧。用不同的分隔符(逗号)阅读熊猫的csv
但是我有一个问题,因为我有行是这样的:
BG,6141.6,6141.6,,3.0,,,ic
正如你看到有三个分离:',,,'
,',,'
和,
我该如何正确加载它变成熊猫吗?
答
使用正则表达式分隔[,]+
- 一个或多个,
:
import pandas as pd
from pandas.compat import StringIO
temp=u"""iBG,6141.6,6141.6,,3.0,,,ic"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep="[,]+", header=None, engine='python')
print (df)
0 1 2 3 4
0 iBG 6141.6 6141.6 3.0 ic
你应该在数据仔细看,很有可能是多个分离器将意味着你的数据有8列,但列4,6和7这个特定的行是空的 – Vaishali
是因为列是空的还是其他原因? –
你应该说明你已经尝试了什么,以及为什么你认为它没有工作。 – bli