熊猫在尝试读取.xls文件时抛出XLRDError
问题描述:
我正在构建一个脚本,以便从组织的仪表板中自动下载Excel文件并将其作为熊猫数据框打开。我有代码工作来下载文件,但我发现,虽然它以.xls扩展名保存,但它实际上是一个HTML文件。熊猫在尝试读取.xls文件时抛出XLRDError
这是我有:
import pandas as pd
df = pd.read_excel("report.xls")
而且我收到此错误:
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'Title\tCo'
我使用read_html尝试过,但返回 “没有找到表”。这是有道理的,因为没有html呈现。是什么赋予了?
答
这是一个制表符分隔的文件。以下作品:
pd.read_table("report.xls")
您可以将表格,然后保存为一个文件的.xlsx,一切都很好。