Tableau TDE或直接连接到文件?

问题描述:

我有Tableau的个人许可证。我正在使用它来连接到.csv和.xlsx文件,但遇到了一些问题。Tableau TDE或直接连接到文件?

1)该.csv文件是大量的(10+演出) 2)Excel文件开始到到达1mil的行限制 3)我需要某些列有时添加到该.csv文件(如唯一的ID和一些公式),这意味着我需要在Excel中打开它们的一部分,修改我需要的内容,然后保存一个新文件

为每个这些文件创建一个提取然后连接Tableau工作簿提取而不是文件?目前我直接连接到文件,然后从那里提取数据并每天刷新。

+0

“我直接连接到文件,然后从那里提取数据并每天刷新。”这个声明意味着你已经在使用解压缩文件,所以我不确定问题是什么。 – Talvalin 2014-09-26 09:33:18

+0

我的仪表板都指向excel或csv文件。他们每人分别提取数据。我想知道是否应该为每个文件创建一个提取文件,维护这些提取文件,并将我的工作簿指向提取文件而不是单个文件 – trench 2014-09-26 12:52:37

+0

如果问题是“我会在使用提取文件的10个以上演出文件中看到更好的性能”文本文件?“,那么答案几乎肯定是的。 – 2014-09-26 18:27:34

我不知道其他人,但我正在使用这个准则。我将制作一些工作手册,仅用于从某些数据源(不管是SQL,xlsx,csv,mdb还是其他任何数据源)提取数据,并且所有分析都将在其他工作簿中执行,这些工作簿仅会连接到tdes

的优点是:

1)当你需要更新数据源,你只需要更新一次(和替换TDE文件)和所有工作簿将是最新的。如果连接到相同的数据源并提取到不同的tde文件,则必须提取所有这些不同的tde文件(并且担心已经更新了该特定工作簿中的提取文件)。即使你提取到相同的tde(这没有多大意义),它可能会令人困惑(我是否连接到tde或文件?我在另一个工作簿中提取的提取是否也更新了这个? ,是的,但它可能会造成混淆)

2)您不必担心替换数据源,特别是当它是csv,xlsx或mdb文件时。你可以保留这些文件的许多不同版本,并选择哪一个最好。例如,我将有table_v1.mdb,table_v2.mdb,...和一个table_v1.tde,它将是这些mdb文件之一的提取。而且我仍然有以前的版本,以防我需要它们。 3)当你有一个SQL连接或者任何不是文件(csv,xlsx,mdb)的东西时,基于上述基本相同的原因,提取非常方便,至少有一个优点。每次要执行分析时都不需要连接到服务器。这意味着您可以将所有内容都离线执行,并且使用Tableau的人员无需访问SQL表(或任何其他来源)。更新时,TDE(因为,倒楣的事情发生)

万兆CSV,哇

一个很好的做法是始终保持备份。是的,你应该绝对使用数据提取,这会更快。对于那么多的数据,你可以查看其他连接,如MS Access或SQL实例。

如果你的数据有很多行,我会尝试在你的本地机器上设置一个小的MySQL实例,并保留那里的数据。您可以将Tableau直接连接到MySQL实例,并且可以轻松编辑源数据。