sqoop出口的配置单元兽表

问题描述:

我有一个配置单元格式由pyspark dataframe_writer填充的配置单元表。 我需要将此表导出为oracle.I在导出表时遇到问题,因为sqoop无法分析orc文件格式。sqoop出口的配置单元兽表

是否需要使用sqoop命令指定用于导出配置元格表的任何特殊注意事项或参数。

一个简单的谷歌查询指向blog post标记很明确......

如何Sqoop导出一个蜂巢ORC表到Oracle数据库?

而且也存在SO post标记......

阅读ORC文件并付诸RDBMS?

所以看来你没有做任何研究。

顺便说一下,您是否考虑使用Spark将数据直接通过JDBC发送到Oracle暂存表中,而不使用中间ORC转储?

+0

我做了我的研究,看到使用hcatalog的帖子,并试过it.I有一个错误,我需要重现要张贴在这里。 – srini

我刚刚从ORAC到ORACLE的同一个sqoop。确保你有你的ORC表预先创建正确的数据类型,因为你在数据框中有它们。列的相同顺序也将缓解sqoop。如果您尝试了任何命令,请将其发布。