如何将数据从数据框导出到文件数据块
问题描述:
我现在正在做EdX的Spark课程简介。 是否有可能在我的电脑上保存来自Databricks的数据框。如何将数据从数据框导出到文件数据块
我问这个问题,因为这个课程提供Databricks笔记本这可能不会在课程结束后的工作。
在笔记本数据导入使用命令:
log_file_path = 'DBFS:/' + os.path.join( 'databricks-数据集', 'CS100', '实验2',“数据-001' , 'apache.access.log.PROJECT')
,我发现这个解决方案,但它不工作:
df.select( '年', '模式')。 write.format('com.databricks.spark.csv')。save('newcars.csv')
答
试试这个。
df.write.format("com.databricks.spark.csv").save("file:///home/yphani/datacsv")
这会将文件保存到Unix服务器中。
如果你只/家/ yphani/datacsv它看起来对HDFS的路径。