Spark数据集 - 强类型
答
Dataframe API是非类型化的API,因为只有在运行时才能知道类型。数据集API是类型化的API,在编译期间将知道类型。
df.select("device").where("signal > 10") // using untyped APIs
ds.filter(_.signal > 10).map(_.device) // using typed APIs
任何人都可以请回答这个问题。 –
链接解释了数据集和数据框之间的差异。 http://*.com/questions/31508083/difference-between-dataframe-and-rdd-in-spark/39033308?noredirect=1#comment68807827_39033308 –