简述¶
Spark提供了一种称为RDD(resilient distributed dataset,弹性分布式数据集)的简单逻辑数据结,是Spark最基本的抽象。DataFrame和DataSet都是基于RDD构建的。RDD操作分为转化操作
2022-09-11