多项选择题
下列关于rdd描述正确的是()。
A.弹性分布式数据集。
B.逻辑上是分区的,每个分区的数据是抽象存在的。
C.不能改变现有rdd中的数据。
D.相邻的rdd之间存在着血缘关系。
点击查看答案&解析
相关考题
-
多项选择题
以下属于内置模块的是()。
A.SparkCore
B.SparkStreaming
C.SparkMlib
D.SparkGraphX -
单项选择题
下列关于spark从kafka 获取数据描述错误的是()。
A.分为ReceiverAPI和DirectAPI
B.使用ReceiverAPI可能会导致计算数据的节点内存溢出
C.使用DirectAPI可以增加消费的并行度
D.两种API都可以手动维护offset 保存位置 -
单项选择题
下列不可以直接作为spatkStreaming数据源的是()。
A.RDD队列
B.Kafka消息队列
C.本地数据
D.自定义socket数据源
