问答题
试述流数据的概念
流数据,即数据以大量、快速、时变的流形式持续到达
问答题 Spark对RDD的操作主要分为行动(Action)和转换(Transformation)两种类型,两种类型操作的区别是什么?
问答题 试述如下Spark的几个主要概念:RDD、DAG、阶段、分区、窄依赖、宽依赖。
问答题 试述“Spark on YARN”的概念。