问答题
美国加州大学伯克利分校提出的数据分析的软件栈BDAS认为目前的大数据处理可以分为哪三个类型?
①复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间;②基于历史数据的交互式查询:时间跨度通常在数十秒到......
(↓↓↓ 点击下方‘点击查看答案’看完整答案 ↓↓↓)
问答题 Spark的出现是为了解决Hadoop MapReduce的不足,试列举Hadoop MapReduce的几个缺陷,并说明Spark具备哪些优点。
问答题 Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。
问答题 请分别描述Pig、Tez和Kafka的功能。