问答题
试分析为何采用Combiner可以减少数据传输量?是否所有的MapReduce程序都可以采用Combiner?为什么?
对于每个分区内的所有键值对,后台线程会根据key对它们进行内存排序(Sort),排序是MapReduce的默认操作。排序......
(↓↓↓ 点击下方‘点击查看答案’看完整答案 ↓↓↓)
问答题 是否所有的MapReduce程序都需要经过Map和Reduce这两个过程?如果不是,请举例说明。
问答题 MapReduce中有这样一个原则:移动计算比移动数据更经济。试述什么是本地计算,并分析为何要采用本地计算。
问答题 试述MapReduce的工作流程(需包括提交任务、Map、Shuffle、Reduce的过程)。