判断题
所谓数据清理,就是试图检测和去除数据集中的噪声数据和无关数据,处理遗漏数据,去除空白数据域和知识背景下的白噪声,解决数据的一致性、唯一性问题,从而达到提高数据质量的目的。
正确(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
判断题 HBase是一个分布式数据库,可以运行在不同的平台上。
判断题 Hadoop是基于Python语言开发的,具有很好的跨平台特性。
判断题 SparkStreaming提供了流计算。