单项选择题 在Spark中,假设lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是:() X:lines.filter(...).groupByKey(...) Y:lines.groupByKey(...).filter(...)
判断题 Solr是一个高性能,基于Lucene的全文检索服务。Solr对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言,并实现了强大的全文检索功能,具有高度的可扩展性。同时从Solr4.0版本开始,支持SolrCloud模式。()
单项选择题 存在如下场景:每天由线上系统产生新数据500G,需要对这些数据按天、周、月等维度做统计汇总。请问它适合用Hive哪种表来处理?()