华为HCIA考试（个人笔记）

填空题：

Yarn做资源调度时，maptask和reduce Task是运行在Container中。

Flume在传输数据过程中，可以对数据进行简单过滤，主要通过设置Interceptor在Soure和Channel之间对不关心的数据进行过滤。

HBase会周期性的把MemStore的数据刷写在磁盘StoreFile文件中

Redis主要消耗内存物理资源

下面那些场景不是Flink组件擅长的：迭代计算、数据存储

如果需要由数据生产者决定数据发送给目标Bolt的某一个确定的Task，应选择直接分组消息发布策略

ElasticSearch采用倒排索引方式索引数据

如果想把Key中存储的数字值加1，该使用incr命令

TARN中队列的默认资源调度器是容量调度器

创建Loader作业中，可以在转换步骤中设置过滤器类型

以下优先级不属于创建Loader作业时必选项

商业模式发现无法通过大数据技术实现

传统数据处理的数据规模的单位是MB

创建Loader作业时，可以在输出设置步骤设置Map数

Fusininsight HD系统审计日志不可以记录查询历史监控操作

在YARN的任务调度流程中，下列申请和领取资源是ApplicationMaster负责的任务

HDFS的副本放置策略中，同一机架不同的服务器之间的距离是2

RegionServer故障时，HMaster由对已故障的RegionServer上的Region进行迁移

HBase通过BloomFiter快速判断用户数据不存在

用于记录Kafka中消息读取位置的是Offset

24315

Spark架构中Spark Core是核心模块