华为HCIA考试(个人笔记)

填空题:

Yarn做资源调度时,maptask和reduce Task是运行在Container中。

Flume在传输数据过程中,可以对数据进行简单过滤,主要通过设置Interceptor在Soure和Channel之间对不关心的数据进行过滤。

HBase会周期性的把MemStore的数据刷写在磁盘StoreFile文件中

Redis主要消耗内存物理资源

下面那些场景不是Flink组件擅长的:迭代计算、数据存储

 如果需要由数据生产者决定数据发送给目标Bolt的某一个确定的Task,应选择直接分组消息发布策略

 ElasticSearch采用倒排索引方式索引数据

 如果想把Key中存储的数字值加1,该使用incr命令

 TARN中队列的默认资源调度器是容量调度器

 创建Loader作业中,可以在转换步骤中设置过滤器类型

 以下优先级不属于创建Loader作业时必选项

 商业模式发现无法通过大数据技术实现

 传统数据处理的数据规模的单位是MB

 创建Loader作业时,可以在输出设置步骤设置Map数

 Fusininsight HD系统审计日志不可以记录查询历史监控操作

 在YARN的任务调度流程中,下列申请和领取资源是ApplicationMaster负责的任务

 HDFS的副本放置策略中,同一机架不同的服务器之间的距离是2

 RegionServer故障时,HMaster由对已故障的RegionServer上的Region进行迁移

 HBase通过BloomFiter快速判断用户数据不存在

 用于记录Kafka中消息读取位置的是Offset

3cb739955dd94a6698956ab06f49e47a.png

80e7128ff36142ffae1938b112c2672a.png

f6cfda9f30ec4621a393180d1a23ba34.png

 243153013e9898afe4554b30ee087f39afc33.png

 Spark架构中Spark Core是核心模块