课程介绍

本课程涵盖FusionInsight HD解决方案架构、设计、部署和维护,大数据常用组件技术原理、设计、部署、管理与维护(包括HDFS、MapReduce、Yarn、Saprk2x、Hbase、Hive、Streaming、Loader、Flume、Kafka、Zookeeper等)。

学员报读条件

大数据运维与开发人员,应用开发高级人员,企业IT系统架构师,企业CTO

标题图标课程目标

系统理解大数据架构、技术原理

掌握华为大数据FusionInsight HD方案

具备大数据平台的规划设计、部署和运维能力

熟悉HDFS、MapReduce、Yarn、Spark

熟悉HBase、Hive、Loader、Flume

熟悉Kafka、Streaming

熟悉ZooKeeper

课程大纲:

模块名称

课程内容

大数据行业与技术趋势

1. 大数据时代

2. 大数据的应用领域

3. 大数据时代的机遇和挑战

4. 华为大数据解决方案

HDFS分布式文件系统

1. HDFS概述及应用场景

2. HDFSFusionInsight产品中的位置

3. HDFS系统架构

4. 关键特性介绍

MapReduce分布式离线批处理和Yarn资源协调

1. MapReduceYARN基本介绍

2. MapReduceARN功能与架构

3. YARN的资源管理和任务调度

4. 增强特性

Spark基于内存的分布式计算框架

1. Spark概述

2. Spark原理与架构

3. SparkFusionInsight中的集成情况

HBase分布式NoSQL数据库

1. Hbase基本介绍

2. Hbase功能与架构

3. Hbase关键流程

4. Hbase华为增强特性

Hive分布式数据仓库

1. Hive概述

2. Hive功能与架构

3. Hive基本操作

Streaming分布式流计算引擎

1. Streaming简介

2. 系统架构

3. 关键特性介绍

4. StreamSQL介绍

Flink流计算处理和批处理平台

Flink概述

Flink原理与技术架构

FlinkFusionInsight HD中的集成情况

Loader数据转换

1. Loader简介

2. Loader作业管理

Flume海量日志聚合

1. Flume简介及架构

2. Flume关键特性介绍

3. Flume应用举例

Kafka分布式消息订阅系统

1. Kafka简介

2. Kafka架构与功能

3. Kafka关键流程

ZooKeeper集群分布式协调服务

1. Zookeeper简介

2. Zookeeper在产品中的位置

3. 系统架构

4. 关键特性介绍

5. 与组件的关系

FusionInsight HD解决方案介绍

1. FusionInsight概述

2. FusionInsight特性介绍

3. FusionInsight HD成功案例

友情链接

Back to top