课程介绍
本课程涵盖FusionInsight HD解决方案架构、设计、部署和维护,大数据常用组件技术原理、设计、部署、管理与维护(包括HDFS、MapReduce、Yarn、Saprk2x、Hbase、Hive、Streaming、Loader、Flume、Kafka、Zookeeper等)。
学员报读条件
大数据运维与开发人员,应用开发高级人员,企业IT系统架构师,企业CTO
标题图标课程目标
系统理解大数据架构、技术原理
掌握华为大数据FusionInsight HD方案
具备大数据平台的规划设计、部署和运维能力
熟悉HDFS、MapReduce、Yarn、Spark
熟悉HBase、Hive、Loader、Flume
熟悉Kafka、Streaming
熟悉ZooKeeper
课程大纲:
| 
 模块名称  | 
 课程内容  | 
| 
 大数据行业与技术趋势  | 
 1. 大数据时代 2. 大数据的应用领域 3. 大数据时代的机遇和挑战 4. 华为大数据解决方案  | 
| 
 HDFS分布式文件系统  | 
 1. HDFS概述及应用场景 2. HDFS在FusionInsight产品中的位置 3. HDFS系统架构 4. 关键特性介绍  | 
| 
 MapReduce分布式离线批处理和Yarn资源协调  | 
 1. MapReduce与YARN基本介绍 2. MapReduce与ARN功能与架构 3. YARN的资源管理和任务调度 4. 增强特性  | 
| 
 Spark基于内存的分布式计算框架  | 
 1. Spark概述 2. Spark原理与架构 3. Spark在FusionInsight中的集成情况  | 
| 
 HBase分布式NoSQL数据库  | 
 1. Hbase基本介绍 2. Hbase功能与架构 3. Hbase关键流程 4. Hbase华为增强特性  | 
| 
 Hive分布式数据仓库  | 
 1. Hive概述 2. Hive功能与架构 3. Hive基本操作  | 
| 
 Streaming分布式流计算引擎  | 
 1. Streaming简介 2. 系统架构 3. 关键特性介绍 4. StreamSQL介绍  | 
| 
 Flink流计算处理和批处理平台  | 
 Flink概述 Flink原理与技术架构 Flink在FusionInsight HD中的集成情况  | 
| 
 Loader数据转换  | 
 1. Loader简介 2. Loader作业管理  | 
| 
 Flume海量日志聚合  | 
 1. Flume简介及架构 2. Flume关键特性介绍 3. Flume应用举例  | 
| 
 Kafka分布式消息订阅系统  | 
 1. Kafka简介 2. Kafka架构与功能 3. Kafka关键流程  | 
| 
 ZooKeeper集群分布式协调服务  | 
 1. Zookeeper简介 2. Zookeeper在产品中的位置 3. 系统架构 4. 关键特性介绍 5. 与组件的关系  | 
| 
 FusionInsight HD解决方案介绍  | 
 1. FusionInsight概述 2. FusionInsight特性介绍 3. FusionInsight HD成功案例  |