课程介绍

华为大数据专家(HCIE-Big Data)证定位华为大数据分析领域中大型分布式并行处理数据仓库平台的架构原理、优化设计、应用开发和大数据挖掘领域的基础理论、常用挖掘算法、应用设计以及开发、旨在推动业界大数据行业的专家型人才培养。主要内容包括华为企业级的大型并行处理分布式数据仓库平台FusionInsight LibrA的架构、功能特性、数据库设计开发;数据挖掘理论以及使用华为企业级大数据挖掘平台FusionInsight Miner和基于华为云的企业智能平台EI的基础服务- MLS机器学习服务进行数据深度分析和挖掘、通过华为HCIE-Big Data的学习、您将对大数据技术有更加深入的理解、具备运用大数据技术进行大数据分析应用、大数据挖掘应用的专家能力。

标题图标学员基础

学员应了解大数据技术原理和Hadoop的基础知识,具备华为大数据HCNA水平,熟悉Linux的管理和操作、具有数据库的基本知识,有数据库的使用经验,了解 SQL 语言。具备一定软件开发能力,熟悉Java、Python, C++等至少一种开发语言。

标题图标课程目标

理解并掌握大型并行处理数据仓库平台的架构原理、分布式关系型数据库的设计和优化及应用开发;掌握大数据挖掘的基本原理,常用算法、常用挖掘方法、对华为大数据挖掘解决方案FusionInsight Miner和华为云机器学习服务MLS的熟练使用,胜任数据仓库开发、大数据分析、大数据数据挖掘和人工智能的相关岗位。

课程大纲

第一章 数据仓库平台FusionInsight LibrA

理论

第一节 分布式数据库架构

体系架构基本知识

熟悉MPP架构及优势

业界产品说明

第二节 FusionInsight LibrA 基本组件简介

LibrA逻辑架构

LibrA物理架构

LibrA数据库对象

第三节 FusionInsight LibrA 产品特性和关键技术

架构和支持的操作系统

面向应用开发的基本功能

数据库安全

图形化工具

高级特性

第四节 FusionInsight LibrA 配套工具集

Database Manager概念与架构

Database Manager的安装

Database Manager的使用

Data Studio概念与架构

Data Studio的安装与FusionInsight LibrA服务器的配置

Data Studio工具支持的特性

Data Studio的使用

第五节 FusionInsight LibrA 安全管理

访问控制

用户管理

权限管理模型

对象权限

安全审计

第六节 FusionInsight LibrA 数据库管理系统并发控制

配置负载均衡

事务与隔离

LibrA锁机制介绍

第七节 FusionInsight LibrA 数据库性能监控

系统资源监控方式

性能相关视图

使用命令行监控集群性能

使用DM工具监控集群性能

第八节 FusionInsight LibrA 数据迁移

数据迁移场景划分

GDS工具适用场景和使用方法

copy from/to适用场景和使用方法

开源ELT工具适用场景和使用方法

gs_dump/gs_restore适用场景和使用方法

gsql工具适用场景和使用方法

Roach工具适用场景和使用方法

从其他数据库中迁移数据

第九节 FusionInsight LibrA SQL介绍

SQL相关机制和原理

利用EXPLAIN进行SQL调优

第十节 FusionInsight LibrA 数据库设计

数据库逻辑设计

存储模式

数据分布

表分区

索引

第十一节 FusionInsight LibrA 应用程序开发指导

FusionInsight LibrA驱动介绍

ODBC应用程序开发

JDBC应用程序开发

基础开发规范

第二章 FusionInsight LibrA实验

FusionInsight LibrA基本操作、语法

FusionInsight LibrA性能优化

网络KPI数据栅格化处理

重点区域数据分析

流动人口常驻地分析

第三章 大数据挖掘理论

第一节 预备知识和数据介绍

数据挖掘的定义

数据挖掘的流程

数据挖掘的应用

数据和属性类型

数据的统计描述

数据的邻近性度量

第二节 数据预处理

为什么要预处理数据

数据清理

数据集成

数据归约

数据变换

第三节 数据仓库介绍

数据仓库的概念

数据仓库的体系结构与模型

多维数据模型

概念分层

OLAP与OLTP

方体物化

第四节 分类

分类和回归的概念

决策树分类

朴素贝叶斯分类

组合分类

后向传播分类

支持向量机分类

模型评估与选择

第五节 聚类

聚类的定义

K-均值算法

k-中心点算法

第六节 离群点检测

离群点的概念

离群点检测的方法

第七节 关联规则(Association Rule)

关联规则的定义

关联规则挖掘步骤及相关概念

关联规则挖掘方法分类

Apriori算法

第八节 FusionInsight Miner 和华为云机器学习服务MLS

FusionInsight Miner整体介绍

关系分析

标签管理

华为云机器学习服务

第四章 大数据挖掘实战

银行定期存款业务预测

客户分群

鲍鱼生长年龄预测

友情链接

Back to top