課程簡介

Big Data 概述:

  • Big Data 是什么
  • 为什么 Big Data 越来越受欢迎
  • Big Data 案例研究
  • Big Data 特性
  • 关于 Big Data 的解决方案

Hadoop 及其组件:

  • Hadoop 是什么及其组件
  • Hadoop 的架构及其处理/处理数据的特点
  • Hadoop 的简史,使用它的公司及原因
  • Hadoop 框架及其组件的详细说明
  • HDFS 是什么及对 Hadoop 分布式文件系统的读写操作
  • 如何在不同模式下设置 Hadoop 集群:单机/伪/多节点集群

(包括在 VirtualBox/KVM/VMware 中设置 Hadoop 集群,需要仔细检查的网络配置,运行 Hadoop 守护进程并测试集群)。

  • Map Reduce 框架是什么及其工作原理
  • 在 Hadoop 集群上运行 Map Reduce 任务
  • 理解 Hadoop 集群中的复制、镜像和机架感知

Hadoop 集群规划:

  • 如何规划你的 Hadoop 集群
  • 了解硬件和软件以规划 Hadoop 集群
  • 了解工作负载并规划集群以避免故障并实现最佳性能

MapR 是什么及为什么选择 MapR:

  • MapR 概述及其架构
  • MapR 控制系统、MapR 卷、快照和镜像的理解与操作
  • 在 MapR 背景下规划集群
  • MapR 与其他发行版及 Apache Hadoop 的比较
  • MapR 安装及集群部署

集群设置与管理:

  • 管理服务、节点、快照、镜像卷和远程集群
  • 理解与管理节点
  • 理解 Hadoop 组件,安装 Hadoop 组件与 MapR 服务
  • 在集群上通过 NFS 管理服务与节点
  • 使用卷管理数据,管理用户和组,管理并分配节点角色,节点的上线与下线,集群管理与性能监控,配置/分析与监控指标以监控性能,配置与管理 MapR 安全性
  • 理解与操作 M7 - MapR 表的本地存储
  • 集群配置与调优以实现最佳性能

集群升级与集成其他设置:

  • 升级 MapR 软件版本及升级类型
  • 配置 MapR 集群以访问 HDFS 集群
  • 在 Amazon Elastic Mapreduce 上设置 MapR 集群

以上所有主题包括演示和实践环节,以便学员能够亲身体验该技术。

最低要求

  • Linux FS 的基础知识
  • Java 的基础知识
  • Apache Hadoop 的知识(推荐)
 28 時間:

人數


每位參與者的報價

客戶評論 (1)

Upcoming Courses

課程分類