課程簡介

大數據概述:

  • 什麼是 Big Data
  • 為什麼 Big Data 越來越受歡迎
  • Big Data 案例研究
  • Big Data 特點
  • 要處理的解決方案Big Data。

Hadoop 及其組成部分:

  • 什麼是 Hadoop 以及它的組成部分是什麼。
  • Hadoop 架構及其可以處理的數據的特徵 /Process.
  • 簡要介紹 Hadoop 歷史、使用它的公司以及他們為什麼開始使用它。
  • Hadoop 框架工作及其元件 - 詳細解釋。
  • 什麼是 HDFS 和讀取 - 寫入 Hadoop 分散式文件系統。
  • 如何設置不同模式下的 Hadoop 集群 - 獨立/偽/多節點集群。

(這包括在VirtualBox/KVM/VMware中設置Hadoop集群,需要仔細研究的網路配置,運行Hadoop守護進程和測試集群)。

  • 什麼是Map Reduce幀工作及其工作原理。
  • 在 Hadoop 集群上運行 Map Reduce 作業。
  • 瞭解 Hadoop 集群上下文中的複製、鏡像和機架感知。

Hadoop 集群規劃:

  • 如何規劃hadoop集群。
  • 了解硬體-軟體以規劃hadoop集群。
  • 瞭解工作負載並規劃群集以避免故障並執行最佳性能。

什麼是 MapR 以及為什麼 MapR:

  • MapR 及其體系結構概述。
  • 瞭解和工作MapR控制系統,MapR卷,快照和鏡像。
  • 在 MapR 上下文中規劃群集。
  • MapR 與其他發行版和 Apache 的比較 Hadoop。
  • MapR 安裝和群集部署。

集群設置和管理:

  • 管理服務、節點、快照、鏡像卷和遠端集群。
  • 瞭解和管理節點。
  • 瞭解 Hadoop 元件,將 Hadoop 元件與 MapR 服務一起安裝。
  • 訪問集群上的數據,包括通過NFS管理服務和節點。
  • 通過使用卷管理數據,管理使用者和組,管理和分配節點角色,調試節點停用,集群管理和性能監控,配置/分析和監控指標以監控性能,配置和管理MapR安全性。
  • 瞭解並使用 M7- MapR 表的本機存儲。
  • 群集配置和調優以獲得最佳性能。

叢集升級以及與其他設置的整合:

  • 升級MapR的軟體版本和升級類型。
  • 配置Mapr集群以訪問 HDFS 集群。
  • 在 Amazon Elastic MapReduce 上設置 MapR 集群。

上述所有主題都包括演示和練習課程,供學習者親身體驗該技術。

最低要求

  • Linux FS 的基礎知識
  • 基本 Java
  • Apache Hadoop知識(推薦)
 28 時間:

人數



每位參與者的報價

客戶評論 (1)

相關課程

課程分類