課程簡介

介紹

  • 雲計算和大數據解決方案簡介
  • Apache 概述 Hadoop 特性和體系結構

設定Hadoop

  • 規劃 Hadoop 集群(本地、雲等)
  • 選擇操作系統和 Hadoop 發行版
  • 預配資源(硬體、網路等)
  • 下載和安裝軟體
  • 調整群集大小以實現靈活性

使用 HDFS

  • 瞭解 Hadoop 分散式文件系統 (HDFS)
  • HDFS命令參考概述
  • 訪問 HDFS
  • 在HDFS上執行基本檔操作
  • 使用 S3 作為 HDFS 的補充

MapReduce概述

  • 瞭解MapReduce框架中的數據流
  • 映射、隨機播放、排序和減少
  • 演示:計算最高工資

使用 YARN

  • 瞭解 Hadoop 中的資源管理
  • 使用 ResourceManager、NodeManager、Application Master
  • 在 YARN 下調度作業
  • 為大量節點和集群進行調度
  • 演示:作業調度

將 Hadoop 與 Spark 集成

  • 為 Spark 設置存儲(HDFS、Amazon、S3、NoSQL 等)
  • 瞭解彈性分散式資料集 (RDD)
  • 創建 RDD
  • 實現 RDD 轉換
  • 演示:實現電影標題的文本搜索程式

管理 Hadoop 集群

  • 監控 Hadoop
  • 保護 Hadoop 集群
  • 添加和刪除節點
  • 運行性能基準
  • 調整 Hadoop 群集以優化性能
  • 備份、恢復和業務連續性規劃
  • 確保高可用性 (HA)

升級和遷移 Hadoop 集群

  • 評估工作負載要求
  • 升級 Hadoop
  • 從本地遷移到雲,反之亦然
  • 從故障中恢復

故障排除

總結和結論

最低要求

  • 系統管理經驗
  • 具有 Linux 命令行的經驗
  • 對大數據概念的理解

觀眾

  • 系統管理員
  • 資料庫管理員
 35 時間:

人數



每位參與者的報價

客戶評論 (7)

相關課程

課程分類