課程簡介
介紹
- 雲計算和大數據解決方案簡介
- Apache 概述 Hadoop 特性和體系結構
設定Hadoop
- 規劃 Hadoop 集群(本地、雲等)
- 選擇操作系統和 Hadoop 發行版
- 預配資源(硬體、網路等)
- 下載和安裝軟體
- 調整群集大小以實現靈活性
使用 HDFS
- 瞭解 Hadoop 分散式文件系統 (HDFS)
- HDFS命令參考概述
- 訪問 HDFS
- 在HDFS上執行基本檔操作
- 使用 S3 作為 HDFS 的補充
MapReduce概述
- 瞭解MapReduce框架中的數據流
- 映射、隨機播放、排序和減少
- 演示:計算最高工資
使用 YARN
- 瞭解 Hadoop 中的資源管理
- 使用 ResourceManager、NodeManager、Application Master
- 在 YARN 下調度作業
- 為大量節點和集群進行調度
- 演示:作業調度
將 Hadoop 與 Spark 集成
- 為 Spark 設置存儲(HDFS、Amazon、S3、NoSQL 等)
- 瞭解彈性分散式資料集 (RDD)
- 創建 RDD
- 實現 RDD 轉換
- 演示:實現電影標題的文本搜索程式
管理 Hadoop 集群
- 監控 Hadoop
- 保護 Hadoop 集群
- 添加和刪除節點
- 運行性能基準
- 調整 Hadoop 群集以優化性能
- 備份、恢復和業務連續性規劃
- 確保高可用性 (HA)
升級和遷移 Hadoop 集群
- 評估工作負載要求
- 升級 Hadoop
- 從本地遷移到雲,反之亦然
- 從故障中恢復
故障排除
總結和結論
最低要求
- 系統管理經驗
- 具有 Linux 命令行的經驗
- 對大數據概念的理解
觀眾
- 系統管理員
- 資料庫管理員
客戶評論 (7)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Course - Python and Spark for Big Data (PySpark)
很多實際的例子,處理同一問題的不同方法,有時還不那麼明顯的技巧如何改進當前的解決方案
Rafał - Nordea
Course - Apache Spark MLlib
機器翻譯
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Course - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Course - Big Data Analytics in Health
Having hands on session / assignments