課程簡介
介紹
- 專案團隊採用的原因和方式 Hadoop
- 一切是如何開始的
- 項目經理在 Hadoop 專案中的角色
瞭解 Hadoop 的架構和關鍵概念
- HDFS的
- MapReduce的
- Hadoop 生態系統的其他部分
什麼是 Big Data?
不同的存儲方法 Big Data
HDFS(Hadoop 分散式文件系統)作為基礎
如何處理 Big Data
- 分散式處理的力量
使用MapReduce處理數據
- 如何逐步挑選數據
聚類在大規模分散式處理中的作用
- 體系結構概述
- 聚類方法
使用 YARN 對數據和流程進行集群
非關係型Database在大數據存儲中的作用
使用 Hadoop 的非關係資料庫:HBase
數據倉庫體系結構概述
使用 Hive 管理數據倉庫
從 Shell-Scripts 運行 Hadoop
使用 Hadoop 流式處理
其他 Hadoop 工具和實用程式
開始 Hadoop 專案
- 揭開複雜性的神秘面紗
將現有項目移至 Hadoop
- 基礎結構注意事項
- 超出分配的資源進行擴展
Hadoop 專案利益相關者及其工具包
- 開發人員、數據科學家、業務分析師和項目經理
Hadoop 作為新技術和新方法的基礎
閉幕致辭
最低要求
- 對程式設計有大致的瞭解
- 對資料庫的理解
- 基礎知識 Linux
客戶評論 (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Course - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay