課程簡介

介紹

  • 專案團隊採用的原因和方式 Hadoop
  • 一切是如何開始的
  • 項目經理在 Hadoop 專案中的角色

瞭解 Hadoop 的架構和關鍵概念

  • HDFS的
  • MapReduce的
  • Hadoop 生態系統的其他部分

什麼是 Big Data?

不同的存儲方法 Big Data

HDFS(Hadoop 分散式文件系統)作為基礎

如何處理 Big Data

  • 分散式處理的力量

使用MapReduce處理數據

  • 如何逐步挑選數據

聚類在大規模分散式處理中的作用

  • 體系結構概述
  • 聚類方法

使用 YARN 對數據和流程進行集群

非關係型Database在大數據存儲中的作用

使用 Hadoop 的非關係資料庫:HBase

數據倉庫體系結構概述

使用 Hive 管理數據倉庫

從 Shell-Scripts 運行 Hadoop

使用 Hadoop 流式處理

其他 Hadoop 工具和實用程式

開始 Hadoop 專案

  • 揭開複雜性的神秘面紗

將現有項目移至 Hadoop

  • 基礎結構注意事項
  • 超出分配的資源進行擴展

Hadoop 專案利益相關者及其工具包

  • 開發人員、數據科學家、業務分析師和項目經理

Hadoop 作為新技術和新方法的基礎

閉幕致辭

最低要求

  • 對程式設計有大致的瞭解
  • 對資料庫的理解
  • 基礎知識 Linux
  14 時間:

人數


開始於

結束於


Dates are subject to availability and take place between 09:30 and 16:30.

每位參與者的報價

客戶評論 (3)

相關課程

課程分類