課程簡介

  • 第 1 部分:Big Data 和 NoSQL 簡介
    • Big Data 生態系統
    • NoSQL 概述
    • CAP定理
    • 何時 NoSQL 合適
    • 列式存儲
    • HBase 和 NoSQL
  • 第2部分:HBase 介紹
    • 概念和設計
    • 體系結構(HMaster 和區域伺服器)
    • 數據完整性
    • HBase 生態系統
    • 實驗室:探索 HBase
  • 第3部分:HBase 數據模型
    • 命名空間、表和區域
    • 行、列、列族、版本
    • HBase Shell 和管理命令
    • 實驗室 : HBase Shell
  • 第 3 部分:Access使用 Java API 處理 HBase
    • Java API 簡介
    • 讀/寫路徑
    • 時序數據
    • 掃描
    • Map Reduce(地圖縮減)
    • 過濾器
    • 計數器
    • 協處理器
    • 實驗室(多個):使用 HBase Java API 實現  時間序列、Map Reduce、過濾器和計數器。
  • 第 4 部分:HBase 模式設計:小組會議
    • 向學生展示真實世界的用例
    • 學生分組提出設計解決方案
    • 討論/批評並從多種設計中學習
    • 實驗室:在 HBase 中實現方案
  • 第 5 部分:HBase 內部結構
    • 瞭解 HBase 的底層
    • Memfile / HFile / WAL
    • HDFS 存儲
    • 壓實
    • 分裂
    • 泛光濾鏡
    • 緩存
    • 診斷
  • 第 6 部分:HBase 安裝和配置
    • 硬體選型
    • Install 方法
    • 常用配置
    • 實驗室:安裝 HBase
  • 第 7 部分:HBase 生態系統
    • 使用 HBase 開發應用程式
    • 與其他 Hadoop 堆棧交互(MapReduce、Pig、Hive)
    • 圍繞 HBase 的框架
    • 進階概念(協處理器)
    • 實驗室:編寫 HBase 應用程式
  • 第 8 部分:監控和最佳實踐
    • 監測工具和做法
    • 優化 HBase
    • 雲中的 HBase
    • HBase 的真實用例
    • 實驗室:檢查 HBase 生命體征

最低要求

  • 熟悉Java程式設計語言
  • 熟悉 Java 程式設計語言(導航Linux 命令行,使用 vi / nano 編輯檔)
  • 像 Eclipse 或 IntelliJ 這樣的 Java IDE

實驗室環境:

將為學生提供一個有效的 HBase 集群。學生需要一個SSH用戶端和一個瀏覽器來訪問集群。

零安裝:無需在學生機器上安裝HBase軟體!

  21 時間:
 

人數


開始於

結束於


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

相關課程

A Practical Introduction to NoSQL Databases

  28 時間:

課程分類