課程簡介

數據倉庫基礎

  • 倉庫的目的、組件和架構
  • 數據集市、企業倉庫和湖倉模式
  • OLTP與OLAP基礎及工作負載分離

維度建模

  • 事實、維度和粒度
  • 星型模式與雪花模式
  • 緩慢變化維度的類型及處理

ETL與ELT流程

  • 從OLTP和API提取數據的策略
  • 轉換、數據清洗和一致性
  • 加載模式、編排和依賴管理

數據質量與元數據管理

  • 數據剖析和驗證規則
  • 主數據和參考數據的對齊
  • 數據血緣、目錄和文檔管理

分析與性能

  • 立方體概念、聚合和物化視圖
  • 分區、聚類和索引以優化分析
  • 工作負載管理、緩存和查詢調優

安全與治理

  • 訪問控制、角色和行級安全
  • 合規性考慮和審計
  • 備份、恢復和可靠性實踐

現代架構

  • 雲數據倉庫和彈性擴展
  • 流式數據攝取和近即時分析
  • 成本優化和監控

結業項目:從源數據到星型模式

  • 將業務流程建模爲事實和維度
  • 構建端到端的ETL或ELT工作流
  • 發佈儀表板並驗證指標

總結與下一步

最低要求

  • 瞭解關係型數據庫和SQL
  • 具備數據分析或報告經驗
  • 對雲或本地數據平臺有基本瞭解

受衆

  • 從數據分析師轉向數據倉庫的人員
  • BI開發人員和ETL工程師
  • 數據架構師和團隊負責人
 35 時間:

人數


每位參與者的報價

客戶評論 (5)

即將到來的課程

課程分類