課程簡介

Apache Iceberg 簡介

  • Apache Iceberg 概述
  • 基本概念回顧

深入探討 Iceberg 架構

  • 深入分析 Iceberg 的表格式
  • 詳細架構概述,包括元數據和文件佈局
  • 模式和分區演化的內部機制

高級安裝與配置

  • 在不同環境中配置 Iceberg 以實現最佳性能
  • 與各種數據處理引擎集成
  • 高級設置:安全性、加密和訪問控制
  • 在分佈式環境中設置 Iceberg

高級操作與維護

  • 管理大規模 Iceberg 表
  • 實施和管理複雜的模式變更
  • 處理分區演化和隱藏分區
  • 結合模式和分區變化的高級 CRUD 操作

查詢優化技術

  • 減少查詢延遲的技術
  • 分區剪枝和文件剪枝
  • 元數據緩存和優化策略
  • 實施和測試查詢優化技術

大規模數據集的性能調優

  • 優化大規模數據集的性能
  • 使用 Iceberg 內置功能進行性能調優
  • 真實場景中的性能調優案例研究
  • 大規模數據集的性能調優

高級數據遷移與集成

  • 從其他系統遷移複雜數據結構
  • 將 Iceberg 與即時數據流集成
  • 遷移複雜數據集並集成即時數據流

可靠性與一致性

  • 在分佈式環境中確保數據一致性和完整性
  • 實施和管理事務保證
  • 處理故障和恢復機制
  • 實施可靠性和一致性功能

高級功能與定製

  • 自定義目錄實現
  • 使用自定義功能擴展 Iceberg
  • 實現自定義目錄並擴展 Iceberg 功能

數據治理與合規性

  • 實施數據治理策略
  • 遵守數據法規
  • 管理審計跟蹤和數據血緣
  • 實施治理和合規性功能

總結與下一步

最低要求

  • 熟悉核心概念、基本操作以及Iceberg表管理

受衆

  • 數據工程師
  • 數據架構師
  • 數據分析師
  • 軟件開發人員
 21 時間:

人數


每位參與者的報價

客戶評論 (5)

即將到來的課程

課程分類