感謝您提交詢問!我們的一位團隊成員將在短時間內與您聯繫。
感謝您提交預訂!我們的一位團隊成員將在短時間內與您聯繫。
課程簡介
Apache Iceberg 簡介
- Apache Iceberg 概述
- 基本概念回顧
深入探討 Iceberg 架構
- 深入分析 Iceberg 的表格式
- 詳細架構概述,包括元數據和文件佈局
- 模式和分區演化的內部機制
高級安裝與配置
- 在不同環境中配置 Iceberg 以實現最佳性能
- 與各種數據處理引擎集成
- 高級設置:安全性、加密和訪問控制
- 在分佈式環境中設置 Iceberg
高級操作與維護
- 管理大規模 Iceberg 表
- 實施和管理複雜的模式變更
- 處理分區演化和隱藏分區
- 結合模式和分區變化的高級 CRUD 操作
查詢優化技術
- 減少查詢延遲的技術
- 分區剪枝和文件剪枝
- 元數據緩存和優化策略
- 實施和測試查詢優化技術
大規模數據集的性能調優
- 優化大規模數據集的性能
- 使用 Iceberg 內置功能進行性能調優
- 真實場景中的性能調優案例研究
- 大規模數據集的性能調優
高級數據遷移與集成
- 從其他系統遷移複雜數據結構
- 將 Iceberg 與即時數據流集成
- 遷移複雜數據集並集成即時數據流
可靠性與一致性
- 在分佈式環境中確保數據一致性和完整性
- 實施和管理事務保證
- 處理故障和恢復機制
- 實施可靠性和一致性功能
高級功能與定製
- 自定義目錄實現
- 使用自定義功能擴展 Iceberg
- 實現自定義目錄並擴展 Iceberg 功能
數據治理與合規性
- 實施數據治理策略
- 遵守數據法規
- 管理審計跟蹤和數據血緣
- 實施治理和合規性功能
總結與下一步
最低要求
- 熟悉核心概念、基本操作以及Iceberg表管理
受衆
- 數據工程師
- 數據架構師
- 數據分析師
- 軟件開發人員
21 時間:
客戶評論 (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
課程 - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
課程 - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
課程 - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
課程 - Apache Spark in the Cloud
practice tasks