聯繫我們

課程簡介

大數據生態系統簡介

  • 大數據技術與架構概覽
  • 批次處理與實時處理之比較
  • 具備擴展性的資料儲存策略

使用 Apache Spark 進行進階資料處理

  • 優化 Spark 工作以達成高效能
  • 進階轉換與動作操作
  • 處理結構化資料串流

大規模機器學習

  • 分散式模型訓練技術
  • 在大資料集上進行超參數調優
  • 於大數據環境中部署模型

針對大數據的深度學習

  • 將 TensorFlow 與 PyTorch 整合至 Spark
  • 分散式深度學習訓練管線
  • 影像、文本及時間序列分析的應用案例

實時分析與資料串流

  • 使用 Apache Kafka 進行串流資料擷取
  • 串流處理架構
  • 實時系統的監控與警報機制

資料治理、安全與倫理

  • 資料隱私與合規要求
  • 大數據系統中的存取控制與加密
  • 大規模分析中的倫理考量

將大數據整合至商業智慧

  • 大數據的資料視覺化與儀表板開發
  • 將大數據管線連接至 BI 工具
  • 透過進階分析驅動業務成果

總結與後續步驟

最低要求

  • 具備堅實的資料分析及統計建模概念基礎
  • 擁有使用 Python, R 或 Scala 等程式語言及資料處理工具的經驗
  • 熟悉 Hadoop 或 Spark 等分散式運算架構

對象

  • 致力於掌握大規模資料處理及預測分析的法學士
  • 尋求設計並實施進階分析工作流程的高階分析師
  • 專注於創新數據驅動解決方案的研究開發專業人員
 42 小時

人數


每位參與者的報價

客戶評論 (2)

即將到來的課程

課程分類