課程簡介

Apache Airflow機器學習入門

  • Apache Airflow概述及其在數據科學中的重要性
  • 自動化機器學習工作流的關鍵功能
  • 爲數據科學項目設置Airflow

使用Airflow構建機器學習管道

  • 設計端到端機器學習工作流的DAGs
  • 使用操作符進行數據攝取、預處理和特徵工程
  • 調度和管理管道依賴關係

模型訓練與驗證

  • 使用Airflow自動化模型訓練任務
  • 將Airflow與機器學習框架(如TensorFlow、PyTorch)集成
  • 驗證模型並存儲評估指標

模型部署與監控

  • 使用自動化管道部署機器學習模型
  • 使用Airflow任務監控已部署的模型
  • 處理重新訓練和模型更新

高級定製與集成

  • 開發用於機器學習任務的定製操作符
  • 將Airflow與雲平臺和機器學習服務集成
  • 使用插件和傳感器擴展Airflow工作流

優化與擴展機器學習管道

  • 提高大規模數據的工作流性能
  • 使用Celery和Kubernetes擴展Airflow部署
  • 生產級機器學習工作流的最佳實踐

案例研究與實際應用

  • 使用Airflow進行機器學習自動化的實際案例
  • 實踐練習:構建端到端機器學習管道
  • 討論機器學習工作流管理中的挑戰與解決方案

總結與下一步

最低要求

  • 熟悉機器學習工作流和概念
  • 對Apache Airflow的基本瞭解,包括DAG和操作符
  • 熟練掌握Python編程

受衆

  • 數據科學家
  • 機器學習工程師
  • AI開發者
 21 時間:

人數


每位參與者的報價

即將到來的課程

課程分類