課程簡介

介紹

  • Kubeflow GCK、本地和其他公有雲供應商

GCP 上的 Kubeflow 功能概述

  • 資源的聲明式管理
  • 適用於機器學習 (ML) 工作負載的 GKE 自動擴展
  • 與 Jupyter 的安全連接
  • 用於調試和故障排除的持久性日誌
  • GPU 和 TPU 可加速工作負載

環境設置概述

  • 虛擬機準備
  • Kubernetes 集群設置
  • Kubeflow 安裝

部署 Kubeflow

  • 部署 Kubeflow on GCP
  • 在本地和雲環境中部署 Kubeflow
  • 在 GKE 上部署 Kubeflow
  • 在 GKE 上設置自訂域

GCP 上的管道

  • 設置端到端 Kubeflow 管道
  • 自訂 Kubeflow 流水線

保護 Kubeflow 群集

  • 設置身份驗證和授權
  • 使用 VPC 服務控制和私有 GKE

存儲、Accessing、管理數據

  • 瞭解共用檔案系統與網路連線儲存 (NAS)
  • 在 GCE 中使用託管檔案存儲服務

運行 ML 訓練作業

  • 訓練 MNIST 模型

管理 Kubeflow

  • 日誌記錄和監視

故障排除

總結和結論

最低要求

  • 對機器學習概念的理解。
  • 瞭解雲計算概念。
  • 對容器 (Docker) 和編排 (Kubernetes) 有大致的瞭解。
  • 一些 Python 程式設計經驗是有説明的。
  • 具有使用命令行的經驗。

觀眾

  • 數據科學工程師。
  • DevOps 對機器學習模型部署感興趣的工程師。
  • 對機器學習模型部署感興趣的基礎結構工程師。
  • 希望將機器學習功能與其應用程式自動集成和部署的軟體工程師。
  28 時間:
 

人數


開始於

結束於


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

客戶評論 (2)

相關課程

課程分類