課程簡介

AI增強的Kubernetes操作簡介

  • AI在現代集羣操作中的重要性
  • 傳統擴展和調度邏輯的侷限性
  • 資源管理中的機器學習關鍵概念

Kubernetes資源管理基礎

  • CPU、GPU和內存分配基礎
  • 瞭解配額、限制和請求
  • 識別瓶頸和低效問題

調度的機器學習方法

  • 用於工作負載放置的監督和無監督模型
  • 資源需求的預測算法
  • 在自定義調度器中使用ML功能

強化學習在智能自動擴展中的應用

  • RL代理如何從集羣行爲中學習
  • 設計效率獎勵函數
  • 構建RL驅動的自動擴展策略

使用指標和遙測進行預測性自動擴展

  • 使用Prometheus數據進行預測
  • 將時間序列模型應用於自動擴展
  • 評估預測準確性並調整模型

實現AI驅動的優化工具

  • 將ML框架與Kubernetes控制器集成
  • 部署智能控制循環
  • 擴展KEDA以支持AI輔助決策

成本與性能優化策略

  • 通過預測性擴展降低計算成本
  • 使用ML驅動的放置提高GPU利用率
  • 平衡延遲、吞吐量和效率

實際場景與真實用例

  • 使用AI自動擴展高負載應用
  • 優化異構節點池
  • 將ML應用於多租戶環境

總結與下一步

最低要求

  • 對Kubernetes基礎知識的理解
  • 具備容器化應用部署的經驗
  • 熟悉集羣操作和資源管理

受衆

  • 從事大規模分佈式系統工作的SRE
  • 管理高需求工作負載的Kubernetes操作員
  • 優化計算基礎設施的平臺工程師
 21 時間:

人數


每位參與者的報價

客戶評論 (5)

即將到來的課程

課程分類