感謝您提交詢問!我們的一位團隊成員將在短時間內與您聯繫。
感謝您提交預訂!我們的一位團隊成員將在短時間內與您聯繫。
課程簡介
AIOps 入門:開源工具
- AIOps 概念與優勢概述。
- Prometheus 和 Grafana 在可觀察性棧中的作用。
- ML 在 AIOps 中的定位:預測性與反應式分析之別。
搭建 Prometheus 和 Grafana
- 安裝並配置 Prometheus 用於時間序列數據採集。
- 使用實時指標在 Grafana 中創建儀表板。
- 探索 Exporter、重新標註和服務發現機制。
機器學習的數據預處理
- 提取並轉換 Prometheus 指標。
- 準備用於異常檢測與預測的數據集。
- 使用 Grafana 的轉換功能或 Python 管道。
應用機器學習進行異常檢測
- 基礎 ML 模型用於離群值檢測(例如:孤立森林、One-Class SVM)。
- 在時間序列數據上訓練與評估模型。
- 在 Grafana 儀表板中可視化異常現象。
使用 ML 進行指標預測
- 構建簡單的預測模型(ARIMA、Prophet、LSTM 入門)。
- 預測系統負載或資源使用情況。
- 利用預測結果進行早期告警與擴展決策。
將 ML 整合至告警與自動化
- 定義基於 ML 輸出或閾值的告警規則。
- 使用 Alertmanager 及通知路由機制。
- 觸發腳本或自動化工作流以響應異常檢測。
擴展與運營 AIOps
- 整合外部可觀察性工具(例如:ELK 棧、Moogsoft、Dynatrace)。
- 將 ML 模型應用於可觀察性管道中。
- AIOps 大規模實施的最佳實踐。
總結與後續步驟
最低要求
- 理解系統監控與可觀察性概念。
- 有使用 Grafana 或 Prometheus 的經驗。
- 熟悉 Python 和基礎機器學習原理。
適用對象
- 可觀察性工程師。
- 基礎設施與 DevOps 團隊。
- 監控平台架構師與站點可靠性工程師 (SREs)。
14 小時