課程簡介

    機器學習簡介 機器學習的類型——監督學習與無監督學習 從統計學習到機器學習 資料挖掘工作流: 業務理解 數據理解 數據準備 造型 評估 部署 機器學習演算法 為問題選擇適當的演算法 ML 中的過擬合和偏差-方差權衡 ML 庫和程式設計語言 為什麼要使用程式設計語言 在 R 和 Python 之間進行選擇 Python 速成班 Python 資源 用於機器學習的 Python 庫 Jupyter 筆記本和互動式編碼 測試 ML 演算法 泛化和過擬合 避免過擬合 Holdout 方法 交叉驗證 引導 評估數值預測 精度測量:ME、MSE、RMSE、MAPE 參數和預測穩定性 評估分類演算法 準確性及其問題 混淆矩陣 班級不平衡問題 可視化模型性能 利潤曲線 ROC曲線 提升曲線 選型 模型調優 - 網格搜索策略 Python 中的示例 數據準備 數據導入和存儲 了解數據 - 基本探索 使用 pandas 庫進行數據操作 數據轉換 – 數據整理 探索性分析 缺失觀測值 – 檢測和解決方案 異常值 – 檢測和策略 標準化、規範化、二值化 定性數據重新編碼 Python 中的示例 分類 二元類與多類分類 通過數學函數進行分類 線性判別函數 二次判別函數 Logistic回歸和概率方法 k 最近鄰 樸素貝葉斯 決策樹 車 裝袋 Random Forest秒 提高 Xgboost的 支援向量機和內核 最大邊距分類器 支援向量機 集成學習 Python 中的示例 回歸和數值預測 最小二乘估計 變數選擇技術 正則化和穩定性 - L1、L2 非線性和廣義最小二乘法 多項式回歸 回歸樣條曲線 回歸樹 Python 中的示例 無監督學習 聚類 基於質心的聚類 – k-means、k-medoids、PAM、CLARA 分層聚類 – Diana, Agnes 基於模型的聚類 - EM 自組織地圖 集群評估和評估 降維 主成分分析和因數分析 奇異值分解 多維擴展 Python 中的示例 文本挖掘 預處理數據 詞袋模型 詞幹提取和詞形還原 分析詞頻 情緒分析 創建詞雲 Python 中的示例 推薦引擎和協同過濾 推薦數據 基於使用者的協同過濾 基於專案的協同篩選 Python 中的示例 關聯模式挖掘 頻繁項集演算法 市場籃子分析 Python 中的示例 異常值分析 極值分析 基於距離的異常值檢測 基於密度的方法 高維異常值檢測 Python 中的示例 機器學習案例研究 業務問題理解 數據預處理 演算法選擇和調優 對結果的評價 部署

 

 

最低要求

對 Machine Learning 基礎知識的知識和認識

  21 時間:
 

人數


開始於

結束於


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

客戶評論 (3)

相關課程

課程分類