課程簡介

介紹

本節概述了何時使用“機器學習”,應考慮什麼以及它意味著什麼,包括優缺點。數據類型(結構化/非結構化/靜態/流),數據有效性/數量,數據驅動與用戶驅動分析,統計模型與機器學習模型/無監督學習的挑戰,偏差-方差權衡,反覆運算/評估,交叉驗證方法,監督/無監督/強化。

主要議題

1. 理解樸素貝葉斯

  • 貝葉斯方法的基本概念
  • 概率
  • 聯合概率
  • 使用貝葉斯定理的條件概率
  • 樸素貝葉斯算法
  • 樸素貝葉斯分類
  • 拉普拉斯估計器
  • 在樸素貝葉斯中使用數值特徵

2. 了解決策樹

  • 分而治之
  • C5.0決策樹算法
  • 選擇最佳分割點
  • 決策樹剪枝

3. 了解神經網路

  • 從生物神經元到人工神經元
  • 激活函數
  • 網絡拓撲結構
  • 層數
  • 信息傳遞方向
  • 每層節點數
  • 使用反向傳播訓練神經網絡
  • Deep Learning

4. 了解支援向量機

  • 使用超平面進行分類
  • 尋找最大邊界
  • 線性可分數據的情況
  • 非線性可分數據的情況
  • 在非線性空間中使用核函數

5. 瞭解聚類

  • 聚類作為機器學習任務
  • k-means聚類算法
  • 使用距離分配和更新聚類
  • 選擇適當的聚類數目

6. 分類性能的衡量

  • 處理分類預測數據
  • 深入瞭解混淆矩陣
  • 使用混淆矩陣衡量性能
  • 超越準確性——其他性能指標
  • kappa統計量
  • 靈敏度和特異性
  • 精確率和召回率
  • F-measure
  • 可視化性能權衡
  • ROC曲線
  • 估計未來性能
  • 保留方法
  • 交叉驗證
  • Bootstrap 採樣

7. 調整庫存模型以獲得更好的性能

  • 使用caret進行自動參數調優
  • 創建簡單的調優模型
  • 自定義調優過程
  • 使用元學習提升模型性能
  • 理解集成方法
  • Bagging
  • Boosting
  • 隨機森林
  • 訓練隨機森林
  • 評估隨機森林性能

次要主題

8. 瞭解使用最近鄰的分類

  • kNN算法
  • 計算距離
  • 選擇適當的k值
  • 為kNN準備數據
  • 為什麼kNN算法是懶惰的?

9. 了解分類規則

  • 分而治之
  • One Rule算法
  • RIPPER算法
  • 從決策樹中提取規則

10. 了解回歸

  • 簡單線性回歸
  • 普通最小二乘估計
  • 相關性
  • 多元線性回歸

11. 了解回歸樹和模型樹

  • 在樹中添加回歸

12. 了解關聯規則

  • 用於關聯規則學習的Apriori算法
  • 衡量規則的興趣度——支持度和置信度
  • 使用Apriori原則構建規則集

額外

  • Spark/PySpark/MLlib 與多臂老虎機

最低要求

Python 知識

 21 時間:

人數


每位參與者的報價

客戶評論 (7)

Upcoming Courses

課程分類