課程簡介

介紹

本節概述了何時使用“機器學習”,應考慮什麼以及它意味著什麼,包括優缺點。數據類型(結構化/非結構化/靜態/流),數據有效性/數量,數據驅動與用戶驅動分析,統計模型與機器學習模型/無監督學習的挑戰,偏差-方差權衡,反覆運算/評估,交叉驗證方法,監督/無監督/強化。

主要議題

1. 理解樸素貝葉斯

  • 貝葉斯方法的基本概念
  • 概率
  • 聯合概率
  • 貝葉斯定理的條件概率
  • 樸素貝葉斯演算法
  • 樸素貝葉斯分類
  • 拉普拉斯估計器
  • 將數值特徵與樸素貝葉斯結合使用

2. 了解決策樹

  • 分而治之
  • C5.0 決策樹演算法
  • 選擇最佳拆分
  • 修剪決策樹

3. 了解神經網路

  • 從生物神經元到人工神經元
  • 啟動函數
  • 網路拓撲
  • 層數
  • 信息傳播的方向
  • 每層中的節點數
  • 使用反向傳播訓練神經網路
  • Deep Learning

4. 了解支援向量機

  • 超平面分類
  • 找到最大邊距
  • 線性可分數據的情況
  • 非線性可分數據的情況
  • 將核用於非線性空間

5. 瞭解聚類

  • 聚類作為機器學習任務
  • 聚類的 k 均值演算法
  • 使用距離分配和更新聚類
  • 選擇適當數量的集群

6. 分類性能的衡量

  • 使用分類預測數據
  • 仔細觀察混淆矩陣
  • 使用混淆矩陣來衡量性能
  • 超越準確性 – 其他性能衡量標準
  • 河童統計
  • 敏感性和特異性
  • 精度和召回率
  • F 度量
  • 可視化性能權衡
  • ROC 曲線
  • 估計未來表現
  • 維持方法
  • 交叉驗證
  • Bootstrap 採樣

7. 調整庫存模型以獲得更好的性能

  • 使用插入符號進行自動參數調整
  • 創建簡單的優化模型
  • 自訂調優過程
  • 通過元學習提高模型性能
  • 瞭解融合
  • 裝袋
  • 提高
  • 隨機森林
  • 訓練隨機森林
  • 評估隨機林性能

次要主題

8. 瞭解使用最近鄰的分類

  • kNN 演算法
  • 計算距離
  • 選擇合適的 k
  • 準備用於 kNN 的數據
  • 為什麼 kNN 演算法很懶?

9. 了解分類規則

  • 分離和征服
  • 單規則演算法
  • 開膛手演算法
  • 決策樹中的規則

10. 了解回歸

  • 簡單線性回歸
  • 普通最小二乘估計
  • 相關性
  • 多元線性回歸

11. 了解回歸樹和模型樹

  • 向樹添加回歸

12. 了解關聯規則

  • 用於關聯規則學習的先驗演算法
  • 衡量規則興趣 – 支援和信心
  • 使用先驗原則構建一組規則

額外

  • 火花/PySpark/MLlib 和多臂匪徒
  21 時間:
 

人數


開始於

結束於


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

客戶評論 (5)

相關課程

課程分類