課程簡介
介紹
本節概述了何時使用“機器學習”,應考慮什麼以及它意味著什麼,包括優缺點。數據類型(結構化/非結構化/靜態/流),數據有效性/數量,數據驅動與用戶驅動分析,統計模型與機器學習模型/無監督學習的挑戰,偏差-方差權衡,反覆運算/評估,交叉驗證方法,監督/無監督/強化。
主要議題
1. 理解樸素貝葉斯
- 貝葉斯方法的基本概念
- 概率
- 聯合概率
- 貝葉斯定理的條件概率
- 樸素貝葉斯演算法
- 樸素貝葉斯分類
- 拉普拉斯估計器
- 將數值特徵與樸素貝葉斯結合使用
2. 了解決策樹
- 分而治之
- C5.0 決策樹演算法
- 選擇最佳拆分
- 修剪決策樹
3. 了解神經網路
- 從生物神經元到人工神經元
- 啟動函數
- 網路拓撲
- 層數
- 信息傳播的方向
- 每層中的節點數
- 使用反向傳播訓練神經網路
- Deep Learning
4. 了解支援向量機
- 超平面分類
- 找到最大邊距
- 線性可分數據的情況
- 非線性可分數據的情況
- 將核用於非線性空間
5. 瞭解聚類
- 聚類作為機器學習任務
- 聚類的 k 均值演算法
- 使用距離分配和更新聚類
- 選擇適當數量的集群
6. 分類性能的衡量
- 使用分類預測數據
- 仔細觀察混淆矩陣
- 使用混淆矩陣來衡量性能
- 超越準確性 – 其他性能衡量標準
- 河童統計
- 敏感性和特異性
- 精度和召回率
- F 度量
- 可視化性能權衡
- ROC 曲線
- 估計未來表現
- 維持方法
- 交叉驗證
- Bootstrap 採樣
7. 調整庫存模型以獲得更好的性能
- 使用插入符號進行自動參數調整
- 創建簡單的優化模型
- 自訂調優過程
- 通過元學習提高模型性能
- 瞭解融合
- 裝袋
- 提高
- 隨機森林
- 訓練隨機森林
- 評估隨機林性能
次要主題
8. 瞭解使用最近鄰的分類
- kNN 演算法
- 計算距離
- 選擇合適的 k
- 準備用於 kNN 的數據
- 為什麼 kNN 演算法很懶?
9. 了解分類規則
- 分離和征服
- 單規則演算法
- 開膛手演算法
- 決策樹中的規則
10. 了解回歸
- 簡單線性回歸
- 普通最小二乘估計
- 相關性
- 多元線性回歸
11. 了解回歸樹和模型樹
- 向樹添加回歸
12. 了解關聯規則
- 用於關聯規則學習的先驗演算法
- 衡量規則興趣 – 支援和信心
- 使用先驗原則構建一組規則
額外
- 火花/PySpark/MLlib 和多臂匪徒
客戶評論 (5)
保持簡短和簡單。 圍繞概念創建直覺和視覺模型(決策樹圖、線性方程、手動計算y_pred以證明模型的工作原理)。
Nicolae - DB Global Technology
Course - Machine Learning
機器翻譯
它説明我實現了理解ML的目標。非常尊重 Pablo 在這個主題上給出適當的介紹,因為經過 3 天的培訓后,這個主題變得非常廣泛。我也很喜歡你提供的虛擬機的想法,它的延遲非常好!它允許每個專家按照自己的節奏進行實驗。
Silviu - DB Global Technology
Course - Machine Learning
機器翻譯
The way practical part, seeing the theory materializing into something practical is great.
Lisa Fekade - Vodacom
Course - Machine Learning
It's just great that all material including the exercises is on the same page and then it gets updated on the fly. The solution is revealed at the end. Cool! Also, I do appreciate that Krzysztof took extra effort to understand our problems and suggested us possible techniques.
Attila Nagy - L M ERICSSON LIMITED
Course - Machine Learning
I liked the lab exercises.