課程簡介
Machine Learning 介紹
- 機器學習的類型 – 監督式與非監督式
- 從統計學習到機器學習
- 數據挖掘的工作流程:業務理解、數據準備、建模、部署
- 為任務選擇合適的算法
- 過擬合與偏差-方差權衡
Python 和 ML 函式庫概述
- 為何使用程式語言進行機器學習
- 在 R 和 Python 之間選擇
- Python 速成課程與 Jupyter Notebooks
- Python 函式庫:pandas、NumPy、scikit-learn、matplotlib、seaborn
測試與評估機器學習算法
- 泛化、過擬合與模型驗證
- 評估策略:保留法、交叉驗證、自助法
- 回歸的評估指標:ME、MSE、RMSE、MAPE
- 分類的評估指標:準確率、混淆矩陣、不平衡類別
- 模型性能可視化:利潤曲線、ROC 曲線、提升曲線
- 模型選擇與網格搜索調參
數據準備
- 在 Python 中導入與儲存數據
- 探索性分析與摘要統計
- 處理缺失值與異常值
- 標準化、正規化與轉換
- 定性數據重新編碼與使用 pandas 進行數據整理
分類算法
- 二元分類與多元分類
- 邏輯回歸與判別函數
- 樸素貝葉斯、k-近鄰
- 決策樹:CART、Random Forests、Bagging、Boosting、XGBoost
- 支持向量機與核函數
- 集成學習技術
回歸與數值預測
- 最小二乘法與變量選擇
- 正則化方法:L1、L2
- 多項式回歸與非線性模型
- 回歸樹與樣條
Neural Networks
- 神經網絡與深度學習介紹
- 激活函數、層與反向傳播
- 多層感知器 (MLP)
- 使用 TensorFlow 或 PyTorch 進行基本神經網絡建模
- 神經網絡用於分類與回歸
銷售 Forecasting 與 Predictive Analytics
- 時間序列與基於回歸的預測
- 處理季節性與趨勢數據
- 使用機器學習技術構建銷售預測模型
- 評估預測準確性與不確定性
- Business 結果解釋與溝通
Unsupervised Learning
- 聚類技術:k-means、k-medoids、層次聚類、SOMs
- 降維:PCA、因子分析、SVD
- 多維尺度分析
文本挖掘
- 文本預處理與分詞
- 詞袋模型、詞幹提取與詞形還原
- 情感分析與詞頻分析
- 使用詞雲可視化文本數據
推薦系統
- 基於用戶與基於項目的協同過濾
- 設計與評估推薦引擎
關聯模式挖掘
- 頻繁項集與 Apriori 算法
- 市場籃子分析與提升比
異常檢測
- 極值分析
- 基於距離與基於密度的方法
- 高維數據中的異常檢測
Machine Learning 案例研究
- 理解業務問題
- 數據預處理與特徵工程
- 模型選擇與參數調優
- 評估與結果展示
- 部署
總結與下一步
最低要求
- 具備機器學習的基本知識,例如監督式學習和非監督式學習
- 熟悉Python編程(變量、循環、函數)
- 有使用pandas或NumPy等庫處理數據的經驗會有幫助,但不是必須的
- 不需要具備高級建模或神經網絡的經驗
目標受眾
- 數據科學家
- Business分析師
- 處理數據的軟件工程師和技術專業人員
客戶評論 (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Course - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.