課程簡介

Machine Learning 介紹

  • 機器學習的類型 – 監督式與非監督式
  • 從統計學習到機器學習
  • 數據挖掘的工作流程:業務理解、數據準備、建模、部署
  • 為任務選擇合適的算法
  • 過擬合與偏差-方差權衡

Python 和 ML 函式庫概述

  • 為何使用程式語言進行機器學習
  • 在 R 和 Python 之間選擇
  • Python 速成課程與 Jupyter Notebooks
  • Python 函式庫:pandas、NumPy、scikit-learn、matplotlib、seaborn

測試與評估機器學習算法

  • 泛化、過擬合與模型驗證
  • 評估策略:保留法、交叉驗證、自助法
  • 回歸的評估指標:ME、MSE、RMSE、MAPE
  • 分類的評估指標:準確率、混淆矩陣、不平衡類別
  • 模型性能可視化:利潤曲線、ROC 曲線、提升曲線
  • 模型選擇與網格搜索調參

數據準備

  • 在 Python 中導入與儲存數據
  • 探索性分析與摘要統計
  • 處理缺失值與異常值
  • 標準化、正規化與轉換
  • 定性數據重新編碼與使用 pandas 進行數據整理

分類算法

  • 二元分類與多元分類
  • 邏輯回歸與判別函數
  • 樸素貝葉斯、k-近鄰
  • 決策樹:CART、Random Forests、Bagging、Boosting、XGBoost
  • 支持向量機與核函數
  • 集成學習技術

回歸與數值預測

  • 最小二乘法與變量選擇
  • 正則化方法:L1、L2
  • 多項式回歸與非線性模型
  • 回歸樹與樣條

Neural Networks

  • 神經網絡與深度學習介紹
  • 激活函數、層與反向傳播
  • 多層感知器 (MLP)
  • 使用 TensorFlow 或 PyTorch 進行基本神經網絡建模
  • 神經網絡用於分類與回歸

銷售 Forecasting 與 Predictive Analytics

  • 時間序列與基於回歸的預測
  • 處理季節性與趨勢數據
  • 使用機器學習技術構建銷售預測模型
  • 評估預測準確性與不確定性
  • Business 結果解釋與溝通

Unsupervised Learning

  • 聚類技術:k-means、k-medoids、層次聚類、SOMs
  • 降維:PCA、因子分析、SVD
  • 多維尺度分析

文本挖掘

  • 文本預處理與分詞
  • 詞袋模型、詞幹提取與詞形還原
  • 情感分析與詞頻分析
  • 使用詞雲可視化文本數據

推薦系統

  • 基於用戶與基於項目的協同過濾
  • 設計與評估推薦引擎

關聯模式挖掘

  • 頻繁項集與 Apriori 算法
  • 市場籃子分析與提升比

異常檢測

  • 極值分析
  • 基於距離與基於密度的方法
  • 高維數據中的異常檢測

Machine Learning 案例研究

  • 理解業務問題
  • 數據預處理與特徵工程
  • 模型選擇與參數調優
  • 評估與結果展示
  • 部署

總結與下一步

最低要求

  • 具備機器學習的基本知識,例如監督式學習和非監督式學習
  • 熟悉Python編程(變量、循環、函數)
  • 有使用pandas或NumPy等庫處理數據的經驗會有幫助,但不是必須的
  • 不需要具備高級建模或神經網絡的經驗

目標受眾

  • 數據科學家
  • Business分析師
  • 處理數據的軟件工程師和技術專業人員
 28 時間:

人數


每位參與者的報價

客戶評論 (2)

Upcoming Courses

課程分類