課程簡介

介紹

  • 了解數據準備在分析和機器學習中的重要性
  • 數據準備管道及其在數據生命週期中的作用
  • 探索原始數據中的常見挑戰及其對分析的影響

數據收集和獲取

  • 數據源:資料庫、API、電子錶格、文本檔等
  • 收集數據和確保收集過程中數據質量的技術
  • 從各種來源收集數據

Data Cleaning 技術

  • 識別和處理缺失值、異常值和不一致
  • 處理數據集中的重複項和錯誤
  • 清理真實世界的數據集

數據轉換和標準化

  • 數據規範化和標準化技術
  • 分類數據處理:編碼、分箱和特徵工程
  • 將原始資料轉換為可用格式

Data Integration 和聚合

  • 合併和組合來自不同來源的數據集
  • 解決數據衝突並調整數據類型
  • 數據聚合和整合技術

Data Quality 保險

  • 在整個過程中確保數據品質和完整性的方法
  • 實施品質檢查和驗證程式
  • 數據質量保證的案例研究和實際應用

降維和特徵選擇

  • 瞭解降維的必要性
  • PCA、特徵選擇和約簡策略等技術
  • 實施降維技術

摘要和後續步驟

最低要求

    基本了解數據概念

觀眾

    數據分析師 Database 管理員 IT 專業人員
 14 時間:

人數



每位參與者的報價

客戶評論 (2)

相關課程

課程分類