課程簡介

介紹

    Data Science 過程 數據科學家的角色和職責

準備開發環境

    庫、框架、語言和工具 本地開發 基於 Web 的協作式開發

數據採集

    不同類型的數據 結構  本地資料庫 資料庫連接器 常見格式:xlxs、XML、Json、csv、...
非結構化 我不是 10 年前的 2015-20
  • 蜜蜂屬
  • Internet of Things (IoT)
  • 文檔、圖片、視頻、聲音
  • 案例研究:持續收集大量非結構化數據
  • 數據存儲 關係資料庫 非關係型資料庫 Hadoop:分散式文件系統 (HDFS) Spark:彈性分散式資料集 (RDD) 雲存儲
  • 數據準備
  • 引入、選擇、清理和轉換 確保數據品質 - 正確性、意義性和安全性 異常報告

      Languages 用於製備、加工和分析

    R 語言 R 簡介 數據操作、計算和圖形顯示

      Python Python 簡介

    操作、處理、清理和處理數據

      數據分析
    探索性分析 基本統計 草稿可視化效果 了解資料 
  • 因果律
  • 功能和轉換
  • Machine Learning 監督與未監督

      何時使用什麼模型
    Natural Language Processing (NLP)
  • Data Visualization
  • 最佳實踐 為正確的數據選擇正確的圖表 色板 將其提升到一個新的水準 儀錶板 互動式可視化
  • 用數據講故事
  • 總結和結論
  • 最低要求

    • 對資料庫概念的一般瞭解
    • 對統計學有基本的瞭解
     35 時間:

    人數



    每位參與者的報價

    客戶評論 (2)

    相關課程

    課程分類