課程簡介

Data Analysis 和大數據簡介

    是什麼讓 Big Data 變得“大”? 速度、體積、多樣性、準確性 (VVVV)
傳統數據處理的局限性
  • 分散式處理
  • 統計分析
  • Machine Learning 分析類型
  • Data Visualization
  • Big Data 角色和職責
  • 管理員 開發人員 數據分析師

      Languages 用於數據分析

    R Language 為什麼使用 R 進行數據分析? 數據操作、計算和圖形顯示

      Python 為什麼Python進行數據分析?
    操作、處理、清理和處理數據
  • Data Analysis 的方法
  • 統計分析 時間序列分析 使用相關性和回歸模型進行預測 推斷 Statistics(估計) 大數據集中的描述性Statistics(例如計算平均值)
  • Machine Learning 監督學習與無監督學習

      分類和聚類
    估算特定方法的成本
  • 濾波
  • 自然語言處理 處理文字
  • 理解文本的含義
  • 自動文字生成
  • 情感分析/主題分析
  • Computer Vision 獲取、處理、分析和理解圖像
  • 重建、解釋和理解 3D 場景
  • 使用圖像數據做出決策
  • Big Data 基礎設施
  • 數據存儲 關係資料庫 (SQL) 我的SQL Postgres的 神諭
  • 非關係資料庫 (NoSQL) 卡珊德拉
  • MongoDB
  • Neo4j秒
  • 瞭解細微差別 分層資料庫

      面向物件的資料庫
    面向文件的資料庫
  • 面向圖形的資料庫
  • 其他
  • 分散式處理 Hadoop HDFS 作為分散式文件系統
  • MapReduce用於分散式處理
  • 火花 用於大規模數據處理的多合一記憶體集群計算框架
  • 結構化流式處理
  • 火花 SQL
  • Machine Learning 庫:MLlib
  • 使用 GraphX 進行圖形處理
  • Scala能力 公有雲 AWS、谷歌、阿裡雲等 私有雲 OpenStack、Cloud Foundry等
  • 自動擴展性
  • 為問題選擇正確的解決方案
  • Big Data 的未來
  • 總結和結論
  • 最低要求

    • 對數學有大致的瞭解。
    • 對程式設計有大致的瞭解。
    • 對資料庫有大致的瞭解。

    觀眾

    • 開發人員/程式師
    • IT顧問
     35 時間:

    人數



    每位參與者的報價

    客戶評論 (2)

    相關課程

    課程分類