課程簡介

  1. 大數據基礎知識
  2. 大數據及其在企業界的作用
  3. 公司內部大數據戰略的發展階段
  4. 解釋大數據整體方法的基本原理
  5. 大數據平臺所需的元件
  6. 大數據存儲解決方案
  7. 傳統技術的局限性
  8. 資料庫類型概述
  9. 大數據的四個維度
  10. 大數據對業務的影響
  11. 大數據對業務的重要性
  12. 提取有用數據的挑戰
  13. 將大數據與傳統數據相結合
  14. 大數據存儲技術
  15. 大數據技術概述
  16. 數據存儲模型
  17. Hadoop的
  18. 蜂房
  19. 卡珊德拉
  20. MongoDB資料庫
  21. 選擇正確的大數據技術
  22. 處理大數據
  23. 連接資料庫並從中提取數據
  24. 轉換和準備用於處理的數據
  25. 使用Hadoop MapReduce處理分散式數據
  26. 監視和執行Hadoop MapReduce作業
  27. Hadoop 分散式文件系統構建塊
  28. Mapreduce和Yarn
  29. 使用Spark處理流數據
  30. 大數據分析工具和技術
  31. 使用 Pig Latin 語言對 Hadoop 進行程式設計
  32. 使用Hive查詢大數據
  33. 使用Mahout挖掘數據
  34. 可視化和報告工具
  35. 商業中的大數據
  36. 管理和建立大數據需求
  37. 大數據對業務的重要性
  38. 為問題選擇正確的大數據工具

 

數據倉庫概念

  • 什麼是 Data Ware?
  • OLTP 和 Data Ware Housing 之間的區別
  • 數據採集
  • 數據提取
  • 數據轉換。
  • 數據載入
  • 數據集市
  • 從屬數據集市與獨立數據集市
  • 資料庫設計

ETL 測試概念:

  • 介紹。
  • 軟體開發生命週期。
  • 測試方法。
  • ETL 測試工作流程。
  • 數據階段的 ETL 測試職責。

大數據基礎

  • Big Data 及其在企業界的作用
  • 公司內部 Big Data 戰略的發展階段
  • 解釋整體方法的基本原理 Big Data
  • Big Data 平臺所需的元件
  • 大數據存儲解決方案
  • 傳統技術的局限性
  • 資料庫類型概述

否SQL資料庫

Hadoop

Map Reduce(地圖縮減)

Apache Spark

 

最低要求

代表們應該對存儲工具有一定的認識和經驗,以及處理大型數據集的可怕經驗

 14 時間:

人數



每位參與者的報價

客戶評論 (4)

相關課程

課程分類