課程簡介

介紹

  • Spark 和 Hadoop 功能和體系結構概述
  • 了解大數據
  • Python 程式設計基礎

開始

  • 設置 Python、Spark 和 Hadoop
  • 瞭解 Python 中的數據結構
  • 瞭解 PySpark API
  • 瞭解HDFS和MapReduce

將 Spark 和 Hadoop 與 Python 集成

  • 在 Python 中實現Spark RDD
  • 使用MapReduce處理數據
  • 在HDFS中創建分散式數據集

Machine Learning 使用 Spark MLlib

使用 Spark Streaming 處理大數據

使用推薦系統

使用 Kafka、Sqoop、Kafka 和 Flume

Apache Mahout 與 Spark 和 Hadoop

故障排除

摘要和後續步驟

最低要求

  • Spark和Hadoop經驗
  • Python 程式設計經驗

觀眾

  • 數據科學家
  • 開發人員
 21 時間:

人數



每位參與者的報價

客戶評論 (3)

相關課程

課程分類