課程簡介

介紹

Scala 程式設計深度回顧

  • 語法和結構
  • 流量控制和功能

Spark 內部結構

  • 彈性分散式資料集 (RDD)
  • Spark 腳本到圖形到群集

Spark Streaming概述

  • 流式處理體系結構
  • 流式處理中的間隔
  • 容錯

準備開發環境

  • 安裝和配置 Apache Spark
  • 安裝和配置 Scala IDE
  • 安裝和配置 JDK

Spark Streaming 初級到高級

  • 使用鍵/值 RDD
  • 過濾 RDD
  • 使用正則表達式改進Spark腳本
  • 在集群上共享數據
  • 使用網路數據集
  • 實現BFS演算法
  • 創建 Spark 驅動程式文稿
  • 使用腳本進行實時跟蹤
  • 編寫連續應用程式
  • 流式線性回歸
  • 使用 Spark Machine Learning 庫

Spark 和群集

  • 使用 SBT 工具捆綁依賴項和 Spark 腳本
  • 使用 EMR 說明集群
  • 通過對 RDD 進行分區進行優化
  • 使用Spark日誌

集成在 Spark Streaming 中

  • 集成 Apache Kafka 並使用 Kafka 主題
  • 集成 Apache Fume 並使用基於拉取/基於推送的 Flume 配置
  • 編寫自定義接收器類
  • 集成 Cassandra 並將數據公開為實時服務

生產中

  • 打包應用程式並使用Spark-Submit運行它
  • 故障排除、優化和調試 Spark 作業和群集

總結和結論

最低要求

  • Programming 和腳本編寫經驗

觀眾

  • 軟體工程師
 21 時間:

人數



每位參與者的報價

客戶評論 (5)

相關課程

課程分類