課程簡介

使用Spark進行高級分析

Big Data在雲端

案例研究與最佳實踐

使用Apache Spark進行數據處理

Google Colab與Apache Spark簡介

優化Big Data工作流程

總結與下一步

在Google Colab中的可視化與Collaboration

  • 將Colab與流行的可視化庫集成
  • 使用Colab筆記本進行協作工作流程
  • 分享與導出結果
  • 將Google Colab與基於雲端的工具集成
  • 使用雲存儲處理大數據
  • 在分佈式雲環境中使用Spark
  • 使用Spark MLlib進行機器學習
  • 執行實時數據分析
  • 使用Spark進行分佈式計算
  • Google Colab概述
  • Apache Spark簡介
  • 在Google Colab中設置Spark
  • 回顧真實世界的大數據應用
  • 使用Apache Spark和Colab的案例研究
  • 大數據分析的最佳實踐
  • 調優Spark以提升性能
  • 優化內存與存儲使用
  • 為大數據集擴展工作流程
  • 使用RDDs和DataFrames
  • 加載與處理大數據集
  • 使用Spark SQL查詢結構化數據

最低要求

受众

  • 具备数据科学概念的基础知识
  • 熟悉Apache Spark
  • Python编程技能
  • 数据科学家
  • 数据工程师
  • 从事大数据研究的研究人员
 14 時間:

人數


每位參與者的報價

客戶評論 (5)

Upcoming Courses

課程分類