Apache Spark培訓

Apache Spark培訓

本地,有指導的Apache Spark培訓課程通過Handson實踐演示Spark如何適應大數據生態系統,以及如何使用Spark進行數據分析。 Apache Spark培訓可作為“現場實時培訓”或“遠程實時培訓”。現場實地培訓可在當地客戶所在地進行台灣或者在NobleProg公司的培訓中心台灣 。遠程實時培訓通過交互式遠程桌面進行。 NobleProg您當地的培訓提供商。

Machine Translated

客戶評論

★★★★★
★★★★★

Apache Spark子類別

Spark課程大綱

Title
Duration
Overview
Title
Duration
Overview
21 小時
Overview
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
7 小時
Overview
Alluxio是一個開源虛擬分佈式存儲系統,它統一了不同的存儲系統,使應用程序能夠以內存速度與數據交互。它被英特爾,百度和阿里巴巴等公司使用。

在這個以講師為主導的現場培訓中,參與者將學習如何使用Alluxio將不同的計算框架與存儲系統聯繫起來,並在他們逐步創建Alluxio應用程序時有效管理多PB級數據。

在培訓結束時,參與者將能夠:

- 使用Alluxio開發應用程序
- 連接大數據系統和應用程序,同時保留一個名稱空間
- 以任何存儲格式有效地從大數據中提取價值
- 改善工作負載性能
- 部署和管理Alluxio獨立或集群

聽眾

- 數據科學家
- 開發人員
- 系統管理員

課程形式

- 部分講座,部分討論,練習和繁重的實踐練習
21 小時
Overview
大數據分析涉及檢查大量不同數據集的過程,以便發現相關性,隱藏模式和其他有用的見解。

健康產業擁有大量複雜的異構醫學和臨床數據。對健康數據應用大數據分析在獲得改善醫療保健服務的見解方面具有巨大潛力。然而,這些數據集的巨大性給分析和臨床環境的實際應用帶來了巨大挑戰。

在這個以講師為主導的現場培訓(遠程)中,參與者將學習如何在健康狀況下進行大數據分析,因為他們將逐步進行一系列動手實踐練習。

在培訓結束時,參與者將能夠:

- 安裝和配置大數據分析工具,如Hadoop MapReduce和Spark
- 了解醫療數據的特徵
- 應用大數據技術處理醫療數據
- 在健康應用的背景下研究大數據系統和算法

聽眾

- 開發商
- 數據科學家

課程格式

- 部分講座,部分討論,練習和繁重的實踐練習。

注意

- 要申請本課程的定制培訓,請聯繫我們安排。
28 小時
Overview
大量現實問題可以用圖形來描述。例如,Web圖形、社交網絡圖形、火車網絡圖形、語言圖形。這些圖形往往太大,處理它們需要一組專門的工具和流程——這些工具和流程可以稱爲圖形計算(也稱爲圖形分析)。

在這一由講師指導的實時培訓中,學員將學習處理圖形數據的技術産品和實施方法。目的是識別真實世界裏的對象、它們的特征和關系,然後使用圖形計算方法對這些關系進行建模並將它們作爲數據處理。通過一系列的案例研究、動手練習和實時部署,我們將從廣泛的概述開始,然後對特定工具展開詳細的學習。

在本次培訓結束之後,學員將能夠:

- 理解圖形數據如何持久化和遍曆
- 爲給定任務選擇最佳框架(從圖形數據庫到批處理框架)
- 實現Hadoop、Spark、GraphX、Pregel,並行地在多台機器上進行圖形計算
- 從圖形、流程、遍曆方面查看現實世界的大數據問題

受衆

- 開發人員

課程形式

- 部分講座、部分討論、練習和大量實操
21 小時
Overview
Hortonworks Data Platform (HDP)是一個開源的Apache Hadoop支持平台,為在Apache Hadoop生態系統上開發大數據解決方案提供了穩定的基礎。

這個由講師指導的現場培訓(現場或遠程)介紹了Hortonworks Data Platform (HDP)並引導參與者完成Spark + Hadoop解決方案的部署。

在培訓結束時,參與者將能夠:

- 使用Hortonworks可以大規模可靠地運行Hadoop 。
- 使用Spark的敏捷分析工作流統一Hadoop的安全性,治理和運營功能。
- 使用Hortonworks調查,驗證,認證和支持Spark項目中的每個組件。
- 處理不同類型的數據,包括結構化,非結構化,動態和靜止。

課程格式

- 互動講座和討論。
- 大量的練習和練習。
- 在實時實驗室環境中親自實施。

課程自定義選項

- 要申請本課程的定制培訓,請聯繫我們安排。
21 小時
Overview
Stream Processing指的是“運動中的數據”的實時處理,即,在接收數據時對數據執行計算。這些數據被讀取為來自數據源的連續流,例如傳感器事件,網站用戶活動,金融交易,信用卡刷卡,點擊流等。 Stream Processing框架能夠讀取大量傳入數據並幾乎立即提供有價值的見解。

在這個以講師為主導的現場培訓(現場或遠程)中,參與者將學習如何使用現有的大數據存儲系統和相關的軟件應用程序和微服務來設置和集成不同的Stream Processing框架。

在培訓結束時,參與者將能夠:

- 安裝和配置不同的Stream Processing框架,例如Spark Streaming和Kafka Streaming。
- 理解並選擇最合適的工作框架。
- 數據處理連續,同時,並以逐個記錄的方式進行。
- 將Stream Processing解決方案與現有數據庫,數據倉庫,數據湖等集成。
- 將最合適的流處理庫與企業應用程序和微服務集成在一起。

聽眾

- 開發商
- 軟件架構師

課程 格式

- 部分講座,部分討論,練習和繁重的實踐練習

筆記

- 要申請本課程的定制培訓,請聯繫我們安排。
14 小時
Overview
Magellan是一個開源分布式執行引擎,用于處理大數據的地理空間分析。它在Apache Spark之上實現,它擴展了Spark SQL並爲地理空間分析提供了關系抽象。 這種有指導意義的實時培訓介紹了實施地理空間分析的概念和方法,並通過在Spark上使用Magellan創建預測分析應用程序來引導參與者。 在培訓結束後,參與者將能夠: 按比例高效地查詢,解析和加入地理空間數據集在商業智能和預測分析應用程序中實施地理空間數據使用空間上下文來擴展移動設備,傳感器,日志和可穿戴設備的功能 聽衆 應用開發者 課程的格式 部分講座,部分討論,練習和沈重的練習
21 小時
Overview
Apache Spark的學習曲線在開始時逐漸增加,需要付出很多努力來獲得第一次回歸。本課程旨在突破第一個艱難的部分。參加本課程後,參與者將了解Apache Spark的基礎知識,他們將明確區分RDD和DataFrame,他們將學習Python和Scala API,他們將理解執行者和任務等。同樣遵循最佳實踐,本課程重點關注雲部署,Databricks和AWS。學生還將了解AWS EMR與AWS最新Spark服務之一AWS Glue之間的差異。

聽眾:

數據工程師, DevOps ,數據科學家
21 小時
Overview
目的:

本課程將介紹Apache Spark 。學生將學習Spark如何適應Big Data生態系統,以及如何使用Spark進行數據分析。該課程涵蓋Spark shell,用於交互式數據分析,Spark內部,Spark API,Spark SQL ,Spark流,機器學習和graphX。

聽眾:

開發人員/數據分析師
21 小時
Overview
Spark是一個用于查詢、分析和轉換大數據的數據處理引擎。Python是一種高級編程語言,因其清晰的語法和代碼可讀性而聞名。PySpark允許用戶將Spark與Python連接。

在這一由講師引導的現場培訓中,學員將通過實踐練習學習如何使用Python和Spark一起分析大數據。

在本次培訓結束後,學員將能夠:

- 了解如何使用Spark和Python一起分析大數據
- 開展模擬真實世界環境的練習
- 用不同的工具和技術通過PySpark進行大數據分析

受衆

- 開發人員
- IT專業人士
- 數據科學家

課程形式

- 部分講座、部分討論、練習和大量實操
7 小時
Overview
Spark SQL是Apache Spark用於處理結構化和非結構化數據的模塊。 Spark SQL提供有關數據結構以及正在執行的計算的信息。此信息可用於執行優化。 Spark SQL兩個常見用途是:
- 執行SQL查詢。
- 從現有Hive安裝中讀取數據。

在這個由講師指導的實時培訓(現場或遠程)中,參與者將學習如何使用Spark SQL分析各種類型的數據集。

在培訓結束時,參與者將能夠:

- 安裝和配置Spark SQL 。
- 使用Spark SQL執行數據分析。
- 以不同格式查詢數據集。
- 可視化數據和查詢結果。

課程格式

- 互動講座和討論。
- 大量的練習和練習。
- 在實時實驗室環境中親自實施。

課程自定義選項

- 要申請本課程的定制培訓,請聯繫我們安排。
35 小時
Overview
MLlib是Spark的機器學習(ML)庫。其目標是使實用的機器學習可擴展且簡單。它由常見的學習算法和實用程序組成,包括分類,回歸,聚類,協同過濾,降維,以及低級優化原語和更高級別的管道API。

它分為兩個包:

-

spark.mllib包含在RDD之上構建的原始API。

-

spark.ml提供了構建在DataFrame之上的更高級API,用於構建ML管道。

聽眾

本課程面向希望利用Apache Spark內置機器庫的工程師和開發人員
Apache Spark,培訓,課程,培訓課程, 企業Apache Spark培訓, 短期Spark培訓, Spark課程, Spark周末培訓, Apache Spark晚上培訓, Apache Spark訓練, 學習Apache Spark, Spark老師, 學Spark班, Apache Spark遠程教育, 一對一Spark課程, 小組Spark課程, Spark培訓師, Apache Spark輔導班, Spark教程, Apache Spark私教, Apache Spark輔導, Apache Spark講師

促銷課程

訂閱促銷課程

為尊重您的隱私,我公司不會把您的郵箱地址提供給任何人。您可以享有優先權和隨時取消訂閱的權利。

我們的客戶

is growing fast!

We are looking to expand our presence in Taiwan!

As a Business Development Manager you will:

  • expand business in Taiwan
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!