Apache Spark培訓

Apache Spark培訓

本地,有指導的Apache Spark培訓課程通過Handson實踐演示Spark如何適應大數據生態系統,以及如何使用Spark進行數據分析。 Apache Spark培訓可作為“現場實時培訓”或“遠程實時培訓”。現場實地培訓可在當地客戶所在地進行台灣或者在NobleProg公司的培訓中心台灣 。遠程實時培訓通過交互式遠程桌面進行。 NobleProg您當地的培訓提供商。

Machine Translated

客戶評論

★★★★★
★★★★★

Apache Spark子類別

Spark課程大綱

課程名稱
課程時長
概觀
課程名稱
課程時長
概觀
21小時
This instructor-led, live training in 台灣 (online or onsite) is aimed at developers who wish to use and integrate Spark, Hadoop, and Python to process, analyze, and transform large and complex data sets. By the end of this training, participants will be able to:
  • Set up the necessary environment to start processing big data with Spark, Hadoop, and Python.
  • Understand the features, core components, and architecture of Spark and Hadoop.
  • Learn how to integrate Spark, Hadoop, and Python for big data processing.
  • Explore the tools in the Spark ecosystem (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, and Flume).
  • Build collaborative filtering recommendation systems similar to Netflix, YouTube, Amazon, Spotify, and Google.
  • Use Apache Mahout to scale machine learning algorithms.
21小時
In this instructor-led, live training in 台灣, participants will learn how to use Python and Spark together to analyze big data as they work on hands-on exercises. By the end of this training, participants will be able to:
  • Learn how to use Spark with Python to analyze Big Data.
  • Work on exercises that mimic real world cases.
  • Use different tools and techniques for big data analysis using PySpark.
21小時
目的: 本課程將介紹Apache Spark 。學生將學習Spark如何適應Big Data生態系統,以及如何使用Spark進行數據分析。該課程涵蓋Spark shell,用於交互式數據分析,Spark內部,Spark API,Spark SQL ,Spark流,機器學習和graphX。 聽眾: 開發人員/數據分析師
21小時
Hortonworks Data Platform (HDP)是一個開源的Apache Hadoop支持平台,為在Apache Hadoop生態系統上開發大數據解決方案提供了穩定的基礎。 這個由講師指導的現場培訓(現場或遠程)介紹了Hortonworks Data Platform (HDP)並引導參與者完成Spark + Hadoop解決方案的部署。 在培訓結束時,參與者將能夠:
  • 使用Hortonworks可以大規模可靠地運行Hadoop 。
  • 使用Spark的敏捷分析工作流統一Hadoop的安全性,治理和運營功能。
  • 使用Hortonworks調查,驗證,認證和支持Spark項目中的每個組件。
  • 處理不同類型的數據,包括結構化,非結構化,動態和靜止。
課程格式
  • 互動講座和討論。
  • 大量的練習和練習。
  • 在實時實驗室環境中親自實施。
課程自定義選項
  • 要申請本課程的定制培訓,請聯繫我們安排。
14小時
Magellan是一個開源分布式執行引擎,用于處理大數據的地理空間分析。它在Apache Spark之上實現,它擴展了Spark SQL並爲地理空間分析提供了關系抽象。 這種有指導意義的實時培訓介紹了實施地理空間分析的概念和方法,並通過在Spark上使用Magellan創建預測分析應用程序來引導參與者。 在培訓結束後,參與者將能夠: 按比例高效地查詢,解析和加入地理空間數據集在商業智能和預測分析應用程序中實施地理空間數據使用空間上下文來擴展移動設備,傳感器,日志和可穿戴設備的功能 聽衆 應用開發者 課程的格式 部分講座,部分討論,練習和沈重的練習
7小時
Alluxio是一個開源虛擬分佈式存儲系統,它統一了不同的存儲系統,使應用程序能夠以內存速度與數據交互。它被英特爾,百度和阿里巴巴等公司使用。 在這個以講師為主導的現場培訓中,參與者將學習如何使用Alluxio將不同的計算框架與存儲系統聯繫起來,並在他們逐步創建Alluxio應用程序時有效管理多PB級數據。 在培訓結束時,參與者將能夠:
  • 使用Alluxio開發應用程序
  • 連接大數據系統和應用程序,同時保留一個名稱空間
  • 以任何存儲格式有效地從大數據中提取價值
  • 改善工作負載性能
  • 部署和管理Alluxio獨立或集群
聽眾
  • 數據科學家
  • 開發人員
  • 系統管理員
課程形式
  • 部分講座,部分討論,練習和繁重的實踐練習
7小時
Spark SQL是Apache Spark用於處理結構化和非結構化數據的模塊。 Spark SQL提供有關數據結構以及正在執行的計算的信息。此信息可用於執行優化。 Spark SQL兩個常見用途是:
- 執行SQL查詢。
- 從現有Hive安裝中讀取數據。 在這個由講師指導的實時培訓(現場或遠程)中,參與者將學習如何使用Spark SQL分析各種類型的數據集。 在培訓結束時,參與者將能夠:
  • 安裝和配置Spark SQL 。
  • 使用Spark SQL執行數據分析。
  • 以不同格式查詢數據集。
  • 可視化數據和查詢結果。
課程格式
  • 互動講座和討論。
  • 大量的練習和練習。
  • 在實時實驗室環境中親自實施。
課程自定義選項
  • 要申請本課程的定制培訓,請聯繫我們安排。
21小時
Stream Processing指的是“運動中的數據”的實時處理,即,在接收數據時對數據執行計算。這些數據被讀取為來自數據源的連續流,例如傳感器事件,網站用戶活動,金融交易,信用卡刷卡,點擊流等。 Stream Processing框架能夠讀取大量傳入數據並幾乎立即提供有價值的見解。 在這個以講師為主導的現場培訓(現場或遠程)中,參與者將學習如何使用現有的大數據存儲系統和相關的軟件應用程序和微服務來設置和集成不同的Stream Processing框架。 在培訓結束時,參與者將能夠:
  • 安裝和配置不同的Stream Processing框架,例如Spark Streaming和Kafka Streaming。
  • 理解並選擇最合適的工作框架。
  • 數據處理連續,同時,並以逐個記錄的方式進行。
  • 將Stream Processing解決方案與現有數據庫,數據倉庫,數據湖等集成。
  • 將最合適的流處理庫與企業應用程序和微服務集成在一起。
聽眾
  • 開發商
  • 軟件架構師
課程 格式
  • 部分講座,部分討論,練習和繁重的實踐練習
筆記
  • 要申請本課程的定制培訓,請聯繫我們安排。
21小時
大數據分析涉及檢查大量不同數據集的過程,以便發現相關性,隱藏模式和其他有用的見解。 健康產業擁有大量複雜的異構醫學和臨床數據。對健康數據應用大數據分析在獲得改善醫療保健服務的見解方面具有巨大潛力。然而,這些數據集的巨大性給分析和臨床環境的實際應用帶來了巨大挑戰。 在這個以講師為主導的現場培訓(遠程)中,參與者將學習如何在健康狀況下進行大數據分析,因為他們將逐步進行一系列動手實踐練習。 在培訓結束時,參與者將能夠:
  • 安裝和配置大數據分析工具,如Hadoop MapReduce和Spark
  • 了解醫療數據的特徵
  • 應用大數據技術處理醫療數據
  • 在健康應用的背景下研究大數據系統和算法
聽眾
  • 開發商
  • 數據科學家
課程格式
  • 部分講座,部分討論,練習和繁重的實踐練習。
注意
  • 要申請本課程的定制培訓,請聯繫我們安排。
21小時
Apache Spark的學習曲線在開始時逐漸增加,需要付出很多努力來獲得第一次回歸。本課程旨在突破第一個艱難的部分。參加本課程後,參與者將了解Apache Spark的基礎知識,他們將明確區分RDD和DataFrame,他們將學習Python和Scala API,他們將理解執行者和任務等。同樣遵循最佳實踐,本課程重點關注雲部署,Databricks和AWS。學生還將了解AWS EMR與AWS Glue之間的差異,AWS Glue是AWS最新的Spark服務之一。 聽眾: 數據工程師, DevOps ,數據科學家
21小時
Scala是Java的簡化版本,用於大規模功能和麵向對象的編程。 Apache Spark Streaming是Spark API的擴展組件,用於將大數據集作為實時流處理。 Spark Streaming和Scala一起使大數據流化。 這種由講師指導的實時培訓(現場或遠程)針對希望通過Spark Streaming和Scala流式傳輸大數據的軟件工程師。 在培訓結束時,參與者將能夠:
  • 使用Scala編程語言創建Spark應用程序。
  • 使用Spark Streaming處理連續的數據流。
  • 使用Spark Streaming處理實時數據流。
課程形式
  • 互動式講座和討論。
  • 很多練習和練習。
  • 在現場實驗室環境中動手實施。
課程自定義選項
  • 要請求此課程的定制培訓,請與我們聯繫以安排。
14小時
This instructor-led, live training in 台灣 (online or onsite) is aimed at data scientists who wish to use the SMACK stack to build data processing platforms for big data solutions. By the end of this training, participants will be able to:
  • Implement a data pipeline architecture for processing big data.
  • Develop a cluster infrastructure with Apache Mesos and Docker.
  • Analyze data with Spark and Scala.
  • Manage unstructured data with Apache Cassandra.
21小時
This instructor-led, live training in 台灣 (online or onsite) is aimed at engineers who wish to set up and deploy Apache Spark system for processing very large amounts of data. By the end of this training, participants will be able to:
  • Install and configure Apache Spark.
  • Quickly process and analyze very large data sets.
  • Understand the difference between Apache Spark and Hadoop MapReduce and when to use which.
  • Integrate Apache Spark with other machine learning tools.
21小時
This instructor-led, live training in 台灣 (online or onsite) is aimed at developers who wish to carry out big data analysis using Apache Spark in their .NET applications. By the end of this training, participants will be able to:
  • Install and configure Apache Spark.
  • Understand how .NET implements Spark APIs so that they can be accessed from a .NET application.
  • Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes.
  • Develop machine learning features for a .NET application using Apache Spark capabilities.
  • Carry out exploratory analysis using SQL queries on big data sets.
35小時
This instructor-led, live training in 台灣 (online or onsite) is aimed at system administrators who wish to learn how to set up, deploy and manage Hadoop clusters within their organization. By the end of this training, participants will be able to:
  • Install and configure Apache Hadoop.
  • Understand the four major components in the Hadoop ecoystem: HDFS, MapReduce, YARN, and Hadoop Common.
  • Use Hadoop Distributed File System (HDFS) to scale a cluster to hundreds or thousands of nodes.  
  • Set up HDFS to operate as storage engine for on-premise Spark deployments.
  • Set up Spark to access alternative storage solutions such as Amazon S3 and NoSQL database systems such as Redis, Elasticsearch, Couchbase, Aerospike, etc.
  • Carry out administrative tasks such as provisioning, management, monitoring and securing an Apache Hadoop cluster.
14小時
This instructor-led, live training in 台灣 (online or onsite) is aimed at data scientists and developers who wish to use Spark NLP, built on top of Apache Spark, to develop, implement, and scale natural language text processing models and pipelines. By the end of this training, participants will be able to:
  • Set up the necessary development environment to start building NLP pipelines with Spark NLP.
  • Understand the features, architecture, and benefits of using Spark NLP.
  • Use the pre-trained models available in Spark NLP to implement text processing.
  • Learn how to build, train, and scale Spark NLP models for production-grade projects.
  • Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
35小時
MLlib是Spark的機器學習(ML)庫。其目標是使實用的機器學習可擴展且簡單。它由常見的學習算法和實用程序組成,包括分類,回歸,聚類,協同過濾,降維,以及低級優化原語和更高級別的管道API。 它分為兩個包:
  • spark.mllib包含在RDD之上構建的原始API。
  • spark.ml提供了構建在DataFrame之上的更高級API,用於構建ML管道。
聽眾 本課程面向希望利用Apache Spark內置機器庫的工程師和開發人員
21小時
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
28小時
大量現實問題可以用圖形來描述。例如,Web圖形、社交網絡圖形、火車網絡圖形、語言圖形。這些圖形往往太大,處理它們需要一組專門的工具和流程——這些工具和流程可以稱爲圖形計算(也稱爲圖形分析)。 在這一由講師指導的實時培訓中,學員將學習處理圖形數據的技術産品和實施方法。目的是識別真實世界裏的對象、它們的特征和關系,然後使用圖形計算方法對這些關系進行建模並將它們作爲數據處理。通過一系列的案例研究、動手練習和實時部署,我們將從廣泛的概述開始,然後對特定工具展開詳細的學習。 在本次培訓結束之後,學員將能夠:
  • 理解圖形數據如何持久化和遍曆
  • 爲給定任務選擇最佳框架(從圖形數據庫到批處理框架)
  • 實現Hadoop、Spark、GraphX、Pregel,並行地在多台機器上進行圖形計算
  • 從圖形、流程、遍曆方面查看現實世界的大數據問題
受衆
  • 開發人員
課程形式
  • 部分講座、部分討論、練習和大量實操

Last Updated:

Apache Spark,培訓,課程,培訓課程, 企業Apache Spark培訓, 短期Spark培訓, Spark課程, Spark周末培訓, Apache Spark晚上培訓, Apache Spark訓練, 學習Apache Spark, Spark老師, 學Spark班, Apache Spark遠程教育, 一對一Spark課程, 小組Spark課程, Spark培訓師, Apache Spark輔導班, Spark教程, Apache Spark私教, Apache Spark輔導, Apache Spark講師

促銷課程

訂閱促銷課程

為尊重您的隱私,我公司不會把您的郵箱地址提供給任何人。您可以享有優先權和隨時取消訂閱的權利。

我們的客戶

is growing fast!

We are looking to expand our presence in Taiwan!

As a Business Development Manager you will:

  • expand business in Taiwan
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

This site in other countries/regions