
本地,有指導的Apache Spark培訓課程通過Handson實踐演示Spark如何適應大數據生態系統,以及如何使用Spark進行數據分析。 Apache Spark培訓可作為“現場實時培訓”或“遠程實時培訓”。現場實地培訓可在當地客戶所在地進行台灣或者在NobleProg公司的培訓中心台灣 。遠程實時培訓通過交互式遠程桌面進行。 NobleProg您當地的培訓提供商。
Machine Translated
客戶評論
理查德非常冷靜和有條不紊,具有分析洞察力 - 正是提出這種課程所需的品質。
Kieran Mac Kenna
課程: Spark for Developers
Machine Translated
分享概念圖和样品的手臟
Mark Yang - FMR
課程: Spark for Developers
Machine Translated
可以應用的場景及案例
zhaopeng liu - Fmr
課程: Spark for Developers
Machine Translated
案例分析
国栋 张
課程: Spark for Developers
Machine Translated
本屆會議的所有部分
Eric Han - Fmr
課程: Spark for Developers
Machine Translated
我們對整個環境了解得更多。
John Kidd
課程: Spark for Developers
Machine Translated
培訓師讓課堂變得有趣和有趣,這對全天培訓有很大幫助。
Ryan Speelman
課程: Spark for Developers
Machine Translated
我認為培訓師具有將幽默和現實生活故事相結合的優秀風格,使手頭的主題非常平易近人。我強烈推薦這位教授。
課程: Spark for Developers
Machine Translated
Ernesto在解釋使用Spark及其各種模塊的高級概念方面做得很好。
Michael Nemerouf
課程: Spark for Developers
Machine Translated
這是我用過的最好的動手編程課程之一。
Laura Kahn
課程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
這是我13年職業生涯中最優秀的在線培訓之一。保持偉大的工作!
課程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
當我們想要提出關於不在課程提綱上的事情的半相關問題時,理查德非常願意離題。解釋很清楚,他提出的任何建議都是關於警告的。
ARM Limited
課程: Spark for Developers
Machine Translated
我非常喜歡的虛擬機器 老師對這個話題以及其他話題都很瞭解, 他很好, 也很友好。 我喜歡迪拜的設施。
Safar Alqahtani - Elm Information Security
課程: Big Data Analytics in Health
Machine Translated
練習任務
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
課程: Python and Spark for Big Data (PySpark)
Machine Translated
Ajay非常友好,樂於助人,也對他正在討論的話題有所了解。
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
課程: Spark for Developers
Machine Translated
實驗練習。從隨後幾天的第一天開始應用該理論。
Dell
課程: A Practical Introduction to Stream Processing
Machine Translated
老師已根據我們當前的需求調整了培訓計劃。
EduBroker Sp. z o.o.
課程: Python and Spark for Big Data (PySpark)
Machine Translated
以不同的方式進行類似的練習確實有助於理解每個組件( Hadoop / Spark,獨立/集群)可以自己或一起做什麼。它為我提供了有關在開發時以及在群集上部署應用程序時應如何在本地計算機上測試應用程序的想法。
Thomas Carcaud - IT Frankfurt GmbH
課程: Spark for Developers
Machine Translated
個人關注。
ARCHANA ANILKUMAR - PPL
課程: Python and Spark for Big Data (PySpark)
Machine Translated
瞭解火花的罩子下發生了什麼,這太棒了。瞭解引擎蓋下發生了什麼有助於更好地瞭解您的代碼為什麼正在執行或沒有執行您期望它執行的。很多培訓都是動手的, 這總是偉大的, 關於優化的部分是特別相關的, 我目前的工作, 這是很好的。
Intelligent Medical Objects
課程: Apache Spark in the Cloud
Machine Translated
我認為培訓師具有將幽默和現實生活故事相結合的優秀風格,使手頭的主題非常平易近人。我強烈推薦這位教授。
課程: Spark for Developers
Machine Translated
這是我13年職業生涯中最優秀的在線培訓之一。保持偉大的工作!
課程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Apache Spark子類別
Spark課程大綱
- Set up the necessary environment to start processing big data with Spark, Hadoop, and Python.
- Understand the features, core components, and architecture of Spark and Hadoop.
- Learn how to integrate Spark, Hadoop, and Python for big data processing.
- Explore the tools in the Spark ecosystem (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, and Flume).
- Build collaborative filtering recommendation systems similar to Netflix, YouTube, Amazon, Spotify, and Google.
- Use Apache Mahout to scale machine learning algorithms.
- Learn how to use Spark with Python to analyze Big Data.
- Work on exercises that mimic real world cases.
- Use different tools and techniques for big data analysis using PySpark.
- 使用Hortonworks可以大規模可靠地運行Hadoop 。
- 使用Spark的敏捷分析工作流統一Hadoop的安全性,治理和運營功能。
- 使用Hortonworks調查,驗證,認證和支持Spark項目中的每個組件。
- 處理不同類型的數據,包括結構化,非結構化,動態和靜止。
- 互動講座和討論。
- 大量的練習和練習。
- 在實時實驗室環境中親自實施。
- 要申請本課程的定制培訓,請聯繫我們安排。
- 使用Alluxio開發應用程序
- 連接大數據系統和應用程序,同時保留一個名稱空間
- 以任何存儲格式有效地從大數據中提取價值
- 改善工作負載性能
- 部署和管理Alluxio獨立或集群
- 數據科學家
- 開發人員
- 系統管理員
- 部分講座,部分討論,練習和繁重的實踐練習
- 執行SQL查詢。
- 從現有Hive安裝中讀取數據。 在這個由講師指導的實時培訓(現場或遠程)中,參與者將學習如何使用Spark SQL分析各種類型的數據集。 在培訓結束時,參與者將能夠:
- 安裝和配置Spark SQL 。
- 使用Spark SQL執行數據分析。
- 以不同格式查詢數據集。
- 可視化數據和查詢結果。
- 互動講座和討論。
- 大量的練習和練習。
- 在實時實驗室環境中親自實施。
- 要申請本課程的定制培訓,請聯繫我們安排。
- 安裝和配置不同的Stream Processing框架,例如Spark Streaming和Kafka Streaming。
- 理解並選擇最合適的工作框架。
- 數據處理連續,同時,並以逐個記錄的方式進行。
- 將Stream Processing解決方案與現有數據庫,數據倉庫,數據湖等集成。
- 將最合適的流處理庫與企業應用程序和微服務集成在一起。
- 開發商
- 軟件架構師
- 部分講座,部分討論,練習和繁重的實踐練習
- 要申請本課程的定制培訓,請聯繫我們安排。
- 安裝和配置大數據分析工具,如Hadoop MapReduce和Spark
- 了解醫療數據的特徵
- 應用大數據技術處理醫療數據
- 在健康應用的背景下研究大數據系統和算法
- 開發商
- 數據科學家
- 部分講座,部分討論,練習和繁重的實踐練習。
- 要申請本課程的定制培訓,請聯繫我們安排。
- 使用Scala編程語言創建Spark應用程序。
- 使用Spark Streaming處理連續的數據流。
- 使用Spark Streaming處理實時數據流。
- 互動式講座和討論。
- 很多練習和練習。
- 在現場實驗室環境中動手實施。
- 要請求此課程的定制培訓,請與我們聯繫以安排。
- Implement a data pipeline architecture for processing big data.
- Develop a cluster infrastructure with Apache Mesos and Docker.
- Analyze data with Spark and Scala.
- Manage unstructured data with Apache Cassandra.
- Install and configure Apache Spark.
- Quickly process and analyze very large data sets.
- Understand the difference between Apache Spark and Hadoop MapReduce and when to use which.
- Integrate Apache Spark with other machine learning tools.
- Install and configure Apache Spark.
- Understand how .NET implements Spark APIs so that they can be accessed from a .NET application.
- Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes.
- Develop machine learning features for a .NET application using Apache Spark capabilities.
- Carry out exploratory analysis using SQL queries on big data sets.
- Install and configure Apache Hadoop.
- Understand the four major components in the Hadoop ecoystem: HDFS, MapReduce, YARN, and Hadoop Common.
- Use Hadoop Distributed File System (HDFS) to scale a cluster to hundreds or thousands of nodes.
- Set up HDFS to operate as storage engine for on-premise Spark deployments.
- Set up Spark to access alternative storage solutions such as Amazon S3 and NoSQL database systems such as Redis, Elasticsearch, Couchbase, Aerospike, etc.
- Carry out administrative tasks such as provisioning, management, monitoring and securing an Apache Hadoop cluster.
- Set up the necessary development environment to start building NLP pipelines with Spark NLP.
- Understand the features, architecture, and benefits of using Spark NLP.
- Use the pre-trained models available in Spark NLP to implement text processing.
- Learn how to build, train, and scale Spark NLP models for production-grade projects.
- Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
- spark.mllib包含在RDD之上構建的原始API。
- spark.ml提供了構建在DataFrame之上的更高級API,用於構建ML管道。
- 理解圖形數據如何持久化和遍曆
- 爲給定任務選擇最佳框架(從圖形數據庫到批處理框架)
- 實現Hadoop、Spark、GraphX、Pregel,並行地在多台機器上進行圖形計算
- 從圖形、流程、遍曆方面查看現實世界的大數據問題
- 開發人員
- 部分講座、部分討論、練習和大量實操
Last Updated: