sparkpython
21 時間: 同常來說包括休息是 3天
Spark是一個用于查詢、分析和轉換大數據的數據處理引擎。Python是一種高級編程語言,因其清晰的語法和代碼可讀性而聞名。PySpark允許用戶將Spark與Python連接。
在這一由講師引導的現場培訓中,學員將通過實踐練習學習如何使用Python和Spark一起分析大數據。
在本次培訓結束後,學員將能夠:
受衆
課程形式
介紹
了解大數據
Spark概述
Python概述
PySpark概述
設置Python和Spark
設置PySpark
針對Spark使用Amazon Web Services(AWS)EC2實例
設置數據塊
設置AWS EMR集群
學習Python編程的基礎知識
學習Spark DataFrame的基礎知識
進行Spark DataFrame項目練習
了解用MLlib進行機器學習
使用MLlib、Spark和Python進行機器學習
了解回歸
了解隨機森林(Random Forests)和決策樹(Decision Trees)
使用K均值聚類
使用推薦系統
實現自然語言處理
在Python中用Spark進行流式處理
結束語
We are looking to expand our presence in Taiwan!
If you are interested in running a high-tech, high-quality training and consulting business.
Apply now!

















.png)





.jpg)




.jpg)





_ireland.gif)












