課程簡介
第 1 周 Big Data 概念
- VVVV(速度、體積、品種、準確性)定義
- 傳統數據處理能力的局限性
- 分散式處理
- 統計分析
- 機器學習分析類型
- 數據可視化
- 分散式處理(例如map-reduce)
- 使用的語言簡介
- R 語言速成班
- Python 速成班
第 2 周和第 3 周表演 Data Analysis
- 統計分析
- 大數據集中的描述性Statistics(例如計算平均值)
- 推論 Statistics (估計)
- 使用相關性和回歸模型進行預測
- 時間序列分析
- 機器學習基礎
- 監督學習與無監督學習
- 分類和聚類
- 估算特定方法的成本
- 濾波器
第4周:自然語言處理
- 處理文字
- 理解經文的意思
- 自動文字生成
- 情緒/主題分析
- Computer Vision
第 5 周和第 6 周:模具概念
- 資料儲存解決方案(SQL、否SQL、分層、面向物件、面向文件)
- MySQL、Cassandra、MongoDB、Elasticsearch、HDFS等...
- 為問題選擇正確的解決方案
- 分散式處理
- 火花
- 使用 Spark 進行機器學習 (MLLib)
- 火花 SQL
- 可擴展性
- 公有雲(AWS、Google 等)
- 私有雲(OpenStack、Cloud Foundry)
- 自動可擴充性
第七周 Soft Skills
- 諮詢和 Leadership 技能
- 產生影響:數據驅動的故事講述
- 瞭解您的受眾
- 有效的數據呈現 - 傳達您的資訊
- 影響有效性並改變領導力
- 處理困難情況
考試
- 課程結業考試
最低要求
參與者在數學方面有良好的基礎,至少在高中水準。
雖然不需要程式設計技能,但任何程式設計技能都會很有用。
在參加此培訓計劃之前,參與者將接受評估和面試。
客戶評論 (4)
All the examples used and the lecturing style was on point even for a begginer i was able to understand and the training was so patient and always willing to go extra mile when in need of assistance.
Mathipa Chepape - Vodacom
Course - Big Data Business Intelligence for Telecom and Communication Service Providers
Intensity, Training materials and expertise, Clarity, Excellent communication with Alessandra
Marija Hornis Dmitrovic - Marija Hornis
Course - Data Science for Big Data Analytics
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Course - Jupyter for Data Science Teams
Trainer was accommodative. And actually quite encouraging for me to take up the course.