課程簡介

spark.mllib:數據類型、演算法和實用程式

    數據類型 基本統計 匯總統計 相關性 分層抽樣 假設檢驗 流顯著性測試 隨機數據生成
分類和回歸 線性模型(支援向量機、邏輯回歸、線性回歸)
  • 巴納勒古爾貝葉斯
  • 決策樹
  • 樹的集合(Random Forests 和梯度提升樹)
  • 等滲回歸
  • 協同過濾 交替最小二乘法 (ALS)
  • 聚類 k-均值
  • 高斯混合物
  • 電源反覆運算聚類 (PIC)
  • 潛在狄利克雷津貼 (LDA)
  • 平分 k 均值
  • 流式 k-means
  • 降維 奇異值分解 (SVD)
  • 主成分分析(PCA)
  • 特徵提取和轉換
  • 頻繁的模式挖掘 FP-增長
  • 關聯規則
  • 前綴跨度
  • 評估指標
  • PMML 模型導出
  • 優化(針對開發人員) 隨機梯度下降
  • 記憶體有限 BFGS (L-BFGS)
  • spark.ml:用於ML管道的高級 API
  • 概述:估算器、變壓器和管道 提取、轉換和選擇特徵 分類和回歸 聚類 高級主題

    最低要求

    瞭解以下其中一項知識:

    • 爪哇島
    • Scala
    • 火花R。
      35 時間:
     

    人數


    開始於

    結束於


    Dates are subject to availability and take place between 09:30 and 16:30.
    Open Training Courses require 5+ participants.

    客戶評論 (8)

    相關課程

    課程分類