課程簡介

介紹

安裝和配置 Dataiku Data Science Studio (DSS)

  • Dataiku DSS的系統要求
  • 設置 Apache Hadoop 和 Apache Spark 集成
  • 使用 Web 代理配置 Dataiku DSS
  • 從其他平台遷移到Dataiku DSS

Dataiku DSS功能和架構概述

  • Dataiku DSS基礎的核心物件和圖形
  • Dataiku DSS中的食譜是什麼?
  • Dataiku DSS支持的數據集類型

創建 Dataiku DSS 專案

在Dataiku DSS中定義要連接到數據資源的數據集

  • 使用 DSS 連接器和檔案格式
  • 標準 DSS 格式與 Hadoop 特定格式
  • 上傳Dataiku DSS專案的檔

Dataiku DSS中的伺服器檔系統概述

創建和使用託管資料夾

  • 用於合併資料夾的 Dataiku DSS 配方
  • 本地與非本地託管資料夾

使用託管資料夾內容建構檔案系統資料集

  • 使用 DSS 代碼配方執行清理

使用指標數據集和內部統計數據集

實現 HTTP 數據集的 DSS 下載配方

使用 DSS 重新置放 SQL 資料集和 HDFS 資料集

在Dataiku DSS中對數據集進行排序

  • 編寫器排序與讀取時排序

探索和準備 Dataiku DSS 專案的數據視覺物件

Dataiku 架構、存儲類型和含義概述

在Dataiku DSS中執行數據清洗、規範化和擴充腳本

使用 Dataiku DSS 圖表介面和視覺聚合類型

利用 DSS 的互動式 Statistics 功能

  • 單變數分析與雙變數分析
  • 使用主成分分析 (PCA) DSS 工具

Dataiku DSS的Machine Learning概述

  • 監督式 ML 與無監督式 ML
  • DSS ML 演算法和特徵處理參考
  • Deep Learning 使用 Dataiku DSS

從 DSS 數據集和配方派生的流程概述

使用可視化配方轉換 DSS 中的現有數據集

利用基於使用者定義代碼的 DSS 配方

使用 DSS 代碼筆記本優化代碼瀏覽和試驗

使用 Web 應用程式編寫高級 DSS 視覺化和自訂前端功能

使用 Dataiku DSS 代碼報告功能

共用數據專案 Element 並熟悉 DSS 儀錶板

將 Dataiku DSS 項目設計並打包為可重用的應用程式

Dataiku DSS中的高級方法概述

  • 使用 DSS 實現優化的數據集分區
  • 通過在 Kubernetes 容器中的計算執行特定的 DSS 處理部件

Dataiku DSS 中的 Collaboration 和版本控制概述

為 DSS 專案測試實施自動化方案、指標和檢查

使用 DSS Automation 節點和捆綁軟體部署和更新專案

在Dataiku DSS中使用即時API

  • DSS 中的其他 API 和 REST API

分析和 Forecasting Dataiku DSS 時間序列

在Dataiku DSS中保護專案

  • 管理專案許可權和儀錶板授權
  • 實施高級安全選項

將 Dataiku DSS 與雲端整合

故障排除

總結和結論

最低要求

  • 具有 Python、SQL 和 R 程式設計語言的經驗
  • 使用 Apache Hadoop 和 Spark 進行數據處理的基本知識
  • 理解機器學習概念和數據模型
  • 統計分析和數據科學概念背景
  • 具有可視化和傳達數據的經驗

觀眾

  • 工程師
  • 數據科學家
  • 數據分析師
  21 時間:

人數



每位參與者的報價

相關課程

課程分類