課程簡介
介紹
安裝和配置 Dataiku Data Science Studio (DSS)
- Dataiku DSS的系統要求
- 設置 Apache Hadoop 和 Apache Spark 集成
- 使用 Web 代理配置 Dataiku DSS
- 從其他平台遷移到Dataiku DSS
Dataiku DSS功能和架構概述
- Dataiku DSS基礎的核心物件和圖形
- Dataiku DSS中的食譜是什麼?
- Dataiku DSS支持的數據集類型
創建 Dataiku DSS 專案
在Dataiku DSS中定義要連接到數據資源的數據集
- 使用 DSS 連接器和檔案格式
- 標準 DSS 格式與 Hadoop 特定格式
- 上傳Dataiku DSS專案的檔
Dataiku DSS中的伺服器檔系統概述
創建和使用託管資料夾
- 用於合併資料夾的 Dataiku DSS 配方
- 本地與非本地託管資料夾
使用託管資料夾內容建構檔案系統資料集
- 使用 DSS 代碼配方執行清理
使用指標數據集和內部統計數據集
實現 HTTP 數據集的 DSS 下載配方
使用 DSS 重新置放 SQL 資料集和 HDFS 資料集
在Dataiku DSS中對數據集進行排序
- 編寫器排序與讀取時排序
探索和準備 Dataiku DSS 專案的數據視覺物件
Dataiku 架構、存儲類型和含義概述
在Dataiku DSS中執行數據清洗、規範化和擴充腳本
使用 Dataiku DSS 圖表介面和視覺聚合類型
利用 DSS 的互動式 Statistics 功能
- 單變數分析與雙變數分析
- 使用主成分分析 (PCA) DSS 工具
Dataiku DSS的Machine Learning概述
- 監督式 ML 與無監督式 ML
- DSS ML 演算法和特徵處理參考
- Deep Learning 使用 Dataiku DSS
從 DSS 數據集和配方派生的流程概述
使用可視化配方轉換 DSS 中的現有數據集
利用基於使用者定義代碼的 DSS 配方
使用 DSS 代碼筆記本優化代碼瀏覽和試驗
使用 Web 應用程式編寫高級 DSS 視覺化和自訂前端功能
使用 Dataiku DSS 代碼報告功能
共用數據專案 Element 並熟悉 DSS 儀錶板
將 Dataiku DSS 項目設計並打包為可重用的應用程式
Dataiku DSS中的高級方法概述
- 使用 DSS 實現優化的數據集分區
- 通過在 Kubernetes 容器中的計算執行特定的 DSS 處理部件
Dataiku DSS 中的 Collaboration 和版本控制概述
為 DSS 專案測試實施自動化方案、指標和檢查
使用 DSS Automation 節點和捆綁軟體部署和更新專案
在Dataiku DSS中使用即時API
- DSS 中的其他 API 和 REST API
分析和 Forecasting Dataiku DSS 時間序列
在Dataiku DSS中保護專案
- 管理專案許可權和儀錶板授權
- 實施高級安全選項
將 Dataiku DSS 與雲端整合
故障排除
總結和結論
最低要求
- 具有 Python、SQL 和 R 程式設計語言的經驗
- 使用 Apache Hadoop 和 Spark 進行數據處理的基本知識
- 理解機器學習概念和數據模型
- 統計分析和數據科學概念背景
- 具有可視化和傳達數據的經驗
觀眾
- 工程師
- 數據科學家
- 數據分析師