Data Science for Big Data Analytics培訓

(2 客戶評論)

大數據是如此龐大和復雜的數據集，傳統的數據處理應用軟件不足以處理它們。大數據挑戰包括捕獲數據，數據存儲，數據分析，搜索，共享，傳輸，可視化，查詢，更新和信息隱私。

Data Science for Big Data Analytics培訓

課程簡介

Data Science for Big Data Analytics 簡介

數據分析生命周期簡介

從這一點 開始，大部分培訓時間（80%）將花在R和相關大數據技術的示例和練習上。

R 入門

開始使用 Hadoop

將 R 和 Hadoop 與 RHadoop 集成

預處理和準備數據

R 中的探索性數據分析方法

Data Visualization秒

回歸（估計未來值）

分類

評估模型性能和選擇

集成方法

支援用於分類和回歸的向量機

聚類分析的特徵選擇 基於代表性的演算法：k-means、k-medoids 分層演算法：聚合和分裂方法 概率基礎演算法：EM 基於密度的演算法：DBSCAN、DENCLUE 群集驗證 高級聚類分析概念 使用R進行聚類Hadoop 練習和案例研究

鏈路分析概念 用於分析網路的指標 Pagerank 演算法 超鏈接引發的主題 Search 鏈路預測 練習和案例研究

頻繁模式挖掘模型 Scala頻繁模式挖掘中的容量問題 蠻力演算法 Apriori 演算法 FP增長方法 候選規則評估 關聯規則的應用 驗證和測試 診斷 與 R 和 Hadoop 的關聯規則 練習和案例研究

瞭解推薦系統 推薦系統中使用的數據挖掘技術 帶有 recommenderlab 軟體包的推薦系統 評估推薦系統 RHadoop的建議 練習：構建推薦引擎

文本分析步驟 收集原始文字 一袋字 術語頻率 - 反向文檔頻率 確定情緒 練習和案例研究

客戶評論 (2)

Marija Hornis Dmitrovic - Marija Hornis

Course - Data Science for Big Data Analytics

Teboho Makenete

Course - Data Science for Big Data Analytics

相關課程

Kaggle

Accelerating Python Pandas Workflows with Modin

GPU Data Science with NVIDIA RAPIDS

Anaconda Ecosystem for Data Scientists

Data Vault: Building a Scalable Data Warehouse

Spark Streaming with Python and Kafka

Confluent KSQL

Apache Ignite for Developers

Unified Batch and Stream Processing with Apache Beam

Apache Apex: Processing Big Data-in-Motion

Apache Storm

Apache NiFi for Administrators

Apache NiFi for Developers

Flink for Scalable Stream and Batch Data Processing

Python and Spark for Big Data (PySpark)

課程分類

大數據

數據挖掘（Data Mining）

Data Science

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

從這一點開始，大部分培訓時間（80%）將花在R和相關大數據技術的示例和練習上。

聚類分析的特徵選擇基於代表性的演算法：k-means、k-medoids 分層演算法：聚合和分裂方法概率基礎演算法：EM 基於密度的演算法：DBSCAN、DENCLUE 群集驗證高級聚類分析概念使用R進行聚類Hadoop 練習和案例研究

鏈路分析概念用於分析網路的指標 Pagerank 演算法超鏈接引發的主題 Search 鏈路預測練習和案例研究

頻繁模式挖掘模型 Scala頻繁模式挖掘中的容量問題蠻力演算法 Apriori 演算法 FP增長方法候選規則評估關聯規則的應用驗證和測試診斷與 R 和 Hadoop 的關聯規則練習和案例研究

瞭解推薦系統推薦系統中使用的數據挖掘技術帶有 recommenderlab 軟體包的推薦系統評估推薦系統 RHadoop的建議練習：構建推薦引擎

文本分析步驟收集原始文字一袋字術語頻率 - 反向文檔頻率確定情緒練習和案例研究