課程簡介

快速概覽

  • 數據源
  • 注意數據
  • 推薦系統
  • 目標 Marketing

數據類型

  • 結構化與非結構化
  • 靜態與流式
  • 態度、行為和人口統計數據
  • 數據驅動型分析與用戶驅動型分析
  • 數據有效性
  • 數據量、速度和種類

模型

  • 建築模型
  • 統計模型
  • 機器學習

數據分類

  • 聚類
  • kGroups, k-means, 最近鄰
  • 蟻群,鳥類成群結隊

預測模型

  • 決策樹
  • 支援向量機
  • 樸素貝葉斯分類
  • 神經網路
  • 瑪律可夫模型
  • 回歸
  • 集成方法

  • 效益/成本比
  • 軟體成本
  • 開發成本
  • 潛在優勢

構建模型

  • 資料準備 (MapReduce)
  • 數據清理
  • 選擇方法
  • 開發模型
  • 測試模型
  • 模型評估
  • 模型部署和集成

開源和商業軟體概述

  • 選擇 R-project 包
  • Python 庫
  • Hadoop 和 Mahout
  • 與大數據和分析相關的 Apache 專案
  • 精選商業解決方案
  • 與現有軟體和數據源集成

最低要求

瞭解傳統的數據管理和分析方法,如SQL、數據倉庫、商業智慧、OLAP等。瞭解基本統計和概率(均值、方差、概率、條件概率等......

 21 時間:

人數



每位參與者的報價

客戶評論 (1)

課程分類