課程簡介

Teradata簡介

模塊1:Teradata基礎與架構

  • Teradata是什麼及其用途
  • 並行架構:AMPs、PEs、BYNET
  • 數據分佈與哈希
  • 關鍵概念:會話、spool、鎖
  • 連接系統:Teradata Studio / BTEQ / SQL Assistant

模塊2:Teradata中的SQL入門

  • 基本SELECT、WHERE、ORDER BY
  • 數據類型與類型轉換
  • 數學與日期函數
  • 使用ALIAS、CASE表達式
  • Teradata的特殊操作符(TOP、QUALIFY、SAMPLE)
  • 實踐指導:基於真實表的查詢

模塊3:連接、子查詢與集合操作符

  • INNER、LEFT、RIGHT、FULL OUTER JOIN
  • 無ON子句的連接(笛卡爾積)
  • 標量子查詢與相關子查詢
  • UNION、INTERSECT、MINUS
  • 數據集成實踐練習

模塊4:分析函數與OLAP

  • RANK()、ROW_NUMBER()、DENSE_RANK()
  • 使用PARTITION BY進行數據分區
  • 使用OVER()和ORDER BY的窗口函數
  • LAG()、LEAD()、FIRST_VALUE()
  • 用例:KPI、趨勢、累計值

模塊5:數據與表管理

  • 表類型:永久表、臨時表、全局臨時表
  • 創建與使用二級索引與連接索引
  • 插入、更新與刪除記錄
  • MERGE、UPSERT與重複數據控制
  • 事務與鎖控制

模塊6:優化與性能調優

  • Teradata優化器:如何決定執行計劃
  • 使用EXPLAIN與COLLECT STATISTICS
  • 數據傾斜及其避免方法
  • 查詢設計的最佳實踐
  • 識別瓶頸(spool、鎖、數據重分佈)
  • 實踐:優化查詢與非優化查詢的比較

模塊7:數據分區與壓縮

  • 分區類型:範圍分區、案例分區、多級分區
  • 在大查詢中的優勢與實際應用
  • 塊級壓縮(BLC)與列壓縮
  • 優勢與限制

模塊8:數據加載與提取

  • TPT(Teradata Parallel Transporter)與FastLoad / MultiLoad
  • 批量加載與批量插入
  • 錯誤處理與重試機制
  • 將結果導出到文件或外部系統
  • 使用腳本與工具進行基本自動化

模塊9:技術用戶的基本管理

  • 角色與權限
  • 資源控制(Query Bands、Priority Scheduler)
  • 使用DBQLOGTBL、DBC.Tables、ResUsage進行監控
  • 共享環境中的最佳實踐

模塊10:最終集成實驗室

  • 端到端實踐案例:
    • 數據加載
    • 數據轉換與聚合
    • 使用OLAP函數構建指標
    • 優化與解釋
    • 最終導出
  • 討論最佳實踐與常見錯誤

最低要求

  • 理解關係型數據庫和SQL概念
  • 具備查詢大數據集或在數據環境中工作的經驗
  • 熟悉業務智能或分析目標

目標受衆

  • 數據分析師和業務智能專業人士
  • SQL開發人員與數據工程師
  • 在Teradata環境中管理或優化數據的技術用戶
 35 時間:

人數


每位參與者的報價

客戶評論 (1)

即將到來的課程

課程分類