感謝您提交詢問!我們的一位團隊成員將在短時間內與您聯繫。
感謝您提交預訂!我們的一位團隊成員將在短時間內與您聯繫。
課程簡介
Teradata 简介
模块 1: Teradata 基础与架构
- Teradata 是什么?它有哪些用途?
- 并行架构:AMPs, PEs, BYNET
- 数据分布与哈希
- 关键概念:会话、spool、锁
- 系统连接:Teradata Studio / BTEQ / SQL Assistant
模块 2: Teradata 中的 SQL 简介
- 基本 SELECT, WHERE, ORDER BY
- 数据类型与类型转换
- 数学与日期函数
- 使用 ALIAS, CASE 表达式
- Teradata 特定操作符(TOP, QUALIFY, SAMPLE)
- 指导实践:在真实表上执行查询
模块 3: 连接、子查询与集合操作符
- INNER, LEFT, RIGHT, FULL OUTER JOIN
- 无 ON 子句的连接(笛卡尔积)
- 标量与相关子查询
- UNION, INTERSECT, MINUS
- 数据集成实践练习
模块 4: 分析与 OLAP 函数
- RANK(), ROW_NUMBER(), DENSE_RANK()
- 使用 PARTITION BY 进行数据分区
- 使用 OVER() 和 ORDER BY 进行窗口操作
- LAG(), LEAD(), FIRST_VALUE()
- 用例:KPI、趋势、累计值
模块 5: 数据与表 Management
- 表类型:永久表、临时表、全局临时表
- 创建与使用二级索引和连接索引
- 插入、更新与删除操作
- MERGE, UPSERT 与重复控制
- 事务与锁控制
模块 6: 优化与性能调优
- Teradata 优化器:如何选择执行计划
- 使用 EXPLAIN 和 COLLECT STATISTICS
- 数据倾斜及其避免方法
- 查询设计最佳实践
- 瓶颈识别(spool、锁、重分布)
- 实践:比较优化与非优化查询
模块 7: 数据分区与压缩
- 分区类型:范围分区、案例分区、多级分区
- 在大规模查询中的优势与实际应用
- 块级压缩 (BLC) 与列式压缩
- 优势与局限性
模块 8: 数据加载与提取
- TPT (Teradata 并行传输器) 与 FastLoad / MultiLoad
- 批量加载与批量插入
- 错误处理与重试
- 将结果导出到文件或外部系统
- 使用脚本与工具进行基本自动化
模块 9: 技术用户的基本管理
- 角色与权限
- 资源控制(Query Bands, Priority Scheduler)
- 使用 DBQLOGTBL, DBC.Tables, ResUsage 进行监控
- 共享环境的最佳实践
模块 10: 最终集成实验
- 端到端实践案例:
- 数据加载
- 转换与聚合
- 使用 OLAP 函数构建 KPI
- 优化与 EXPLAIN
- 最终导出
- 讨论最佳实践与常见错误
总结与下一步
最低要求
- 理解关系型数据库和SQL概念
- 有查询大数据集或在数据环境中工作的经验
- 熟悉商业智能或分析目标
受众
- 数据分析师和商业智能专业人员
- SQL开发者和数据工程师
- 在Teradata环境中管理或优化数据的技术用户
35 時間:
客戶評論 (1)
Nice training, full of interesting topics. After each topic helpful examples were provided.