課程簡介

NiFi與數據流基礎

  • 動態數據與靜態數據:概念與挑戰
  • NiFi架構:核心、流控制器、數據溯源與公告
  • 關鍵組件:處理器、連接、控制器與數據溯源

大數據背景與集成

  • NiFi在大數據生態系統中的角色(Hadoop、Kafka、雲存儲)
  • HDFS、MapReduce及現代替代方案的概述
  • 使用案例:流數據攝取、日誌傳輸、事件管道

安裝、配置與集羣設置

  • 在單節點和集羣模式下安裝NiFi
  • 集羣配置:節點角色、Zookeeper與負載均衡
  • 使用Ansible、Docker或Helm編排NiFi部署

設計與管理數據流

  • 路由、過濾、拆分、合併數據流
  • 處理器配置(InvokeHTTP、QueryRecord、PutDatabaseRecord等)
  • 處理模式、數據豐富與轉換操作
  • 錯誤處理、重試關係與背壓

集成場景

  • 連接數據庫、消息系統、REST API
  • 流數據到分析系統:Kafka、Elasticsearch或雲存儲
  • 與Splunk、Prometheus或日誌管道集成

監控、恢復與數據溯源

  • 使用NiFi UI、指標與數據溯源可視化工具
  • 設計自動恢復與優雅的故障處理
  • 備份、流版本控制與應變管理

性能調優與優化

  • 調優JVM、堆、線程池與集羣參數
  • 優化流設計以減少瓶頸
  • 資源隔離、流優先級與吞吐量控制

最佳實踐與治理

  • 流文檔、命名標準、模塊化設計
  • 安全性:TLS、身份驗證、訪問控制、數據加密
  • 變更控制、版本控制、基於角色的訪問、審計跟蹤

故障排除與事件響應

  • 常見問題:死鎖、內存泄漏、處理器錯誤
  • 日誌分析、錯誤診斷與根本原因調查
  • 恢復策略與流回滾

實踐實驗室:真實數據管道實現

  • 構建端到端流:攝取、轉換、交付
  • 實現錯誤處理、背壓與擴展
  • 性能測試與管道調優

總結與下一步

最低要求

  • 具備Linux命令行經驗
  • 對網絡和數據系統有基本瞭解
  • 接觸過數據流或ETL概念

受衆

  • 系統管理員
  • 數據工程師
  • 開發者
  • DevOps專業人員
 21 時間:

人數


每位參與者的報價

客戶評論 (7)

即將到來的課程

課程分類