課程簡介

檢索增強生成(RAG)簡介

  • 什麼是RAG,以及它對企業AI的重要性
  • RAG系統的組件:檢索器、生成器、文件存儲
  • 與獨立LLM和向量搜索的比較

設置RAG管道

  • 安裝和配置Haystack或類似框架
  • 文件攝取和預處理
  • 將檢索器連接到向量數據庫(例如FAISS、Pinecone)

Fine-Tuning 檢索器

  • 使用特定領域數據訓練密集檢索器
  • 使用句子轉換器和對比學習
  • 通過top-k準確率評估檢索器質量

Fine-Tuning 生成器

  • 選擇基礎模型(例如BART、T5、FLAN-T5)
  • 指令微調與監督微調的比較
  • 使用LoRA和PEFT方法進行高效更新

評估與優化

  • 評估RAG性能的指標(例如BLEU、EM、F1)
  • 延遲、檢索質量和幻覺減少
  • 實驗跟踪和迭代改進

部署與現實世界集成

  • 在內部搜索引擎和聊天機器人中部署RAG
  • 安全性、數據訪問和治理考慮
  • 與API、儀表板或知識門戶的集成

案例研究與最佳實踐

  • 金融、醫療和法律領域的企業用例
  • 管理領域漂移和知識庫更新
  • 檢索增強LLM系統的未來方向

總結與下一步

最低要求

  • 理解自然语言处理(NLP)概念
  • 具备基于transformer的语言模型经验
  • 熟悉Python及基本机器学习工作流程

受众

  • NLP工程师
  • 知识管理团队
 14 時間:

人數


每位參與者的報價

Upcoming Courses

課程分類