課程簡介

DeepSeek LLM微調簡介

  • DeepSeek模型概述,例如DeepSeek-R1和DeepSeek-V3
  • 理解微調LLM的必要性
  • 微調與提示工程的對比

準備微調數據集

  • 整理領域特定的數據集
  • 數據預處理和清理技術
  • DeepSeek LLM的標記化和數據集格式化

設置微調環境

  • 配置GPU和TPU加速
  • 設置Hugging Face Transformers與DeepSeek LLM
  • 理解微調的超參數

DeepSeek LLM微調

  • 實現監督微調
  • 使用LoRA(低秩適應)和PEFT(參數高效微調)
  • 運行分佈式微調以處理大規模數據集

評估和優化微調模型

  • 使用評估指標評估模型性能
  • 處理過擬合和欠擬合
  • 優化推理速度和模型效率

部署微調的DeepSeek模型

  • 爲API部署打包模型
  • 將微調模型集成到應用中
  • 使用雲和邊緣計算擴展部署

實際用例和應用

  • 微調LLM在金融、醫療和客戶支持中的應用
  • 行業應用案例研究
  • 領域特定AI模型的倫理考量

總結與下一步

最低要求

  • 具備機器學習和深度學習框架的經驗
  • 熟悉transformer和大語言模型(LLMs)
  • 理解數據預處理和模型訓練技術

受衆

  • 探索LLM微調的AI研究人員
  • 開發定製AI模型的機器學習工程師
  • 實現AI驅動解決方案的高級開發者
 21 時間:

人數


每位參與者的報價

Upcoming Courses

課程分類