課程簡介

介紹

Reinforcement Learning 基礎知識

基本 Reinforcement Learning 技術

粗麻布簡介

價值與政策反覆運算的融合

獎勵塑造

勘探

普遍化

部分可觀察的 MDP

選項

後勤

TD Lambda的

策略梯度

深度 Q 學習

博弈論專題

摘要和後續步驟

最低要求

  • 精通Python
  • 對大學微積分和線性代數的理解
  • 對概率和Statistics的基本理解
  • 具有在 Python 和 Numpy 中創建機器學習模型的經驗

觀眾

  • 開發人員
  • 數據科學家
  21 時間:

人數



每位參與者的報價

相關課程

課程分類