課程簡介

介紹

  • 通過試錯交互解決實際問題

瞭解自適應學習系統和 Artificial Intelligence (AI)。

智慧體如何感知狀態

如何獎勵代理

案例研究:與網站訪問者互動

為代理準備環境

深入瞭解 Reinforcement Learning 演算法

基於價值的方法與基於策略的方法

選擇 Reinforcement Learning 型號

使用 Q-Learning 無模型 Reinforcement Learning 演算法

設計代理

案例研究:智慧助手

將代理連接到生產環境

測量代理操作的結果

故障排除

總結和結論

最低要求

  • 對強化學習的一般理解
  • 機器學習經驗
  • Java 程式設計經驗

觀眾

  • 數據科學家
 21 時間:

人數



每位參與者的報價

客戶評論 (4)

相關課程

課程分類