drlpython
21 時間: 同常來說包括休息是 3天
深度強化學習是指“人工智能體”通過反複試驗和獎懲來學習的能力。人工智能體旨在模仿人類直接從原始輸入(如視覺)獲取和構建知識的能力。爲了實現強化學習,深度學習和神經網絡會被用到。強化學習與機器學習不同,不依賴于有監督和無監督的學習方法。
在這一由講師引導的現場培訓中,學員將在逐步創建深度學習智能體的過程中學習深度強化學習的基礎知識。
在本次培訓結束後,學員將能夠:
受衆
課程形式
介紹
強化學習基礎
強化學習基本技術
BURLAP簡介
值叠代和策略叠代的收斂
獎賞塑形(Reward Shaping)
探索(Exploration)
泛化(Generalization)
部分可觀察的馬爾可夫決策過程(POMDP)
選擇(Options)
Logistics
TD Lambda
策略梯度(Policy Gradient)
深度Q學習
博弈論(Game Theory)專題
總結和結論
We are looking to expand our presence in Taiwan!
If you are interested in running a high-tech, high-quality training and consulting business.
Apply now!

















.png)





.jpg)




.jpg)





_ireland.gif)












