課程簡介

高级Reinforcement Learning技术

部署Reinforcement Learning模型

探索与利用

Reinforcement Learning简介

基于策略的方法

Q学习与深度Q网络(DQNs)

总结与下一步

使用OpenAI Gym

  • 在RL模型中平衡探索与利用
  • 探索策略:epsilon-greedy、softmax等
  • Q学习简介
  • 使用TensorFlow实现DQNs
  • 通过经验回放和目标网络优化Q学习
  • 多智能体强化学习
  • 深度确定性策略梯度(DDPG)
  • 近端策略优化(PPO)
  • 策略梯度算法
  • REINFORCE算法及其实现
  • 演员-评论家方法
  • 强化学习的实际应用
  • 将RL模型集成到生产环境中
  • 在OpenAI Gym中设置环境
  • 在动态环境中模拟智能体
  • 评估智能体性能
  • 什么是强化学习?
  • 关键概念:智能体、环境、状态、动作和奖励
  • 强化学习中的挑战

最低要求

受众

  • 数据科学家
  • 机器学习从业者
  • AI研究人员
  • 具备Python编程经验
  • 对深度学习和机器学习概念有基本了解
  • 了解强化学习中的算法和数学概念
 28 時間:

人數


每位參與者的報價

Upcoming Courses

課程分類