Close Banner

强化学习

Offered at Georgia Tech as CS 8803

高级

大约 16 个礼拜

6小时每周 (按照自己的节奏)

由以下企业参与制作:
加入成千上万的全球学员

开始免费课程

加入课程
免费
可享受
课程视频
实战练习与参考项目指导
高级

大约 16 个礼拜

6小时每周 (按照自己的节奏)

由以下企业参与制作:
加入成千上万的全球学员

课程概述

如果你对机器学习感兴趣,且渴望从理论的角度认识它,你就应该选择本课内容。通过经典论文与更多近期作品的结合,你将从计算机技术的角度探索自动化决策的内涵。你将在单智能体计划和多智能体计划中检测其中存在的有效算法,以及从经验中习得最优决策的方法。本课内容结束时,你将有能力从已发表的强化学习论文中复制出属于自己的学术成果。

喜欢这门课程?加入“机器学习工程师”纳米学位。

为什么学习这门课程?

本课内容将把你带进强化学习研究社区。你也将有机会受教于两位教授,Charles Isbell和Michael Littman,他们都是该研究领域的世界顶级专家。

先修要求

在学习本课内容之前,你应已进修过研究生水平的机器学习课程,并应在以前的计算机科学领域课程或论坛中接触过强化学习的内容。

另外,在本课内容中你将大量密集地使用Java程序设计语言。如果你不熟悉Java,我们建议你先回顾优达学城的“Java程序设计”课程材料,提前赶上进度。

查看使用优达学城的技术要求

你将学习什么内容?

项目

训练智能车学会驾驶

智能汽车是我们在不远的将来就能看到的一种自驾驶出租车,它可以把人们从一个任意位置摆渡到另一个任意位置。在该项目中,你将运用强化学习方法训练智能车学会驾驶。

学习计划

  • 强化学习基础知识
  • BURLAP入门
  • TD Lambda
  • 价值与政策迭代的收集
  • 奖励塑造
  • 探索
  • 泛化
  • 部分可观测的机械化数据处理系统(MDPs)
  • 选项
  • 博弈论课题
  • 更多强化学习的模型课题

讲师与合作伙伴

Charles Isbell

Charles Isbell

Charles Isbell 是佐治亚理工学院交互式计算学院的教授和高级副院长。他热衷于研究人工智能,特别是在创建必须与大量其他智能代理程序(一些程序可能是人类)共存与互动的自动代理程序方面。最近,他的精力转向了自适应建模,尤其是在活动发现(不同于活动识别)、可扩展协作、支持自适应代理程序快速原型设计的开发环境方面。他正在开发适应性编程语言,试图理解向非专业作家,设计师和开发人员提供机器学习工具的意义。他有时也参与回力网球、举重和极限飞盘活动。

Michael Littman

Michael Littman

Michael Littman 是布朗大学计算机科学教授。他也讲授优达学城在处理社交网络的算法课程(CS215)。在2012年加入布朗大学之前,他于2009年-2012年期间担任罗格斯大学计算机科学系主任,领导了罗格斯实验室实际强化学习(RL3)项目。他是美国人工智能协会 (AAAI) 研究员,曾担任 AAAI 2013年会议及2009年机器学习国际会议的程序主席,并获得了杜克大学和罗格斯大学的校级教学奖。Charles Isbell 曾教授他对回力网球、举重和极限飞盘,但是他并不擅长其中的任何一项。不过他却非常擅长歌唱和杂技。

Chris Pryby

Chris Pryby

Chris Pryby 是佐治亚理工学院在线硕士学位课程的开发者,对建立未来网络教育具有饱满热情。他拥有佐治亚大学的数学学士学位和计算机科学学士学位,以及乔治亚理工学院的数学博士学位。自 2011 年起,Chris 又开始练习武术,并在韩国合气道中获得了一级黑带的成绩。

官方微信公众号二维码

优达学城(Udacity)微信