課程信息

34,083 次近期查看
可分享的證書
完成後獲得證書
100% 在線
立即開始,按照自己的計劃學習。
第 4 門課程(共 4 門)
可靈活調整截止日期
根據您的日程表重置截止日期。
中級

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

完成時間大約為23 小時
英語(English)

您將獲得的技能

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
可分享的證書
完成後獲得證書
100% 在線
立即開始,按照自己的計劃學習。
第 4 門課程(共 4 門)
可靈活調整截止日期
根據您的日程表重置截止日期。
中級

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

完成時間大約為23 小時
英語(English)

提供方

Placeholder

阿尔伯塔大学

Placeholder

Alberta Machine Intelligence Institute

教學大綱 - 您將從這門課程中學到什麼

1

1

完成時間為 1 小時

Welcome to the Final Capstone Course!

完成時間為 1 小時
2 個視頻 (總計 10 分鐘), 2 個閱讀材料
2 個視頻
Meet your instructors!8分鐘
2 個閱讀材料
Reinforcement Learning Textbook10分鐘
Pre-requisites and Learning Objectives10分鐘
2

2

完成時間為 1 小時

Milestone 1: Formalize Word Problem as MDP

完成時間為 1 小時
4 個視頻 (總計 23 分鐘)
4 個視頻
Andy Barto on What are Eligibility Traces and Why are they so named?9分鐘
Let's Review: Markov Decision Processes6分鐘
Let's Review: Examples of Episodic and Continuing Tasks3分鐘
3

3

完成時間為 1 小時

Milestone 2: Choosing The Right Algorithm

完成時間為 1 小時
7 個視頻 (總計 40 分鐘)
7 個視頻
Let's Review: Expected Sarsa3分鐘
Let's Review: What is Q-learning?3分鐘
Let's Review: Average Reward- A New Way of Formulating Control Problems10分鐘
Let's Review: Actor-Critic Algorithm5分鐘
Csaba Szepesvari on Problem Landscape8分鐘
Andy and Rich: Advice for Students5分鐘
1 個練習
Choosing the Right Algorithm
4

4

完成時間為 1 小時

Milestone 3: Identify Key Performance Parameters

完成時間為 1 小時
4 個視頻 (總計 25 分鐘)
4 個視頻
Let's Review: Non-linear Approximation with Neural Networks4分鐘
Drew Bagnell on System ID + Optimal Control6分鐘
Susan Murphy on RL in Mobile Health7分鐘
1 個練習
Impact of Parameter Choices in RL40分鐘

審閱

來自A COMPLETE REINFORCEMENT LEARNING SYSTEM (CAPSTONE)的熱門評論

查看所有評論

關於 强化学习 專項課程

强化学习

常見問題

還有其他問題嗎?請訪問 學生幫助中心