課程信息

151,751 次近期查看

學生職業成果

14%

完成這些課程後已開始新的職業生涯
可分享的證書
完成後獲得證書
100% 在線
立即開始,按照自己的計劃學習。
第 1 門課程(共 4 門)
可靈活調整截止日期
根據您的日程表重置截止日期。
中級

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

完成時間大約為15 小時
英語(English)

您將學到的內容有

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

您將獲得的技能

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

學生職業成果

14%

完成這些課程後已開始新的職業生涯
可分享的證書
完成後獲得證書
100% 在線
立即開始,按照自己的計劃學習。
第 1 門課程(共 4 門)
可靈活調整截止日期
根據您的日程表重置截止日期。
中級

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

完成時間大約為15 小時
英語(English)

提供方

Placeholder

阿尔伯塔大学

Placeholder

Alberta Machine Intelligence Institute

教學大綱 - 您將從這門課程中學到什麼

內容評分Thumbs Up93%(12,780 個評分)Info
1

1

完成時間為 1 小時

Welcome to the Course!

完成時間為 1 小時
4 個視頻 (總計 20 分鐘), 2 個閱讀材料
完成時間為 4 小時

An Introduction to Sequential Decision-Making

完成時間為 4 小時
8 個視頻 (總計 46 分鐘), 3 個閱讀材料, 2 個測驗
2

2

完成時間為 3 小時

Markov Decision Processes

完成時間為 3 小時
7 個視頻 (總計 36 分鐘), 2 個閱讀材料, 2 個測驗
3

3

完成時間為 3 小時

Value Functions & Bellman Equations

完成時間為 3 小時
9 個視頻 (總計 56 分鐘), 3 個閱讀材料, 2 個測驗
4

4

完成時間為 4 小時

Dynamic Programming

完成時間為 4 小時
10 個視頻 (總計 72 分鐘), 3 個閱讀材料, 2 個測驗

審閱

來自FUNDAMENTALS OF REINFORCEMENT LEARNING的熱門評論

查看所有評論

關於 强化学习 專項課程

强化学习

常見問題

還有其他問題嗎?請訪問 學生幫助中心