課程信息

83,423 次近期查看

學生職業成果

33%

完成這些課程後已開始新的職業生涯

56%

通過此課程獲得實實在在的工作福利

33%

加薪或升職
可分享的證書
完成後獲得證書
100% 在線
立即開始,按照自己的計劃學習。
第 4 門課程(共 7 門)
可靈活調整截止日期
根據您的日程表重置截止日期。
高級
完成時間大約為26 小時
英語(English)
字幕:英語(English), 韓語

學生職業成果

33%

完成這些課程後已開始新的職業生涯

56%

通過此課程獲得實實在在的工作福利

33%

加薪或升職
可分享的證書
完成後獲得證書
100% 在線
立即開始,按照自己的計劃學習。
第 4 門課程(共 7 門)
可靈活調整截止日期
根據您的日程表重置截止日期。
高級
完成時間大約為26 小時
英語(English)
字幕:英語(English), 韓語

提供方

国立高等经济大学 徽標

国立高等经济大学

教學大綱 - 您將從這門課程中學到什麼

內容評分Thumbs Up81%(2,108 個評分)Info
1

1

完成時間為 5 小時

Intro: why should I care?

完成時間為 5 小時
14 個視頻 (總計 85 分鐘), 5 個閱讀材料, 3 個測驗
14 個視頻
Why should you care9分鐘
Reinforcement learning vs all3分鐘
Multi-armed bandit4分鐘
Decision process & applications6分鐘
Markov Decision Process5分鐘
Crossentropy method9分鐘
Approximate crossentropy method5分鐘
More on approximate crossentropy method6分鐘
Evolution strategies: core idea6分鐘
Evolution strategies: math problems5分鐘
Evolution strategies: log-derivative trick8分鐘
Evolution strategies: duct tape6分鐘
Blackbox optimization: drawbacks4分鐘
5 個閱讀材料
About the University10分鐘
FAQ10分鐘
Primers1小時
About honors track1分鐘
Extras10分鐘
2

2

完成時間為 3 小時

At the heart of RL: Dynamic Programming

完成時間為 3 小時
5 個視頻 (總計 54 分鐘), 3 個閱讀材料, 4 個測驗
5 個視頻
State and Action Value Functions13分鐘
Measuring Policy Optimality6分鐘
Policy: evaluation & improvement10分鐘
Policy and value iteration8分鐘
3 個閱讀材料
Optional: Reward discounting from a mathematical perspective10分鐘
External links: Reward Design10分鐘
Discrete Stochastic Dynamic Programming10分鐘
3 個練習
Reward design8分鐘
Optimality in RL30分鐘
Policy Iteration30分鐘
3

3

完成時間為 3 小時

Model-free methods

完成時間為 3 小時
6 個視頻 (總計 47 分鐘), 1 個閱讀材料, 4 個測驗
6 個視頻
Monte-Carlo & Temporal Difference; Q-learning8分鐘
Exploration vs Exploitation8分鐘
Footnote: Monte-Carlo vs Temporal Difference2分鐘
Accounting for exploration. Expected Value SARSA11分鐘
On-policy vs off-policy; Experience replay7分鐘
1 個閱讀材料
Extras10分鐘
1 個練習
Model-free reinforcement learning30分鐘
4

4

完成時間為 3 小時

Approximate Value Based Methods

完成時間為 3 小時
9 個視頻 (總計 104 分鐘), 3 個閱讀材料, 5 個測驗
9 個視頻
Loss functions in value based RL11分鐘
Difficulties with Approximate Methods15分鐘
DQN – bird's eye view9分鐘
DQN – the internals9分鐘
DQN: statistical issues6分鐘
Double Q-learning6分鐘
More DQN tricks10分鐘
Partial observability17分鐘
3 個閱讀材料
TD vs MC10分鐘
Extras10分鐘
DQN follow-ups10分鐘
3 個練習
MC & TD10分鐘
SARSA and Q-learning10分鐘
DQN30分鐘

審閱

來自PRACTICAL REINFORCEMENT LEARNING的熱門評論

查看所有評論

關於 高级机器学习 專項課程

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
高级机器学习

常見問題

  • Access to lectures and assignments depends on your type of enrollment. If you take a course in audit mode, you will be able to see most course materials for free. To access graded assignments and to earn a Certificate, you will need to purchase the Certificate experience, during or after your audit. If you don't see the audit option:

    • The course may not offer an audit option. You can try a Free Trial instead, or apply for Financial Aid.
    • The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

  • 如果订阅,您可以获得 7 天免费试听,在此期间,您可以取消课程,无需支付任何罚金。在此之后,我们不会退款,但您可以随时取消订阅。请阅读我们完整的退款政策

  • 是的,Coursera 可以为无法承担费用的学生提供助学金。通过点击左侧“注册”按钮下的“助学金”链接可以申请助学金。您可以根据屏幕提示完成申请,申请获批后会收到通知。您需要针对专项课程中的每一门课程完成上述步骤,包括毕业项目。了解更多

還有其他問題嗎?請訪問 學生幫助中心