University · Artificial Intelligence · Reinforcement Learning
Deep RL: Policy Gradients and Actor-Critic Methods
4 Abschnitte1 Karteikarten-Decks1 Quizze
Directly optimising parameterised policies with REINFORCE, A2C, PPO, and TRPO
Inhaltsübersicht
- Why Policy-Based Methods?
- Variance Reduction: Baselines and Actor-Critic
- Trust Regions and Proximal Methods: TRPO and PPO
- From Games to Robots: Practical Deep RL Pipelines
📚 Vollständiges Lernmaterial mit 4 Abschnitten, Karteikarten und Quizzen verfügbar nach Anmeldung.
Jetzt kostenlos lernen →Related Topics
Interaktiv lernen mit Karteikarten & Quizzen
Melde dich an und lerne Reinforcement Learning mit intelligenten Wiederholungen, Quizzen und KI-Lernhilfen. 7 Tage kostenlos.
Kostenlos testen