University · Artificial Intelligence · Reinforcement Learning

Deep RL: Policy Gradients and Actor-Critic Methods

4 Abschnitte1 Karteikarten-Decks1 Quizze

Directly optimising parameterised policies with REINFORCE, A2C, PPO, and TRPO

Inhaltsübersicht

  • Why Policy-Based Methods?
  • Variance Reduction: Baselines and Actor-Critic
  • Trust Regions and Proximal Methods: TRPO and PPO
  • From Games to Robots: Practical Deep RL Pipelines

📚 Vollständiges Lernmaterial mit 4 Abschnitten, Karteikarten und Quizzen verfügbar nach Anmeldung.

Jetzt kostenlos lernen →

Related Topics

Interaktiv lernen mit Karteikarten & Quizzen

Melde dich an und lerne Reinforcement Learning mit intelligenten Wiederholungen, Quizzen und KI-Lernhilfen. 7 Tage kostenlos.

Kostenlos testen