University · Artificial Intelligence · Reinforcement Learning

Deep RL: Policy Gradients and Actor-Critic Methods

4 Abschnitte1 Karteikarten-Decks1 Quizze

Directly optimising parameterised policies with REINFORCE, A2C, PPO, and TRPO

📚 Vollständiges Lernmaterial mit 4 Abschnitten, Karteikarten und Quizzen verfügbar nach Anmeldung.

Interaktiv lernen mit Karteikarten & Quizzen

Melde dich an und lerne Reinforcement Learning mit intelligenten Wiederholungen, Quizzen und KI-Lernhilfen. 7 Tage kostenlos.