Files
2026-03-31 13:28:59 +02:00
..
2026-03-31 13:28:59 +02:00
2026-03-31 13:28:59 +02:00
2026-03-31 13:28:59 +02:00
2026-03-31 13:28:59 +02:00
2026-03-31 13:28:59 +02:00

Apprentissage par renforcement

Méthode 'acteur/critique'

La vidéo de ce tutoriel est disponible à l'adresse suivante:
https://www.youtube.com/watch?v=1okjkEMP79c

Ci dessous, le graph de l'apprentissage sur l'environnement CartPole (https://gym.openai.com/envs/CartPole-v0/)
En bleu: Méthode 'critique'
En orange: Méthode 'acteur'
En vert: Méthode 'acteur/critique'

image