12 lines
369 B
Markdown
12 lines
369 B
Markdown
|
|
# Apprentissage par renforcement
|
||
|
|
## Méthode 'acteur'
|
||
|
|
|
||
|
|
La vidéo de ce tutoriel est disponible à l'adresse suivante:<br>
|
||
|
|
https://www.youtube.com/watch?v=LtRAgxRb5eQ
|
||
|
|
|
||
|
|
Ci dessous, le graph de l'apprentissage sur l'environnement CartPole (https://gym.openai.com/envs/CartPole-v0/)<br>
|
||
|
|
En bleu: Méthode 'critique'<br>
|
||
|
|
En orange: Méthode 'acteur'<br>
|
||
|
|
|
||
|
|

|