13 lines
419 B
Markdown
13 lines
419 B
Markdown
|
|
# Apprentissage par renforcement
|
||
|
|
## Méthode 'acteur/critique'
|
||
|
|
|
||
|
|
La vidéo de ce tutoriel est disponible à l'adresse suivante:<br>
|
||
|
|
https://www.youtube.com/watch?v=1okjkEMP79c
|
||
|
|
|
||
|
|
Ci dessous, le graph de l'apprentissage sur l'environnement CartPole (https://gym.openai.com/envs/CartPole-v0/)<br>
|
||
|
|
En bleu: Méthode 'critique'<br>
|
||
|
|
En orange: Méthode 'acteur'<br>
|
||
|
|
En vert: Méthode 'acteur/critique'<br>
|
||
|
|
|
||
|
|

|