Avis tranché : DAgger (Ross 2011) devrait être le premier article que vous lisez pour entrer dans l'apprentissage par renforcement, au lieu du livre de Sutton. Peut-être aussi lire l'échantillonnage programmé (Bengio 2015). Et avant l'apprentissage par renforcement, étudiez l'apprentissage supervisé en profondeur.