Opinión controvertida: DAgger (Ross 2011) debería ser el primer artículo que leas para introducirte en el RL, en lugar del libro de Sutton. Quizás también deberías leer sobre muestreo programado (Bengio 2015). Y antes de RL, estudia a fondo el aprendizaje supervisado.