Una cosa divertida sobre el aprendizaje por refuerzo es que es difícil encontrar errores, porque el enfoque de aprendizaje subyacente es tan poderoso que tiende a funcionar de todos modos, incluso si elementos importantes están rotos.