Ý kiến nóng: DAgger (Ross 2011) nên là bài báo đầu tiên bạn đọc để tìm hiểu về RL, thay vì cuốn sách của Sutton. Có thể cũng nên đọc về sampling theo lịch trình (Bengio 2015). Và trước khi học về RL, hãy nghiên cứu kỹ về học có giám sát.