Heißer Tipp: DAgger (Ross 2011) sollte das erste Papier sein, das du liest, um in RL einzusteigen, anstatt Suttons Buch. Vielleicht solltest du auch Scheduled Sampling (Bengio 2015) lesen. Und bevor du RL studierst, solltest du überwacht Lernen gründlich studieren.