FP16:lla voi olla pienempi koulutus-päättelyero verrattuna BFloat16:een, joten se sopii paremmin RL:ään. Jopa ero RL-algoritmien välillä katoaa, kun FP16 otetaan käyttöön. Yllättävä!