De ce transformatorii nu pot învăța înmulțirea? Această lucrare a constatat că antrenamentul simplu nu construiește niciodată legături de înmulțire pe distanțe lungi. Deci, adăugând o nouă pierdere auxiliară care prezice "suma curentă", permite modelului să învețe cu succes înmulțirea cu mai multe cifre!