لماذا لا تستطيع المحولات تعلم الضرب؟ وجدت هذه الورقة أن التدريب العادي لا يبني أبدا روابط بعيدة المدى من المضاعفات. لذلك من خلال إضافة خسارة مساعدة جديدة تتنبأ ب "المجموع الجاري" ، فإنها تمكن النموذج من تعلم الضرب متعدد الأرقام بنجاح!