Цікаво, чи може зробити softmax у базовому 2 замість базового e корисною оптимізацією на якомусь апаратному забезпеченні з фіксованою точкою. Додайте 1 до дробової частини та зсув ліворуч від інтегральної частини як приблизно близьке наближення 2^fixed_point.