Trening av en språkmodell ved å se Unicode-tegn de ikke engang har funnet opp ennå