melatih model bahasa melihat karakter Unicode yang bahkan belum mereka temukan