LLM-er kan se ut til å resonnere godt, men et enkelt feil token kan avspore hele utgangen. Vårt nye arbeid viser at memorering på tokennivå er en viktig årsak til feil, spesielt under distribusjonsskifte. Vi presenterer: STIM 🔍🧠 🧵 #NLProc
7,51K