大型语言模型(LLMs)看似能够进行良好的推理,但一个错误的标记可能会使整个输出偏离轨道。我们的新研究表明,标记级别的记忆是失败的一个关键原因,尤其是在分布变化的情况下。 介绍:STIM 🔍🧠 🧵 #NLProc
7.52K