Большие языковые модели могут казаться способными к рассуждению, но один неверный токен может полностью испортить вывод. Наша новая работа показывает, что запоминание на уровне токенов является ключевой причиной неудач, особенно при изменении распределения. Представляем: STIM 🔍🧠 🧵 #NLProc
11,87K