1+1=3 2+2=5 3+3=? Многие языковые модели (например, Llama 3 8B, Mistral v0.1 7B) ответят 7. Но почему? Мы углубляемся в внутренности модели, раскрываем механизм индукции функций и обнаруживаем, что он широко используется, когда модели сталкиваются с неожиданностями во время обучения в контексте. 🧵
6,39K