1+1=3 2+2=5 3+3=? Багато мовних моделей (наприклад, Llama 3 8B, Mistral v0.1 7B) дадуть відповідь на 7. Але чому? Ми заглиблюємося у внутрішні елементи моделі, виявляємо механізм індукції функцій і виявляємо, що він широко використовується повторно, коли моделі стикаються з несподіванками під час навчання в контексті. 🧵
6,38K