1+1=3 2+2=5 3+3=? Wiele modeli językowych (np. Llama 3 8B, Mistral v0.1 7B) odpowie 7. Ale dlaczego? Zagłębiamy się w wewnętrzne mechanizmy modelu, odkrywamy mechanizm indukcji funkcji i stwierdzamy, że jest on szeroko wykorzystywany, gdy modele napotykają niespodzianki podczas uczenia się w kontekście. 🧵
6,37K