1+1=3 2+2=5 3+3=? Molti modelli linguistici (ad es., Llama 3 8B, Mistral v0.1 7B) risponderanno 7. Ma perché? Esploriamo gli interni del modello, scopriamo un meccanismo di induzione delle funzioni e troviamo che viene ampiamente riutilizzato quando i modelli si trovano di fronte a sorprese durante l'apprendimento in contesto. 🧵
6,36K