1+1=3 2+2=5 3+3=? Banyak model bahasa (misalnya, Llama 3 8B, Mistral v0.1 7B) akan menjawab 7. Tapi mengapa? Kami menggali internal model, mengungkap mekanisme induksi fungsi, dan menemukan bahwa itu digunakan kembali secara luas ketika model mengalami kejutan selama pembelajaran dalam konteks. 🧵
6,37K