1+1=3 2+2=5 3+3=? Nhiều mô hình ngôn ngữ (ví dụ: Llama 3 8B, Mistral v0.1 7B) sẽ trả lời là 7. Nhưng tại sao? Chúng tôi đào sâu vào nội bộ của mô hình, khám phá một cơ chế suy diễn hàm, và phát hiện rằng nó được sử dụng rộng rãi khi các mô hình gặp phải những điều bất ngờ trong quá trình học theo ngữ cảnh. 🧵
6,38K