1+1=3 2+2=5 3+3=? 多くの言語モデル (例: Llama 3 8B、Mistral v0.1 7B) は 7 に答えます。でもどうして。 モデルの内部を掘り下げ、関数誘導メカニズムを明らかにし、モデルがコンテキスト内学習中に驚きに遭遇したときに、それが広く再利用されることを発見しました。🧵
6.38K