抱歉,但任何仍然说“LLMs只是预测文本”的人此刻都在让自己感到尴尬。 正如OpenAI的roon所说,“这是绝对错误的”
roon
roon8月6日 05:39
这一直都是错误的——但在可验证领域的RL时代,这种错误是绝对的。 模型是追求真理的,甚至通过工具使用与一个严酷的外部世界互动。
349.71K