没有什么比尝试让当前模型正确执行基本任务更能让你意识到我们距离AGI有多远了。
51.03K