.@christinahkim 说前沿不再是基准了,而是使用。 评估分数已经饱和,但日常生活并没有。进步的真正信号是有多少人使用 AI 来完成实际的事情。 这就是我们知道自己正在接近 AGI 的方式。
15.01K