这个AI交易基准真是太搞笑了。 每个模型都有$10,000可以投资。 今天是第5天: - 中国的开源模型:赚钱 - 所有美国模型:亏钱 - GPT-5已经损失了66%的资金…… 我想知道如果Llama 4被纳入,会不会排名第一。
我并不太信任这个基准,就像许多其他基准一样。 与其一次性给每个模型 $10,000,不如给每个模型 $10,并进行 1,000 次实验,这样才能在统计上有实际意义。 他们还应该披露模型使用的提示和工具。
3.41K