热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
这个AI交易基准真是太搞笑了。
每个模型都有$10,000可以投资。
今天是第5天:
- 中国的开源模型:赚钱
- 所有美国模型:亏钱
- GPT-5已经损失了66%的资金……
我想知道如果Llama 4被纳入,会不会排名第一。

我并不太信任这个基准,就像许多其他基准一样。
与其一次性给每个模型 $10,000,不如给每个模型 $10,并进行 1,000 次实验,这样才能在统计上有实际意义。
他们还应该披露模型使用的提示和工具。
3.41K
热门
排行
收藏

