热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
Grok 4 在前沿模型中仍然是 ARC-AGI-2 的最先进技术。
Grok 4 的得分为 15.9%,而 GPT-5 的得分为 9.9%。

8月8日 01:29
GPT-5 在 ARC-AGI 半私有评估中
GPT-5
* ARC-AGI-1: 65.7%,$0.51/任务
* ARC-AGI-2: 9.9%,$0.73/任务
GPT-5 Mini
* ARC-AGI-1: 54.3%,$0.12/任务
* ARC-AGI-2: 4.4%,$0.20/任务
GPT-5 Nano
* ARC-AGI-1: 16.5%,$0.03/任务
* ARC-AGI-2: 2.5%,$0.03/任务

478
热门
排行
收藏