Grok 4 在前沿模型中仍然是 ARC-AGI-2 的最先进技术。 Grok 4 的得分为 15.9%,而 GPT-5 的得分为 9.9%。
779.85K