一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

GPT-OSS 在需要原始工具調用的基準測試中表現不佳。例如，CORE-Bench 要求代理運行 bash 命令以重現科學論文。 DeepSeek V3 得分 18%。 GPT-OSS 得分 11%。

6.1K