一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

GPT-OSS 在需要原始工具调用的基准测试中表现不佳。例如，CORE-Bench 要求代理运行 bash 命令以重现科学论文。 DeepSeek V3 得分 18%。 GPT-OSS 得分 11%。

6.08K