我使用Claude对GPT-OSS-120B、Qwen3-Coder-480B和Claude Opus 4进行了一些与编码相关的任务测试: 1. 阅读并理解Bitcoin Core GUI代码库 2. 在C++中实现PageRank 这是它的最终评判: "GPT-OSS-120B提供了卓越的价值,使其成为希望大规模实施AI编码辅助的组织的明显赢家。质量差异微乎其微,不足以证明Claude的54倍价格溢价。" cc @sama @gdb
1. 阅读并理解 Bitcoin Core GUI 仓库 “测试结果表明,GPT-OSS-120B 在代码分析任务中提供了最佳的性能与成本平衡,而 Claude Opus 4 在高价位上提供了最全面的分析。”
2. PageRank 在 C++ 中的实现 "最佳平衡:GPT-OSS-120B - 良好的代码质量(10/11 分) - 成本最低 - 合理的响应时间 - 包含并行执行和测试" .. 总结: - 对于生产代码生成,GPT-OSS-120B 提供了最佳价值 - 对于速度关键的任务,Qwen3-Coder-480B 提供最快的速度 - 对于最高质量的代码,Claude Opus 4 提供了最全面的实现
2.59K