Claudeを使用して、GPT-OSS-120B、Qwen3-Coder-480B、およびClaude Opus 4の間でいくつかのテストを実行し、関連するタスクをコーディングしました。 1. ビットコインコアGUIリポジトリを読んで理解する 2. C++ での PageRank の実装 これが最終評決でした。 「GPT-OSS-120B は優れた価値を提供し、AI コーディング支援を大規模に実装しようとしている組織にとって明らかに勝者となります。最小限の品質差は、クロードの 54 倍の価格プレミアムを正当化するものではありません。」 CC@sama @gdb
1. ビットコインコアGUIリポジトリを読んで理解する 「テスト結果は、GPT-OSS-120B がコード分析タスクのパフォーマンスとコストの最適なバランスを提供し、Claude Opus 4 がプレミアム価格帯で最も包括的な分析を提供することを示しています。」
2. C++ での PageRank の実装 「ベストバランス:GPT-OSS-120B - 良好なコード品質 (10/11 スコア) - 最低コスト - 妥当な応答時間 - 並列実行とテストを含む」 .. 概要: - 本番コード生成には、GPT-OSS-120B が最高の価値を提供します - スピードが重要なタスクの場合、Qwen3-Coder-480B は最速を実現します。 - 最高品質のコードのために、Claude Opus 4は最も包括的な実装を提供します
2.61K