アンソロピックは、これまでテストしたすべての人間エンジニアよりも高いスコアを出した。 Claude Opus 4.5は昨日リリースされ、GPT-5.1-Codex-Max、Gemini 3 Pro、そしてすべての人間候補者を社内コーディング試験で破りました。 誰も話題にしていないことをお伝えします: