不,你們都錯了,GPT-5 是一次飛躍 我在這裡百分之百加碼 我不想太快發帖然後後悔,但它剛剛解決了一堆非常非常難的調試提示,這些提示之前是無法解決的(由 AI),然後設計了一個華麗的像素化 Gameboy 遊戲,細節和質量明顯超過我見過的任何東西。 這個模型不可能差。 我覺得你們都對 benchmaxxers 感到創傷,並且過度補償一個實際上真的很好的模型。我也覺得你們低估了 gpt-oss 的優勢(但我最後的帖子確實是匆忙的) 不過我仍然不知道它是否適合嚴肅的編程(4o,o3 絕對不行),但看起來是可以的?一個像 Opus 一樣可靠但比 o3 更聰明的編碼模型,將徹底改變我的工作流程。不過,Opus 不需要思考就能出色,所以這可能對它有利。 就我所知,我只真正使用了 3 個模型: - Opus 4.1 用於編碼 - Gemini 2.5 很少用於編碼,當 Opus 失敗時 - o3 用於除了編碼以外的所有事情
508