GPT-5 是否是一個良好的里程碑,讓我們最終不再稱呼一切為「模型」,而開始區分聊天機器人、API、模型權重並進行相應的比較/基準測試? 將聊天機器人的輸出(這可能是數十種不同模型權重的結果)與單一模型權重的輸出進行比較毫無意義,這就像將一輛車與一個引擎進行比較(來自 @random_walker @sayashk 的書)
9.22K