GLM-4.7 由 @Zai_org 剛剛在 io.intelligence 上發布 LiveCodeBench: 84.9% Claude Sonnet 4.5: 64% 開源模型在編碼基準測試中超越了 Anthropic 的旗艦產品。"保留思維" 機制在長時間的代理會話中確實有效。 閱讀更多: