如果 Grok 5 在 AI 工程方面比 Andrej Karpathy 更出色,我就會這麼說——那就是 AGI。 Zuck 現在不需要花費數十億來雇用 AI 研究員了。 Andrej 提到他的代碼庫(如 nanochat)完全是手寫的,而 claude/codex 代理則幾乎沒有幫助。當前的 LLM 在處理不在分佈範圍內的代碼時表現不佳,這些代碼不是模板或常見模式。 由 Andrej、Linus 或 Geohot 等人編寫的代碼是超出分佈範圍的。今天沒有任何 LLM 能夠匹配他們以獨特個人風格創建大型、連貫、穩固系統的能力。
我對埃隆充滿尊敬,順便提一下。他說「Grok 5 實現 AGI 的概率現在是 10% 並且在上升。」 我經常將他的「瘋狂預測」解釋為他的現實扭曲場——一種推動他的團隊實現不可能目標的方式。
好的,我之前不知道 Grok 4.20。 等待 Grok 6.9 在真正的 Human Last Exam — Andrej-bench 上的分數。
好的,我之前不知道 Grok 4.20 哈哈 在等 Grok 6.9 在真正的人類最後考試 — Andrej-bench 的分數。
199.33K