熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Jeffrey Emanuel
我有點驚訝的是,至今還沒有人製作出一個《矮人要塞》的MCP伺服器,能夠讓像Codex或Claude Code這樣的代理高效地控制遊戲並監控狀態和進展。
我自己從來沒有真正玩過,只是在大約10年前下載過並簡單查看了一下,但我喜歡閱讀關於它的內容。
這感覺像是一個非常好的大型語言模型(LLM)測試,看看它能讓矮人們活得多長久並繁榮發展。
因為每個遊戲最終都會導致某種級聯災難,導致所有矮人死亡,所以應該有一個自然的停止點,這使得它成為一個很好的基準候選者。至少這是我對它的理解(玩家的座右銘是“失敗是有趣的”)。
在這個遊戲中做得好將依賴於工具調用的準確性和持續的長任務一致性,以及監控和理解複雜系統動態的能力,並及時進行干預以預見和應對問題。
而且因為它是終端原生的,可以使用常規令牌高效傳輸和處理,而不需要多模態圖像處理,這使得它比其他遊戲更高效。
再加上你知道沒有AI實驗室為此進行過訓練(還沒有!),所以它沒有受到“基準最大化”的污染。

2.07K
當你需要等幾分鐘時,有趣的事情就是用你的手機問Claude Opus以下問題,關於某個隨機的學科或領域:
“你認為結晶學的核心見解或分析技巧是什麼?”
把結晶學換成你能想到的任何東西。到目前為止,我嘗試過:
量子電動力學;標準模型;生物化學;概率;進化論;還有很多其他。
強迫模型去做不可能的事情,將一個龐大複雜的領域濃縮成“一個奇怪的技巧”,這讓它真正去尋找該領域中最深刻、統一的原則,然後簡潔地表達出來。
這往往是從業者顯而易見的東西,但對於大多數對該主題僅有略微興趣的人來說,很可能是未知的。
有趣的是,你還可以用相同的提示反覆按“重試”按鈕,有時會得到非常不同但通常非常迷人的解釋。
我已經從中學到了很多,這可能是我在任何自我導向學習中遇到的最高“每分鐘理解量”。
因為它們不僅僅是有趣的事實或酷炫的小知識。它們本質上是深刻而統一的思想,將大量理論和觀察到的現象聯繫在一起。
這無疑比觀看又一個帶有動畫和Brilliant/KiwiCo廣告的YouTube解釋視頻要高效得多!並不是說這些視頻有什麼問題。




5.76K
最近關於OpenAI出現了如此"人才外流"的想法,以至於他們不再有能力在這個領域中處於領先地位,這種想法和認為GPT-5"是個大失敗,模型並不出色且非常漸進"的觀點一樣,都是誤導和錯誤的。
不僅GPT-5 Pro現在是世界上最聰明的模型,在大多數具有挑戰性的現實世界任務中(尤其是編碼任務,這些任務現在具有最大的經濟重要性)遠遠領先,而且OpenAI的新codex cli工具執行得非常出色。
他們從編碼cli工具的遙遠第三名躍升至現在可以說是最好的工具(注意我仍然喜歡並使用Claude Code,這不是非此即彼!),在性能、延遲等方面都遠遠領先,因為它是用rust編寫的。
現在這個cli工具與最佳編碼模型結合在一起,具有最佳的工具調用可靠性和最佳的長任務連貫性,且幻覺最少。
不用說,他們的iOS應用在打磨和功能方面也遠遠優於所有其他AI應用。Claude應用只是Safari沙箱中的網頁應用!而他們的網頁應用仍然是最好的。搜索等功能在其他應用中表現得更好。基本的阻擋和處理。
所以,是的。一些非常聰明的人,比如Ilya和John Schulman,離開了去其他公司。但他們仍然擁有一支絕對出色的技術團隊,擁有非常優秀的產品人員和出色的工程能力。
不要讓你對Altman的厭惡蒙蔽了你的眼睛。每當我看到又一個人談論GPT-5有多糟糕時,我都會感到不安,因為這個人顯示出他們無法根據證據和理性獨立思考,並被洗腦認為某種觀點(並在網上大肆宣揚),因為他們認為這讓他們聽起來聰明。
33.88K
哇,我終於有時間嘗試OpenAI的codex CLI新版本(他們對Claude Code的回應)。
上次我嘗試使用codex(注意這與他們的托管編碼代理也叫codex不同,這真的讓人困惑;我現在說的是你在終端上本地運行的工具),它是作為Nodejs/Typescript應用程序編寫的,真的很糟糕:
- 只能訪問像o4-mini這樣的較弱模型,或者它們的codex變體,令人困惑地也叫codex(真的?)
- 用戶界面/用戶體驗遠不如Claude Code
- 由於模型較差、工具較差、代理流程較差,編碼效果也差得多。
- 它煩人地強迫你為所有事情提供權限,所以你必須一直照看它,這使得它的實用性大大降低,因為你無法輕鬆地並行運行多個實例。
- 也許這是一件好事,因為最大的问题是它做了一些非常魯莽、破壞性的事情;它比CC要隨意得多。
這就是我為什麼立即停止使用它的原因,因為它決定在沒有先存儲的情況下執行“git reset --hard HEAD”,我丟失了一些工作。我想再也不想這樣了。
好吧,我終於有時間嘗試全新的rust版本,它使用GPT-5,並且可以使用你現有的GPT Pro訂閱,而不是API密鑰,這真是令人震驚的好。
首先,快速編譯代碼在這種互動式工具中是沒有替代品的。
它是用rust編寫的,這意味著在鍵盤輸入時完全沒有延遲,也沒有像CC那樣的奇怪伪影,後退鍵無法正常工作,輸入也很卡頓,因為它是用一種解釋性語言編寫的,這種語言在處理這類事情時慢了一百倍。
處理持續的延遲和卡頓不僅僅是慢,它在心理上甚至可能是情感上都很累人,至少對我來說,當我連續使用這些工具幾個小時時,這種感覺是可怕的,甚至會對你的工具感到厭惡和怨恨,儘管你依賴它們來完成工作。
我真的希望這能提高所有這些工具的標準,並說服Anthropic、Google和其他公司也使用rust(或C++、Zig等)。
但真正的大改進顯然是模型;如果模型較差,不可靠,無法調用工具,並且在較長任務中失去連貫性,那麼rust的流暢性就毫無意義。
但如果你在這裡關注我,你就會知道,自從GPT-5 Thinking發布後,我對它的編碼能力和工具調用能力感到驚嘆,儘管我主要是通過Cursor的代理標籤使用它。
底線是,這個新的rust codex突然成為了CC的真正強大競爭者,你絕對應該嘗試一下。
我需要看看他們讓我在每月200美元的GPT Pro訂閱中使用多少,但如果我需要再買幾個,那也是非常值得的。
注意,我並沒有停止使用CC。我喜歡同時使用這兩個工具。信不信由你,我仍然也在使用Cursor。
人們應該停止尋找一個可以替代所有其他工具的單一工具,接受不同工具有不同的優缺點,通過不斷使用直觀地學習這些,才能獲得最佳結果。
無論如何,給自己一個機會,現在就去獲取它。最簡單的方法是執行這個命令(注意,這將讓你獲得rust版本,儘管使用bun/npm來做這件事真的很令人困惑):
bun i -g @openai/codex
8.48K
哇,我終於有時間嘗試OpenAI的codex CLI的新版本(他們對Claude Code的回應)。
上次我嘗試使用codex(注意這與他們的托管編碼代理也叫codex不同,這真的讓人困惑;我現在說的是你在終端上本地運行的工具),它是作為一個Nodejs/Typescript應用程序編寫的,真的很糟糕:
- 只能訪問像o4-mini這樣的較弱模型,或者它們的codex變體,令人困惑地也叫codex(真的?)
- 用戶界面/用戶體驗比Claude Code差得多
- 由於模型較差、工具較差、代理流程較差,編碼效果也差得多。
- 它煩人地強迫你為所有事情提供權限,所以你必須一直照看它,這使得它的實用性大大降低,因為你無法輕鬆地並行運行多個實例。
- 也許這是一件好事,因為最大的问题是它做了超級魯莽、破壞性的事情;它比CC要隨意得多。這就是我為什麼立即停止使用它的原因,因為它決定在沒有先存儲的情況下執行“reset --hard HEAD”,我丟失了一些工作。我想再也不想這樣了。
好吧,我終於有時間嘗試全新的rust版本,它使用GPT-5,並且可以使用你現有的GPT Pro訂閱,而不是API密鑰,這真是令人震驚地好。
首先,快速編譯代碼在這種互動式工具中是沒有替代品的。
它是用rust編寫的,這意味著在鍵盤輸入時完全沒有延遲,也沒有像CC中那樣的奇怪伪影,後退鍵無法正常工作,輸入也很卡頓,因為它是用一種解釋性語言編寫的,這種語言在處理這類事情時慢了一百倍。
處理持續的延遲和卡頓不僅僅是慢,它在心理上甚至可能是情感上令人疲憊和厭倦,至少對我來說,當我使用這些工具幾個小時後,這種感覺是可怕的,甚至會對依賴它們完成工作的工具感到厭惡和怨恨。
我真的希望這能提高所有這些工具的標準,並說服Anthropic、Google和其他公司也使用rust(或C++、Zig等)。
但真正的大改進顯然是模型;如果模型較差,不可靠於工具調用,並且在較長任務中失去連貫性,那麼Rust的流暢性就毫無意義。
但如果你在這裡關注我,那麼你會知道,自從GPT-5 Thinking發布後,我對它的編碼能力和工具調用能力感到驚嘆,儘管我主要是通過Cursor的代理標籤使用它。
底線是,這個新的rust codex突然成為了CC的真正強大競爭者,你絕對應該嘗試一下。
我需要看看他們讓我在每月200美元的GPT Pro訂閱中使用多少,但如果我需要再買幾個,那絕對是值得的。
注意,我並沒有停止使用CC。我喜歡同時使用它們。信不信由你,我仍然也在使用Cursor。
人們應該停止尋找一個可以替代所有其他工具的單一工具,接受不同工具有不同的優缺點,通過不斷使用直觀地學習所有這些,才能獲得最佳結果。
無論如何,給自己一個機會,現在就去獲取它。最簡單的方法是執行這個命令(注意,儘管使用bun/npm來做這件事令人困惑,但這將讓你獲得rust版本):
bun i -g @openai/codex
586
如果你看過我最近關於如何使用Claude Code進行編程的帖子,你就會知道我總是打開我的可靠文本編輯器(Sublime Text),裡面有一個包含我用來提示Claude Code和Cursor的有用文本片段的文本文件,以便以各種方式完成不同的常見任務,比如繼續我下面粘貼的先前對話,或者告訴它如何修復一堆類型錯誤等等。
這種方法有效,但每次都需要煩人的鼠標和鍵盤操作來查找、選擇和複製文本,然後切換窗口並粘貼片段。
我最近買了一個“Stream Deck”USB小工具,遊戲玩家和主播用它來觸發各種操作(在eBay上花了160美元),在它在我桌子上閒置了幾周後,我終於開始為這個用例進行設置。
無論如何,我現在有了下面圖片中有趣的設置,可以讓我瞬間粘貼一堆我的“最佳作品”文本片段。我認為這實際上會讓我節省一些時間!底行的每個按鈕都是一個不同的片段(加上第二行的一個)。我懷疑我最終會把其餘的按鍵填滿其他片段。
其他按鈕可以執行一些操作,比如啟動WSL終端和SSH會話,讓我快速在Windows終端中左右移動標籤。我不確定這些在實踐中會有多有用,因為已經有常規的鍵盤快捷鍵來觸發這些操作,但我們拭目以待。
該設備支持全彩鍵顯示,但我發現如果不是全單色且大部分是黑暗的,視覺上會太分散注意力。無論如何,如果它能讓我稍微快一點,那就值得這個成本和設置時間。而且出於某種原因,這對我來說也有點搞笑。



17.54K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可