我有點驚訝的是,至今還沒有人製作出一個《矮人要塞》的MCP伺服器,能夠讓像Codex或Claude Code這樣的代理高效地控制遊戲並監控狀態和進展。 我自己從來沒有真正玩過,只是在大約10年前下載過並簡單查看了一下,但我喜歡閱讀關於它的內容。 這感覺像是一個非常好的大型語言模型(LLM)測試,看看它能讓矮人們活得多長久並繁榮發展。 因為每個遊戲最終都會導致某種級聯災難,導致所有矮人死亡,所以應該有一個自然的停止點,這使得它成為一個很好的基準候選者。至少這是我對它的理解(玩家的座右銘是“失敗是有趣的”)。 在這個遊戲中做得好將依賴於工具調用的準確性和持續的長任務一致性,以及監控和理解複雜系統動態的能力,並及時進行干預以預見和應對問題。 而且因為它是終端原生的,可以使用常規令牌高效傳輸和處理,而不需要多模態圖像處理,這使得它比其他遊戲更高效。 再加上你知道沒有AI實驗室為此進行過訓練(還沒有!),所以它沒有受到“基準最大化”的污染。
2.07K