Codex や Claude Code のようなエージェントがゲームを効率的に制御し、状態と進行状況を監視できる Dwarf Fortress MCP サーバーをまだ誰も作っていないことに少し驚いています。 私自身は実際にプレイしたことがなく、10年ほど前にダウンロードして少しチェックしただけですが、それについて読むのは楽しかったです。 LLMがドワーフをどれだけ長く生き延び続けることができるかを確認するための非常に良いテストになるような気がします。 すべてのゲームは最終的にすべてのドワーフを死に至らしめるカスケード大惨事につながるため、それには自然な停止点があるはずであり、それが良いベンチマーク候補になります。少なくとも私の理解はそうです(プレイヤーのモットーは「負けるのは楽しい」です)。 このゲームをうまく行うには、ツール呼び出しの精度と持続的な長時間のタスクの一貫性に加えて、複雑なシステムのダイナミクスを監視および理解し、問題を予測して対処するタイムリーな介入を行う能力が必要です。 また、端末ネイティブであるため、マルチモーダルな画像処理を必要とせずに、通常のトークンを使用して効率的に送信および処理できるため、他のゲームよりもはるかに効率的です。 さらに、これについてトレーニングした AI ラボが (まだ!) ないこともご存知でしょう。
2.4K