Estou meio surpreso que ninguém tenha ainda criado um servidor MCP para Dwarf Fortress que pudesse permitir que um agente como Codex ou Claude Code controlasse o jogo de forma eficiente e monitorasse o estado e o progresso. Eu nunca joguei realmente, apenas o baixei e dei uma olhada rapidamente há cerca de 10 anos, mas gostei de ler sobre isso. Parece que seria um ótimo teste para um LLM ver quanto tempo ele conseguiria manter os anões vivos e prosperando. Como todo jogo eventualmente resulta em alguma catástrofe em cascata que faz com que todos os anões morram, deveria haver um ponto de parada natural, o que o torna um bom candidato a referência. Pelo menos essa é a minha compreensão (o lema dos jogadores é "Perder é divertido"). Fazer um bom trabalho com esses jogos dependeria da precisão na chamada de ferramentas e da coerência em tarefas longas, além da capacidade de monitorar e entender a dinâmica de um sistema complexo e fazer intervenções oportunas que antecipem e contrabalançam problemas. E como é nativo de terminal, poderia ser transmitido e processado de forma eficiente usando tokens regulares, sem precisar de processamento de imagem multimodal, o que o tornaria muito mais eficiente do que outros jogos. Além disso, você sabe que nenhum laboratório de IA treinou para isso (ainda!), então está livre de "benchmaxxing."
3,79K