Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Jeg er litt overrasket over at ingen ennå har laget en Dwarf Fortress MCP-server som kan tillate en agent som Codex eller Claude Code å effektivt kontrollere spillet og overvåke tilstanden og fremgangen.
Jeg spilte det egentlig aldri selv, bare lastet det ned og sjekket det ut kort for rundt 10 år siden, men jeg likte å lese om det.
Det føles som om det ville være en veldig god test av en LLM for å se hvor lenge det kan holde dvergene i live og trives.
Fordi hvert spill til slutt resulterer i en kaskadekatastrofe som får alle dvergene til å dø, bør det være et naturlig stoppepunkt for det, noe som gjør det til en god referansekandidat. Det er i hvert fall min forståelse av det (spillernes motto er "Å tape er gøy").
Å gjøre en god jobb med disse spillene vil være avhengig av verktøykallende nøyaktighet og vedvarende sammenheng med lange oppgaver, pluss evnen til å overvåke og forstå dynamikken i et komplekst system og gjøre rettidige intervensjoner som forutser og motvirker problemer.
Og fordi det er terminalt innfødt, kan det effektivt overføres og behandles ved hjelp av vanlige tokens uten å trenge multimodal bildebehandling, noe som vil gjøre det langt mer effektivt enn andre spill.
I tillegg vet du at ingen AI-laboratorier har trent for dette (ennå!), så det er ubesmittet av "benchmaxxing."

2,06K
Topp
Rangering
Favoritter