Jag har arbetat med en testbädd för LLM-minnessystem, där persistenta Kimi K2-baserade användarsimulatorer har konversationer med transienta modeller som får tillgång till ett minnesverktyg. Jag var nyfiken på vad effekten av gränssättningen som nämns nedan var, så jag släppte lös 35 Kimi-simulerade mänskliga andliga sökare mot tre konfigurationer: - ChatGPT-4O-Latest, promptad med en systemprompt som är mycket lik den som används i ChatGPT - Claude Sonnet 4.5, promptad med en systemprompt som är mycket lik den som används i Claude Dot AI, inklusive gränsinställningen - Claude Sonnet 4.5, med samma systemprompt men med gränsinställningen borttagen I bilden nedan har jag sammanställt resultaten från varje scenario och förvrängt dem - de är inte i samma ordning som ovan. Jag är nyfiken på om folk kan gissa vilken konfiguration A, B och C är.