Estamos pensando em tornar nossa ferramenta interna de benchmarking para agentes de codificação (não modelos) como claude code/cursor/codex/amp/devin/etc mais acessível ao público Me mande uma DM se estiver interessado em vê-lo e fornecer feedback sobre o que gostaria de ver!
688