Estamos a pensar em tornar a nossa ferramenta interna de benchmarking para agentes de codificação (não modelos) como claude code/cursor/codex/amp/devin/etc mais acessível ao público. Mande-me uma mensagem se estiver interessado em vê-la e em dar feedback sobre o que gostaria de ver!
689