então, depois de brincar com isso durante a maior parte do dia, nenhum conseguiu fazer isso (esperado), mas o gpt5 via codex desistiu muito e simplesmente travava (exemplo abaixo). Dito isso, o que acabou funcionando foi fazer o GPT5 criar a especificação detalhada com base no artigo arxiv e depois revisar o código opus.
xjdr
xjdr10/08, 00:50
"Como você avalia novos modelos?"
tens de saber o que estás a fazer para direcionar o tráfego e eu tive de criar os testes e os critérios de aprovação eu mesmo, mas os seus poderes combinados criaram algo que rivaliza com a minha versão existente. um teste inicial bastante impressionante, se sou sincero ...
23,88K