Se você tem 2 minutos para ler este longo post, você receberá meu feedback HONESTO sobre o Chat-GPT5. Eu estava animado para experimentar o Chat-GPT5 e o testei ao vivo por mais de 4 horas hoje, ao lado do Google Gemini 2.5 Pro e do Claude 4. E o veredicto final é... Estou muito decepcionado com os resultados. O Google Gemini teve o melhor desempenho na maioria dos prompts, e o Claude 4 geralmente ficou em segundo lugar (veja a tabela abaixo: 3 é bom, 1 é ruim). Uma tarefa em que o ChatGPT realmente se destacou foi criar um gerador de música baseado em navegador que responde a entradas como mover o mouse e clicar (mesmo com um recurso de gravação super legal), mas para tudo o mais, não entregou os resultados esperados e muitas vezes falhou em produzir um exemplo funcional mesmo após 2-3 prompts. Para dar um contexto completo, testei o Chat-GPT no site oficial e depois com o Cursor. Com o Cursor, funcionou MUITO melhor, mas ainda assim ficou muito atrás dos outros modelos. O que eu mais odiei foi ele ficar preso desde o primeiro prompt e não produzir nada funcional, enquanto os outros 2 modelos quase sempre tinham uma saída de algum tipo que você pelo menos podia verificar e testar. Hoje, também descobri que o Google Gemini permite criar uma aplicação multiplayer. Sim, você ouviu certo: ele sincroniza estado e transformação, por exemplo, para um jogo multiplayer (usando Firebase, mas ainda assim impressionante conseguir um protótipo funcional!). De graça. Claro que não é perfeito, mas isso abre tantas possibilidades para prototipagem de coisas, especialmente pequenos jogos multiplayer. Dito isso, acho que o GPT-5 é um modelo forte e é bastante rápido, mas eu esperava que ele superasse absolutamente os outros dois modelos menos recentes, o que não foi o caso, pelo menos com base no benchmark que testei (não os testei antes de ir ao vivo; este foi um teste em tempo real). Ficaria feliz em discutir com alguém que acha que este é "o novo modelo que você DEVE usar ou ficará para trás", porque essa não foi minha experiência neste conjunto específico de testes (que durou mais de 4 horas). Moral: não confie em tudo que você vê nas redes sociais, ou melhor ainda, não confie em ninguém. Faça seus próprios testes e pense com sua própria cabeça.
@patloeber desculpa pelos erros de digitação, fiquei muito empolgado.
4,51K