Tenho visto muitas pessoas a falar sobre como acharam que o GPT-5 é um retrocesso em relação aos modelos anteriores. Não posso falar sobre a experiência delas, mas a minha tem sido o oposto. Ontem, pedi ao GPT-5 Thinking para criar uma linguagem específica de domínio complicada para especificar a semântica das instruções de máquina em CPUs. (O objetivo disso é facilitar a criação e manutenção de emuladores para computadores antigos, que é um hobby meu.) O LLM não estava perfeito, mas fez um excelente trabalho e demonstrou uma verdadeira criatividade na tarefa. A DSL resultante é excelente e teria exigido um trabalho enorme se eu tivesse feito à mão. Não terminei completamente de trabalhar com o LLM na especificação, mas quando o fizer, suspeito que ele será capaz de fazer a maior parte do compilador de uma só vez. Talvez para algumas pessoas a coisa esteja a funcionar mal; não sei o que estão a tentar fazer. Também não posso falar sobre os gostos delas em coisas como "personalidade", e além disso, o meu prompt de sistema pede implicitamente ao modelo para ser ultra profissional e sem sal. (Também não tenho interesse que a IA me forneça companhia ou apoio emocional e não quero ter uma relação parasocial com ela.) Para mim, certamente está a fazer um trabalho muito bom, e numa tarefa técnica extremamente complicada. Note que eu entendo extremamente bem o trabalho que estou a pedir ao sistema para fazer, estou numa posição de detectar erros que ele está a cometer e corrigi-los, e considero um trabalho que está 95% feito após algumas iterações um resultado realmente bom porque posso corrigir o resto. Talvez se você estiver a tentar fazer com que a coisa crie um design de circuito funcional de uma só vez e não souber nada de engenharia elétrica, a coisa ainda não esteja a fazer o que você quer. Para mim, no entanto, é uma ferramenta incrível e é uma melhoria distinta em relação ao o3.
Vejo muitas queixas sobre a personalidade ser "como uma secretária sobrecarregada", e eu nunca experimentei nada parecido, mas, por outro lado, eu uso um prompt de sistema e parece que a maioria das pessoas não usa, e eu nunca uso o modelo sem raciocínio, e parece que a maioria das pessoas só usa a versão sem raciocínio do modelo.
43,48K