Todos estão a publicar o mesmo gráfico da apresentação da @OpenAI, mas aqui é onde está o sinal 👌
David Zhao
David Zhao8/08, 12:10
Primeiras impressões usando o GPT-5 em agentes de voz. Está muito lento, mesmo com o esforço de raciocínio definido como "mínimo". Estou constantemente a obter uma latência de inferência superior a 700ms. É apenas o primeiro dia, por isso pode ser que as GPUs estejam a derreter. Vou testar novamente dentro de alguns dias.
265