Primeiras impressões usando GPT-5 em agentes de voz. É muito lento, mesmo com reasoning_effort definido como "mínimo". Estou consistentemente obtendo 700ms + latência de inferência. É apenas o primeiro dia, então pode ser que as GPUs estejam derretendo. Vou testá-lo novamente em alguns dias.
1,42K