Erste Eindrücke von der Nutzung von GPT-5 in Sprachagenten. Es ist viel zu langsam, selbst wenn der reasoning_effort auf "minimal" eingestellt ist. Ich erhalte konstant eine Inferenzlatenz von über 700 ms. Es ist erst Tag eins, also könnte es an überhitzten GPUs liegen. Ich werde es in ein paar Tagen erneut testen.
1,3K