svaret er at GPT-5 Smart Router har vært et gjennombrudd innen LLM-slutningsøkonomi. OpenAI har sannsynligvis doblet forholdet mellom fortjeneste og kostnad med det, sammenlignet med å bare servere en brukerkontrollert blanding av o3 og o4-mini. Jo mer du kan overføre til dumme modeller, jo mer sparer du.
Teknium (e/λ)
Teknium (e/λ)10. aug., 20:23
Hvorfor er det riktig trekk? Alvorlig? 1. Modeller tenker allerede mer på vanskeligere problemer i resonneringsmodus. 2. Du kan bare alltid få det til å prøve å resonnere, så vil det aldri svikte deg i tilfelle det trengs. 3. Hver gang et svar ikke er tilfredsstillende hvis du ikke hadde resonnement på, kan du bare slå det på. Hvorfor er det verdt så mye bry? Hva er de virkelige fordelene ved å ta kontrollen fra brukerne? Hvorfor er de så urokkelige på det?
29,19K