la réponse est que le routeur intelligent GPT-5 a été une avancée dans l'économie de l'inférence LLM. OpenAI a probablement doublé son ratio de profit/coût avec cela, par rapport à simplement servir un mélange contrôlé par l'utilisateur de o3 et o4-mini. Plus vous pouvez passer à des modèles simples, plus vous économisez.
Teknium (e/λ)
Teknium (e/λ)10 août, 20:23
Pourquoi est-ce le bon choix ? Sérieusement ? 1. Les modèles réfléchissent déjà davantage pour des problèmes plus difficiles en mode raisonnement. 2. Vous pourriez toujours lui faire essayer de raisonner, alors il ne vous décevra jamais au cas où il en aurait besoin. 3. Chaque fois qu'une réponse n'est pas satisfaisante si vous n'aviez pas le raisonnement activé, vous pouvez simplement l'activer. Pourquoi cela vaut-il autant de tracas ? Quels sont les véritables avantages de retirer le contrôle aux utilisateurs ? Pourquoi sont-ils si déterminés à cela ?
29,2K