a resposta é que o GPT-5 Smart Router foi uma revolução na economia de inferência de LLM. A OpenAI provavelmente dobrou sua relação lucro/custo com isso, em comparação a simplesmente servir uma mistura controlada pelo usuário de o3 e o4-mini. Quanto mais você puder passar para modelos simples, mais você economiza.
Teknium (e/λ)
Teknium (e/λ)10/08, 20:23
Por que é a decisão certa? A sério? 1. Os modelos já pensam mais para problemas mais difíceis em modo de raciocínio. 2. Você poderia sempre fazer com que ele tentasse raciocinar, assim nunca o decepcionará caso precise. 3. Sempre que uma resposta não for satisfatória se você não tiver o raciocínio ativado, você pode simplesmente ativá-lo. Por que vale tanto a pena? Quais são os verdadeiros benefícios de tirar o controle dos usuários? Por que eles são tão obstinados em relação a isso?
29,21K