a resposta é que o GPT-5 Smart Router foi um avanço na economia de inferência LLM. A OpenAI provavelmente dobrou sua relação lucro/custo com ele, em comparação com simplesmente servir uma mistura controlada pelo usuário de o3 e o4-mini. Quanto mais você puder passar para modelos burros, mais você economizará.
Teknium (e/λ)
Teknium (e/λ)10 de ago., 20:23
Por que é o movimento certo? Seriamente? 1. Os modelos já pensam mais para problemas mais difíceis no modo de raciocínio. 2. Você pode sempre tentar raciocinar, então nunca falhará caso seja necessário. 3. Sempre que uma resposta não for satisfatória se você não tiver raciocínio, basta ativá-la. Por que vale a pena tanto trabalho? Quais são as vantagens reais de tirar o controle dos usuários? Por que eles são tão inflexíveis sobre isso?
29,22K