gpt-oss é uma ferramenta apenas de processamento / raciocínio. É um modelo aberto difícil de usar. Na minha opinião, a tração será limitada. A melhor maneira de obter tração é lançar modelos que sejam flexíveis, fáceis de usar sem ferramentas e confiáveis. Depois, modelos interessantes sob medida, como o uso de ferramentas, mais tarde.
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)12/08, 16:04
gpt-oss 120B caiu drasticamente no lmarena, perde para Qwen 30B-3AB *instruir* (sem pensar) em todas as categorias (exceto ≈empate em matemática), sem mencionar sua classe de peso e o colega de categoria glm-4.5 air. Não entendo como isso pode acontecer.
22,68K