gpt-oss es una herramienta que funciona como motor de procesamiento / razonamiento. Es un modelo abierto bastante difícil de usar. En mi opinión, la tracción será limitada. La mejor manera de obtener tracción es lanzar modelos que sean flexibles, fáciles de usar sin herramientas y fiables. Luego, modelos interesantes a medida como el uso de herramientas más adelante.
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)12 ago, 16:04
gpt-oss 120B cayó drásticamente en lmarena, pierde ante Qwen 30B-3AB *instruct* (sin pensar) en cada categoría (excepto un ≈empate en matemáticas), por no hablar de su clase de peso y del compañero de categoría glm-4.5 air. No entiendo cómo puede suceder esto.
22,68K