Un análisis preciso 👇👇👇 de los modelos de envío y servicio implica acertar en cientos de detalles matizados. Las pruebas en esta área rara vez son de aprobado/reprobado.
clem 🤗
clem 🤗6 ago, 23:44
Hay muchas opiniones contradictorias sobre gpt-oss (¡viva el código abierto en el centro de atención)! Estamos impulsando la demostración oficial de @openai con proveedores de inferencia de HF gracias a @FireworksAI_HQ, @CerebrasSystems, @GroqInc y @togethercompute, así que tenemos un asiento en primera fila para ver lo que está sucediendo. Algo a recordar: la inferencia para nuevos modelos abiertos de frontera no es fácil, especialmente con un nuevo formato como harmony y el volumen de interés que gpt-oss está generando desde el principio. Los picos tempranos pueden afectar temporalmente la calidad, precisión y "vibras" generales, particularmente 24 horas después del lanzamiento, cuando los proveedores están corriendo contra el reloj con apenas algo de sueño. Algunos consejos para evitar formar opiniones erróneas: - Si te importa obtener vibras lo más rápido posible, utiliza una configuración alojada que te ofrezca una diversidad de proveedores como los proveedores de inferencia de HF (y sigue las guías estándar oficiales ( - Si puedes, pruébalo en tu propio hardware desde las páginas de modelos de HF (que suelen ser buenas fuentes de verdad con transformers y vLLM (ten en cuenta que también puedes cometer errores en la generación allí) - Relájate y toma X opiniones extremas con un grano de sal. Incluso si los primeros días pueden ser confusos, el poder del código abierto es que no hay trampas, así que descubriremos todas las fortalezas y limitaciones de estos modelos progresivamente. Personalmente, creo que este es un lanzamiento histórico por parte del equipo de @OpenAI, del tipo que recordaremos en 10 años por sus implicaciones. ¡No puedo esperar a ver lo que depara el futuro 🚀🚀🚀
2,57K