En #NeurIPS2025, @danielhanchen (@UnslothAI), Davide Testuggine (@Meta), @joespeez (Meta) y @bhutanisanyam1 (Meta) lideraron una discusión centrada en cómo los entornos están moldeando la próxima etapa de la IA agentiva y el aprendizaje por refuerzo. Su sesión examinó por qué los entornos son centrales en cómo los agentes actúan, aprenden y son evaluados en entornos simulados y del mundo real, abarcando marcos de entornos de RL escalables, benchmarks de seguridad y robustez, simuladores de alto rendimiento para hardware heterogéneo, y cómo los entornos se integran con entrenadores, motores de inferencia y flujos de trabajo post-entrenamiento que apoyan la alineación y el despliegue. 📸 Más actualizaciones de #PyTorch en NeurIPS próximamente #AIInfrastructure #ReinforcementLearning