esto siempre ha sido incorrecto, pero ahora categóricamente incorrecto en la era de RL en dominios verificables Los modelos buscan la verdad e incluso interactúan con un mundo exterior difícil mediante el uso de herramientas