🚀 Apresentando o X-VLA; O novo modelo Visão-Linguagem-Ação com prompts suaves da LeRobot. O X-VLA foi construído para escalar em várias incorporações: diferentes robôs, câmeras, espaços de ação e ambientes, todos gerenciados por uma única espinha dorsal unificada de transformadores. - Generalista em robôs (Franka, WidowX, Agibot, sim + real) - IDs de domínio soft-prompt permitem que o modelo se adapte a novos hardwares com pequenos embeddings aprendíveis - Ajuste de fluxo + núcleo transformador para controle contínuo e suave de 50 Hz - Pré-treinado em um conjunto de dados misto de incorporação abrangendo 7+ plataformas e tarefas diversas - Ajuste fino em qualquer conjunto de dados usando um dos 6 checkpoints que fornecemos de imediato.