A ByteDance acaba de lançar o ReSA no Hugging Face.
Este novo conjunto de dados sintético de 80K treina LLMs com uma estratégia de "Responder-Depois-Verificar", melhorando a defesa contra jailbreak e permitindo respostas seguras e úteis para consultas sensíveis.
A Força Espacial melhora a percepção 3D do robô
Esta estratégia plug-and-play alinha modelos VLA com modelos de fundação 3D para ganhar consciência espacial. Alcance SOTA em tarefas robóticas com um treinamento 3,8x mais rápido e 50% mais sucesso no mundo real, sem sensores 3D explícitos!
O Laboratório de IA de Xangai apresenta o VPPO para RL multimodal
Este novo método destaca a "percepção de token" para melhorar o raciocínio dos LVLMs. Ele alcança resultados de ponta, com estabilidade superior e convergência mais rápida em 8 benchmarks.