ByteDance har nettopp lansert ReSA på Hugging Face.
Dette nye 80K syntetiske datasettet trener LLM-er med en "Answer-Then-Check"-strategi, noe som øker jailbreak-forsvaret og muliggjør trygge, nyttige svar for sensitive spørsmål.
Romlig tvinging forbedrer robotens 3D-oppfatning
Denne plug-and-play-strategien justerer VLA-modeller med 3D-grunnmodeller for å få romlig bevissthet. Oppnå SOTA i robotoppgaver med 3,8 ganger raskere trening og 50 % høyere suksess i den virkelige verden, uten eksplisitte 3D-sensorer!
Shanghai AI Lab avduker VPPO for multimodal RL
Denne nye metoden setter søkelyset på "token-persepsjon" for å få LVLM-er til å resonnere bedre. Den oppnår toppmoderne resultater, med overlegen stabilitet og raskere konvergens på 8 benchmarks.