Apresentando o INTELLECT-3: Escalando RL para um modelo MoE de 100B+ na nossa pilha de ponta a ponta Alcançando desempenho de ponta para seu tamanho em matemática, código e raciocínio Construído usando as mesmas ferramentas que colocamos em suas mãos, desde ambientes e avaliações, frameworks de RL, sandboxes e mais