Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Sentient
Garantir que a Inteligência Geral Artificial é de código aberto e não é controlada por uma única entidade. @SentientEco @OpenAGISummit
A partilhar algum conteúdo bónus relacionado com a nossa excelência "full-stack" 😁
Recentemente apresentámos na @COLM_conf 2025 em Montréal—em colaboração com @Princeton e @UTAustin—avançando o raciocínio a longo prazo, a coordenação multi-agente e a estratégia social.
SPIN-Bench é um benchmark unificado para Planeamento Estratégico, Interação e Negociação, abrangendo planeamento PDDL, jogos competitivos/cooperativos e negociação ao estilo Diplomacy.
🧵 Mergulhe mais fundo para aprender porque construímos o SPIN-Bench e como ele avança o raciocínio de IA na vanguarda.


Sentient15/10, 05:59
Estamos entusiasmados em anunciar que @NeurIPSConf— a maior conferência de IA do mundo— aceitou 4 dos nossos artigos em várias categorias. Alguns poderiam até chamar isso de "excelência full-stack" 😁
Aqui está uma prévia do nosso trabalho que foi reconhecido por suas inovações:
➡️ OML 1.0 (Pista Principal): impressão digital escalável de LLM— uma melhoria de cem vezes em relação às tentativas de impressão digital legadas para modelos abertos, injetando 24.576 impressões persistentes enquanto o máximo anterior era ~100 impressões digitais… sem qualquer queda no desempenho do modelo.
➡️ LiveCodeBenchPro (Pista de Dados e Benchmark): nosso benchmark personalizado focado na capacidade de programação, ilustrando as verdadeiras capacidades de desempenho de codificação dos modelos. Neste benchmark, conseguimos criar modelos 10x menores, usando 20% dos dados, para alcançar resultados comparáveis aos modelos concorrentes.
➡️ MindGames Arena (Pista de Competição): selecionado pela NeurIPS para realizar uma competição de IA para agentes se melhorarem através de jogos sociais. O próximo paradigma de melhoria da IA vem através da auto-otimização, e estamos extremamente entusiasmados em sediar esta competição pioneira para criar IA auto-melhorante.
➡️ OML (Workshops e Tutoriais—Lock-LLMs): nosso trabalho estabeleceu o desafio e a solução em torno da segurança do modelo: um primitivo que permite aos construtores desenvolver modelos abertos com controle verificável, criptograficamente imposto sob acesso de caixa branca.
Fique atento para threads detalhadas ao longo da semana!
135,58K
Os jogos de IA estão a decorrer...
A forma mais rápida de melhorar a IA agora é permitir que os agentes aprendam em arenas que recompensam o planeamento a longo prazo e o raciocínio social. E esse é o plano.
Estamos a colaborar com @Princeton, @UTAustin, @Meta, @Radboud_Uni, @nyuniversity, @MIT_CSAIL e a Agência para a Ciência, Tecnologia e Pesquisa para trazer uma arena unificada para testar o raciocínio estratégico, multi-agente e social para agentes LLM (pense em engano, cooperação, formação de coligações e conflito).
🧵 Leia mais sobre a competição que estamos a organizar @NeurIPSConf e porque estamos entusiasmados com a IA a jogar jogos.

183,75K
Top
Classificação
Favoritos