Estamos abrindo o código do BrowseComp ("Competição de Navegação"), um novo e desafiador benchmark projetado para testar o quão bem os agentes de IA podem navegar na Internet para encontrar informações difíceis de localizar. É como uma caça ao tesouro online... mas para agentes de navegação.
920,55K