Nous lançons BrowseComp, qui signifie Concurrence de navigation. 🏎️ Pensez-y comme aux concours de codage ou de mathématiques : bien que ces concours ne reflètent peut-être pas parfaitement l’EWS ou la recherche mathématique du monde réel, ils capturent une étincelle d’intelligence. C’est LE repère dont nous devrions nous soucier lorsque nous évaluons l’intelligence d’agents de navigation de type recherche approfondie.
OpenAI
OpenAI11 avr. 2025
Nous open-sourçons BrowseComp ("Compétition de Navigation"), une nouvelle référence stimulante conçue pour tester la capacité des agents IA à naviguer sur Internet pour trouver des informations difficiles à localiser. C'est comme une chasse au trésor en ligne... mais pour les agents de navigation.
465K