Niet eens brons: Evaluatie van LLM's op de Internationale Wiskunde Olympiade 2025 🥉 Leuk blogbericht van het team achter MathArena: Evaluatie van LLM's op onbesmette wiskundewedstrijden () die een onafhankelijke analyse van de prestaties van LLM's op de IMO biedt.
Het ziet eruit als een geavanceerde versie van Gemini met Deep Think die zojuist 5 van de 6 IMO-problemen heeft opgelost, in totaal 35 punten heeft verdiend en officieel prestaties op gouden medailleniveau heeft behaald. Gefeliciteerd met de prestatie @lmthang❗️ Ik kan niet wachten om met dit model te spelen
42,68K