Koska OpenAI ei päivittänyt GDPvalin kuvaa 7 GPT-5.2:n onnistumisprosentin vuoksi pitkissä tehtävissä, käytin GPT-5.2 Prota siihen. Kaavio olettaa, että prosessi on: delegoit pitkät tehtävät tekoälylle, arvioit tuloksen tunnin ajan, sitten päätetään yrittää uudelleen tai luovuttaa ja tehdä se itse.
Alkuperäinen (GPT-5:n voittoprosentti oli 39 % ihmisasiantuntijoita vastaan, GPT-5.2 oli noin 72 %)
GDPval on edelleen yksi viime vuoden tärkeimmistä tekoälyartikkeleista. Visio siitä, miten tekoäly tekee taloudellisesti arvokasta työtä.
187