het meest slimme apparaat van de AI-scepticus is de score plafond benchmark prestaties voelen altijd logaritmisch aan bij tests met 0 - 100% scoring maar als je naar benchmarks zonder plafond kijkt, zien we een heel andere curve...
over dat gesproken, ik zou Aidanbench moeten draaien
2,03K