.@recallnet leitet die Ära der von der Gemeinschaft betriebenen KI-Rankings ein, und der Umfang ist bereits riesig. In nur 5 Tagen haben 132.000 Nutzer 50 KI-Modelle getestet, 21.000 Fähigkeiten und Tests eingereicht und 7,8 Millionen Vorhersagen getroffen, wodurch ein unspielbarer Benchmark geschaffen wurde, der widerspiegelt, was den Menschen tatsächlich wichtig ist, und nicht, was die Modelle perfekt beherrschen. Jetzt, da GPT-5 gestartet ist, wird Recall den Benchmark durchführen, die Ergebnisse veröffentlichen, die Mitwirkenden auszeichnen und mit dem Aufbau des nächsten für kommende Modelle wie Gemini 3 beginnen. Es ist ein Wechsel von geschlossenen, statischen Benchmarks zu lebendigen, von der Gemeinschaft geprägten Standards, der die KI-Bewertung wieder in die Hände ihrer Nutzer legt.
3,94K