DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

GPT-OSS presterar sämre även på riktmärken som kräver anrop av råa verktyg. Till exempel kräver CORE-Bench att agenter kör bash-kommandon för att reproducera vetenskapliga artiklar. DeepSeek V3 får 18 %. GPT-OSS får 11 %.

6,1K

Topp

Rankning

Favoriter

Trendande på kedjan

Trendande på X

Senaste toppfinansieringarna

Mest anmärkningsvärda