DApp Store | Web3 Hub for hendelser og spill

Populære emner

GPT-OSS underpresterer selv på benchmarks som krever rå verktøykall. For eksempel krever CORE-Bench at agenter kjører bash-kommandoer for å reprodusere vitenskapelige artikler. DeepSeek V3 scorer 18%. GPT-OSS scorer 11 %.

6,08K

Topp

Rangering

Favoritter

Trendende onchain

Trendende på X

Nylig toppfinansiering

Mest lagt merke til