GPT-5-benchmarks har precis sjunkit – mycket bättre på kodning – Visuellt resonemang högre än mänskliga doktorsexamen – Enorm minskning av hallucinationer Vi får se hur dessa benchmarks utspelar sig, men de ser galna ut
4,97K