Hva sier alt dette om benchmarking av LLM-er? Hva sier dette om tidlig tilgang og en bølge av positive kommentarer?
7,16K