SWE-rebench fra Nebius, problemer fra 31 aug til 30 sep De trekker oppmerksomhet til GLM 4.6 som er i samme nivå som GPT-5-medium, men jeg merker veldig sterk ytelse av *begge* GLMs 4.5* (utgitt 11. august), faktisk er den nesten identisk. Så jeg forventer store ting fra 4.6 Air.