Przeprowadzam porównania rozumowania matematycznego dla nowego @OpenAI gpt-oss w @layerlens_ai. W benchmarku AIME 2025 @deepseek_ai R1 wypada nieco lepiej niż gpt-oss. Jednak w porównaniu do @Alibaba_Qwen, gpt-oss naprawdę przeważa.
368