Zastanawiam się, jak bardzo różnią się łańcuchy myślenia gpt-oss od prawdziwych, które stoją za GPT-5. Czy wymyślili całkowicie oddzielny, o3-tierowy schemat RL dla oss, tylko po to, aby nie pozwolić żadnemu PRAWDZIE alpha uciec? W przeciwnym razie, dlaczego ten skomplikowany taniec z lekkim opóźnieniem i podsumowaniami akapitów?
2,24K