Het is verrassend hoe weinig interesse er was in het kwalitatief inspecteren van gpt-oss CoTs. Ik bedoel, dit zijn de jongens die het paradigma hebben gecreëerd, ik neem aan dat ze geen GRPO-varianten gebruiken zoals ≈iedereen anders, zijn er verschillen? Nee, mensen geven alleen om de mogelijkheden.
1,93K