Ho sentito che l'apprendimento per rinforzo funziona solo con ricompense verificabili? 😛 Congratulazioni!!
Alexander Wei
Alexander Wei19 lug 2025
1/N Sono entusiasta di condividere che il nostro ultimo @OpenAI ragionamento sperimentale LLM ha raggiunto una grande sfida di lunga data nell'intelligenza artificiale: prestazioni a livello di medaglia d'oro nella competizione matematica più prestigiosa del mondo: le Olimpiadi internazionali di matematica (IMO).
31,72K