Mulai terasa seperti oss gpt ini dilatih pada seperti 20T token aman suling, bahkan mungkin data benchmaxxed dari o3. Sepertinya tidak ada model dasar di bawahnya.. Apakah ini phi 5 maxx?
Menunggu eksplorasi @karan4d dan @repligate lol
@karan4d @repligate Jika itu adalah prapelatihan distilasi murni maka tidak mungkin ada "model dasar" untuk dirilis, karena tidak pernah ada
@karan4d @repligate Model ini benar-benar tidak dapat berfungsi jika tidak menggunakan templat obrolannya? Saya belum pernah melihatnya pada model yang telah dilatih sebelumnya pada teks internet mentah
60,6K