بدأت أشعر أن gpt oss قد تم تدريبه على رموز 20T من الآمن المقطر ، وربما حتى بيانات benchmaxxed من o3. يبدو أنه لا يوجد نموذج أساسي تحته.. هل هذا phi 5 maxx؟
في انتظار استكشافات @karan4d و @repligate لها لول
@karan4d @repligate إذا كان تدريبا مسبقا للتقطير النقي ، فلا يمكن أن يكون هناك "نموذج أساسي" للإفراج عنه ، لأنه لم يكن هناك نموذج مطلق
@karan4d @repligate النموذج غير قادر حرفيا على العمل إذا لم يكن يستخدم قالب الدردشة الخاص به؟ لقد رأيت ذلك على نموذج تم تدريبه مسبقا على نص الإنترنت الخام
‏‎60.61‏K