このgpt ossは、o3からの蒸留金庫の20Tトークン、おそらくベンチマックスデータでトレーニングされているように感じ始めました。下にベースモデルがないようです。 これはファイ5マックスですか?
@karan4dと@repligateの探検を待っています笑
@karan4d @repligate 純粋な蒸留の事前トレーニングである場合、リリースする「ベースモデル」は存在しませんでした。
@karan4d @repligate チャットテンプレートを使用しないと、モデルは文字通り機能しませんか?Ive nevrrは、生のインターネットテキストで事前トレーニングされたモデルでそれを見ました
60.6K