熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
開始感覺這個 gpt oss 是在大約 20T 的精煉安全數據上訓練的,甚至可能是來自 o3 的 benchmaxxed 數據。似乎底下沒有基礎模型..
這是 phi 5 maxx 嗎?
等待 @karan4d 和 @repligate 的探索,哈哈

@karan4d @repligate 如果這是一個純粹的蒸餾預訓練,那麼就不可能有可以發布的“基礎模型”,因為從來就沒有過一個。
@karan4d @repligate 這個模型如果不使用它的聊天模板就根本無法運作?我從未見過在原始互聯網文本上預訓練的模型會這樣。

60.6K
熱門
排行
收藏