分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

わかりました、助けが必要です! 週末にGPT-OSSの微調整を試みました。~100ステップで動作し、CUDAメモリ不足エラーをスローします私の推測では、時々、すべてのトークンが 1 人のエキスパートにルーティングされると思います。その後、トレーニングがクラッシュします。簡単な解決策はありますか?これまでに MoE を微調整したことがありません

😒

23.69K

トップ

ランキング

お気に入り

Trending onchain

Trending on X

Recent top fundings

Most notable