Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ok, ich brauche Hilfe! Ich habe am Wochenende versucht, GPT-OSS zu finetunen. Es funktioniert für ~100 Schritte, dann wirft es einen CUDA-Speicherfehler.
Ich vermute, dass gelegentlich alle Tokens zu einem einzelnen Experten geleitet werden. Dann stürzt das Training ab.
Gibt es eine einfache Lösung? Ich habe noch nie ein MoE finetuned.
😒

23,69K
Top
Ranking
Favoriten