🎯 Baru saja merilis preprint baru yang membuktikan transfer LR di bawah μP. -> Masalahnya: Saat melatih jaringan saraf besar, salah satu pertanyaan tersulit adalah: berapa tingkat belajar yang harus saya gunakan? [1/n] 🧵 Tautan: