Saya telah menulis kisah lengkap tentang Attention Sinks — penyelaman mendalam teknis tentang bagaimana mekanisme tersebut dikembangkan dan bagaimana penelitian kami akhirnya digunakan dalam model OSS baru OpenAI. Bagi yang tertarik dengan detailnya:
107,46K