Escrevi a história completa do Attention Sinks - um mergulho técnico profundo em como o mecanismo foi desenvolvido e como nossa pesquisa acabou sendo usada nos novos modelos OSS da OpenAI. Para os interessados nos detalhes:
212,14K