Escrevi a história completa dos Attention Sinks — uma análise técnica aprofundada sobre como o mecanismo foi desenvolvido e como a nossa pesquisa acabou sendo utilizada nos novos modelos OSS da OpenAI. Para aqueles interessados nos detalhes:
107,46K