FlashAttention is waarschijnlijk de ultieme "AI PhD" bijdrage: > jaren studeren > dingen beter begrijpen dan iedereen > low-level code op een slimmere manier herschrijven > maakt transformers 2-4x sneller > in wezen een gratis lunch > nu draait het op al onze computers